谷歌大數(shù)據(jù)服務(wù)家族又添新成員:云Dataproc

谷歌大數(shù)據(jù)服務(wù)家族又添新成員:云Dataproc

2015年9月28日,谷歌云平臺(tái)的大數(shù)據(jù)服務(wù)家族又添加了一位新成員——云Dataproc。據(jù)悉,目前全新的谷歌云Dataproc服務(wù)還處于測(cè)試版階段,它能夠直接在虛擬機(jī)和一個(gè)類似云數(shù)據(jù)流的完全托管服務(wù)中,管理數(shù)據(jù)處理引擎或Hadoop框架,也可以讓用戶在谷歌平臺(tái)安排自己的數(shù)據(jù)管道。

谷歌云平臺(tái)服務(wù)的高管告訴我們,Dataproc用戶可以在90秒內(nèi)旋轉(zhuǎn)一個(gè)Hadoop集群,這個(gè)速度明顯快于其他服務(wù)。谷歌對(duì)于集群中每個(gè)虛擬CPU每小時(shí)僅收取1美分。這是通常運(yùn)行虛擬機(jī)和數(shù)據(jù)存儲(chǔ)的最高成本。但正如谷歌高管所說(shuō),用戶可以添加谷歌低搶占式實(shí)例集群來(lái)降低預(yù)計(jì)成本。

由于Dataproc可以快速旋轉(zhuǎn)集群,所以用戶能夠在需要的時(shí)候建立特別的集群,因?yàn)樗鞘艿酵泄艿?,谷歌將?huì)對(duì)其進(jìn)行管理。

谷歌高管表示:“在這個(gè)空間里,一個(gè)適合所有人的標(biāo)準(zhǔn)是不存在的。我們認(rèn)為這將是對(duì)整體投資組合的一個(gè)非常重要的補(bǔ)充?!?/p>

因?yàn)檫@種服務(wù)使用的是標(biāo)準(zhǔn)的Spark和Hadoop發(fā)行版,其中有一些小調(diào)整,它能兼容幾乎所有現(xiàn)有的Hadoop-based的產(chǎn)品,用戶可以輕松地運(yùn)用谷歌的新服務(wù),并減少現(xiàn)有的工作量。

谷歌云平臺(tái)高管和谷歌大數(shù)據(jù)產(chǎn)品經(jīng)理James Malone告訴我們:谷歌之所以能夠保證服務(wù)的速度,不僅是因?yàn)槟切┚W(wǎng)絡(luò)基礎(chǔ)設(shè)施,還因?yàn)樵诮?yōu)化的圖像后成功修復(fù)了幾個(gè)Spark問(wèn)題。

谷歌云平臺(tái)高管表示,有些人只是想要完全控制他的數(shù)據(jù)管道和處理架構(gòu),由此可能想要運(yùn)行和管理自己的虛擬機(jī)。在他看來(lái),與自己安裝基礎(chǔ)設(shè)施相比,用戶應(yīng)當(dāng)選擇Dataproc而不需要做任何實(shí)際權(quán)衡。

此外,Dataproc還集成了谷歌其他的云服務(wù),包括BigQuery, Cloud Storage, Cloud Bigtable, Cloud Logging和Cloud Monitoring等。