在紐約的Strata + Hadoop World會(huì)議上,微軟通過(guò)在HDInsight中宣布Apache Storm的支持來(lái)升級(jí)其云分析游戲,HDInsight是該公司基于云的Hadoop發(fā)行版,Hadoop是流行的開(kāi)源大數(shù)據(jù)處理平臺(tái)。公司副總裁TK Rengarajan宣布:“今天將提供預(yù)覽,我們將在HDInsight中支持Apache Storm,使我們的客戶(hù)可以使用完全托管的Hadoop服務(wù)從其物聯(lián)網(wǎng)設(shè)備近乎實(shí)時(shí)地處理數(shù)百萬(wàn)個(gè)Hadoop數(shù)據(jù)。”微軟數(shù)據(jù)平臺(tái)總裁在10月15日的聲明中。“通過(guò)將實(shí)時(shí)分析功能引入HDInsight,我們正在開(kāi)拓新的客戶(hù)場(chǎng)景,例如能夠?qū)崟r(shí)分析運(yùn)營(yíng)數(shù)據(jù)以進(jìn)行預(yù)測(cè)性維護(hù)。”
Apache Storm是一個(gè)開(kāi)源項(xiàng)目,可以實(shí)時(shí)處理大型數(shù)據(jù)流。Microsoft 在其支持文檔中將該技術(shù)描述為“允許您實(shí)時(shí)處理數(shù)據(jù)的分布式,容錯(cuò),開(kāi)源計(jì)算系統(tǒng)。Storm解決方案還可以提供有保證的數(shù)據(jù)處理,并具有重放數(shù)據(jù)的能力。第一次未成功處理。”
根據(jù)Apache Software Foundation的說(shuō)法,Storm做到了“實(shí)時(shí)處理,而Hadoop進(jìn)行了批處理。” Twitter,Spotify和阿里巴巴等公司目前正使用Storm來(lái)幫助滿(mǎn)足其大規(guī)模數(shù)據(jù)處理要求。
隨著今天的宣布,微軟已經(jīng)加入了潮流。Rengarajan表示:“ HDInsight中Storm的預(yù)覽版將繼續(xù)微軟對(duì)Hadoop生態(tài)系統(tǒng)和HDInsight的投資。”
HDInsight Storm可以作為Azure中的托管群集使用,可以將其集成到其他Azure服務(wù)中。微軟解釋說(shuō):“例如,Storm可能會(huì)使用ServiceBus隊(duì)列或事件中心等服務(wù)中的數(shù)據(jù),并使用網(wǎng)站或云服務(wù)來(lái)提供數(shù)據(jù)可視化。”
除了實(shí)現(xiàn)實(shí)時(shí)大數(shù)據(jù)分析之外,Microsoft預(yù)計(jì)客戶(hù)還將利用HDInsight Storm來(lái)支持其在線機(jī)器學(xué)習(xí)工作。
根據(jù)HDInsight Storm常見(jiàn)問(wèn)題解答,“風(fēng)暴可以與以前通過(guò)批處理進(jìn)行過(guò)訓(xùn)練的機(jī)器學(xué)習(xí)解決方案一起使用,例如基于Mahout的解決方案,” Apache的機(jī)器學(xué)習(xí)和數(shù)據(jù)挖掘項(xiàng)目。“然而,其通用的分布式計(jì)算模型也為基于流的機(jī)器學(xué)習(xí)解決方案打開(kāi)了大門(mén)。”
Azure HDInsight Storm支持.NET,Java和Python。Microsoft承認(rèn),盡管Storm支持其他語(yǔ)言(根據(jù)Apache進(jìn)行的任何編程),但要啟用其他編程支持將需要更改HDInsight群集配置。
在相關(guān)新聞中,微軟透露,Hadoop供應(yīng)商Hortonworks的大數(shù)據(jù)軟件平臺(tái)將具有Microsoft Azure集成功能。該公司的Azure機(jī)器學(xué)習(xí)生態(tài)系統(tǒng)還新增了一些新功能,包括推薦引擎,異常檢測(cè)服務(wù)和一批R程序包(數(shù)據(jù)科學(xué)家首選的編程語(yǔ)言)。
Rengarajan表示:“這些公告以及我們參與[Strata + Hadoop World]活動(dòng)是我們致力于通過(guò)利用云的功能,靈活性和規(guī)模將大數(shù)據(jù)帶給所有人的承諾的一部分。”