去年,我參加了GigaOm的Structure Data會(huì)議,這次會(huì)議的主題是關(guān)于Hadoop,大數(shù)據(jù)和非結(jié)構(gòu)化數(shù)據(jù)的承諾,這對(duì)于標(biāo)題為“ structure”的事件而言具有諷刺意味。今年的活動(dòng)(3月19日至20日)更多地涉及可交付成果,包括案例研究,用戶體驗(yàn)以及對(duì)大數(shù)據(jù)大計(jì)劃的實(shí)際期望范圍。從承諾到現(xiàn)實(shí)的轉(zhuǎn)變值得歡迎。這是活動(dòng)第一天以來我的五個(gè)最佳收獲。
1.大數(shù)據(jù)和Hadoop類型的基礎(chǔ)架構(gòu)的部署既涉及技術(shù),也涉及流程。關(guān)于客戶的大數(shù)據(jù)湖填充大量數(shù)據(jù),然后試圖弄清楚該如何處理,“ H腳”只是one語。這個(gè)詞來自前火箭科學(xué)家,現(xiàn)在是特納廣播公司分析師高管科林·科爾曼。
他指的是建立基于Hadoop的數(shù)據(jù)基礎(chǔ)結(jié)構(gòu)然后將所有形式的數(shù)據(jù)轉(zhuǎn)儲(chǔ)到系統(tǒng)中的誘惑,而沒有大量計(jì)劃是否需要數(shù)據(jù),如何提取需要的內(nèi)容以及提取數(shù)據(jù)后如何分析數(shù)據(jù)。
過去的商業(yè)智能技術(shù)專家應(yīng)注意:急需人才,而不僅僅是在您學(xué)習(xí)交易的平臺(tái)上。更好的案例研究是圍繞開發(fā)人員獲得自上而下的批準(zhǔn)來重新考慮其公司如何使用數(shù)據(jù)和數(shù)據(jù)的方法,其中包括來自MetLife的一項(xiàng)引人注目的隱私保護(hù)計(jì)劃,以及福特計(jì)劃使用開源使開發(fā)人員根據(jù)大量汽車數(shù)據(jù)創(chuàng)建新應(yīng)用程序。然后獲得在通常的新產(chǎn)品規(guī)限之外進(jìn)行操作的自由。
2. Hadoop仍然不是那么容易實(shí)現(xiàn)。在與MetaScale的討論中以及在Alpine Data Labs的演示中,重點(diǎn)是采取(或至少掩蓋了復(fù)雜性)并使非結(jié)構(gòu)化數(shù)據(jù)更容易由需要答案的業(yè)務(wù)主管來積累,集成和查詢。
不幸的是,Hadoop獲得了可以滿足您所有數(shù)據(jù)需求的神奇術(shù)語的光環(huán)。今年很明顯,Hadoop及其相關(guān)模塊正在迅速發(fā)展成為一個(gè)平臺(tái),該平臺(tái)對(duì)客戶具有很大的吸引力,但仍然需要平臺(tái)在企業(yè)中成功運(yùn)行所需的屬性。
安全性,易于學(xué)習(xí)的工具以及與現(xiàn)有公司系統(tǒng)的掛鉤都在不斷發(fā)展,但目前還沒有完全成熟。Alpine Data Labs產(chǎn)品副總裁Steve Hillion表示:“ [Hadoop]將脫離科學(xué)項(xiàng)目領(lǐng)域,并開始產(chǎn)生切實(shí)可行的有價(jià)值的見解和分析。