大數(shù)據(jù)是指不能在一定時間范圍內(nèi)使用常規(guī)軟件工具捕捉、管理和處理的數(shù)據(jù)集合,它是大量、高增長率和多樣化的信息資產(chǎn),需要新的處理模式來增強決策力、洞察力和流程優(yōu)化能力。
大數(shù)據(jù)”這個詞現(xiàn)在出現(xiàn)得很頻繁,每個人都說現(xiàn)在是大數(shù)據(jù)時代,那么你知道大數(shù)據(jù)到底是什么意思嗎?以下小編就來給大家講講。
詳細內(nèi)容
01
IT行業(yè)術(shù)語,指的是一組數(shù)據(jù),這些數(shù)據(jù)不能用常規(guī)的軟件工具在一定時間范圍內(nèi)捕獲、管理和處理,它們都是大量、高增長率和多樣化的信息資產(chǎn),需要新的處理模式,以獲得更強的決策力、洞察力和流程優(yōu)化能力。《大數(shù)據(jù)時代》是由維克多·邁爾-舍恩伯格和肯尼斯·庫克耶編寫,使用了所有數(shù)據(jù)進行分析處理,但使用的是不用隨機分析方法(抽樣)。5個大數(shù)據(jù)特征(IBM提出):Volume(大量)、Velocity(高速)、Variety(多樣化)、Value(低價值密度)、Veracity(真實)。
02
McKinseyGlobalInstitute給出了這樣一個定義:一個數(shù)據(jù)集,其規(guī)模之大,在獲取、存儲、管理和分析方面遠遠超過了傳統(tǒng)數(shù)據(jù)庫軟件工具的能力,它有四個特點:海量數(shù)據(jù)規(guī)模,快速的數(shù)據(jù)流動,多樣化的數(shù)據(jù)類型,低價值密度。
03
大數(shù)據(jù)的戰(zhàn)略意義并不在于獲取大量的數(shù)據(jù)信息,而是要對這些有意義的數(shù)據(jù)進行專門的處理。換句話說,如果把大數(shù)據(jù)比作一個行業(yè),那么這個行業(yè)贏利的關(guān)鍵,就在于提高它對數(shù)據(jù)的“處理能力”,通過“處理”來實現(xiàn)數(shù)據(jù)的“增值”。從技術(shù)上看,大數(shù)據(jù)與云計算的關(guān)系就像一枚硬幣的正反面一樣密不可分。海量數(shù)據(jù)不可能在單一的計算機上處理,因此必須采用分布式架構(gòu)。它的特色在于對海量數(shù)據(jù)進行分布式數(shù)據(jù)挖掘。但它必須依托云計算的分布式處理、分布式數(shù)據(jù)庫和云存儲、虛擬化技術(shù)。
04
伴隨著云計算時代的到來,大數(shù)據(jù)(Bigdata)也越來越受到人們的關(guān)注。分析小組認為,大數(shù)據(jù)(Bigdata)通常被用來描述一家公司生成的大量非結(jié)構(gòu)化和半結(jié)構(gòu)化數(shù)據(jù),這些數(shù)據(jù)在下載到關(guān)系數(shù)據(jù)庫進行分析時會花費大量的時間和金錢。大數(shù)據(jù)分析通常與云計算相關(guān)聯(lián),因為實時的大數(shù)據(jù)集分析需要類似于MapReduce的框架來將工作分配給幾十、幾百甚至幾千臺計算機。大數(shù)據(jù)需要特殊的技術(shù),以有效地處理大量的容忍經(jīng)過時間內(nèi)的數(shù)據(jù)。適合大數(shù)據(jù)的技術(shù),包括大規(guī)模并行處理數(shù)據(jù)庫,數(shù)據(jù)挖掘,分布式文件系統(tǒng),分布式數(shù)據(jù)庫,云計算平臺,因特網(wǎng)和可擴展存儲系統(tǒng)等。最低的基本單位是bit,并按順序列出:bit,Byte,KB,MB,GB,TB,PB,EB,ZB,YB,BB,NB,DB。
05
大數(shù)據(jù)包括結(jié)構(gòu)性、半結(jié)構(gòu)性和非結(jié)構(gòu)性數(shù)據(jù),非結(jié)構(gòu)性數(shù)據(jù)日益成為數(shù)據(jù)的重要組成部分。據(jù)IDC的調(diào)查報告顯示:企業(yè)中80%的數(shù)據(jù)都是非結(jié)構(gòu)化數(shù)據(jù),這些數(shù)據(jù)每年都按指數(shù)增長60%。大數(shù)據(jù)只是因特網(wǎng)發(fā)展到今天這個階段的一個表現(xiàn)和特點,沒有必要對它進行神話,也沒有必要對它保持敬畏,在以云計算為代表的技術(shù)創(chuàng)新的大幕的映襯下,這些原本看起來難以收集和使用的數(shù)據(jù)開始被輕易地使用,并且,通過各行各業(yè)的不斷創(chuàng)新,大數(shù)據(jù)將逐漸為人類創(chuàng)造更多的價值。
06
當(dāng)今社會是一個高速發(fā)展的社會,科技發(fā)達,信息流通,人與人之間的交流更加緊密,生活更加便利,大數(shù)據(jù)是這個高科技時代的產(chǎn)物。阿里巴巴創(chuàng)辦人馬云來臺演講中就提到,未來的時代將不是IT時代,而是DT的時代,DT就是DataTechnology數(shù)據(jù)科技,顯示大數(shù)據(jù)對于阿里巴巴集團來說舉足輕重。有些人將數(shù)據(jù)比作蘊藏著能量的煤礦。煤炭按照性質(zhì)有焦煤、無煙煤、肥煤、貧煤等分類,而露天煤礦、深山煤礦的挖掘成本又不一樣。與此類似,大數(shù)據(jù)并不在“大”,而在于“有用”。價值含量、挖掘成本比數(shù)量更為重要。對許多行業(yè)來說,如何使用這些海量數(shù)據(jù)是企業(yè)贏得競爭的關(guān)鍵。