那些從事機(jī)器學(xué)習(xí)(ML)項(xiàng)目的人都知道ML需要大量數(shù)據(jù)來訓(xùn)練所得算法。有人會(huì)說您永遠(yuǎn)不會(huì)擁有太多數(shù)據(jù)。數(shù)據(jù)量和生成的ML模型的復(fù)雜程度之間通常存在相關(guān)性。隨著AI向新的利益池發(fā)展,同時(shí)利用更復(fù)雜的AI功能,這種數(shù)據(jù)饑渴只會(huì)變得更加強(qiáng)烈。由于人工智能的復(fù)雜性還存在其他促成的趨勢(shì),因此組織面臨的問題是:“他們是否擁有正確的數(shù)據(jù)來推動(dòng)成功的AI工作?” 如果他們沒有足夠的資源,他們是否應(yīng)該在期待AI盛宴的情況下庫(kù)存更多?
組織收集的所有大數(shù)據(jù)不可能都是正確的數(shù)據(jù),但是了解AI的去向?qū)⑹菇M織在AI的發(fā)展和未來幾十年的收集和收集更多正確數(shù)據(jù)方面具有“立足點(diǎn)”。
人工智能的進(jìn)步改變了數(shù)據(jù)游戲
雖然ML需要大量數(shù)據(jù)來自我修改其行為,但隨著AI功能復(fù)雜性的提高,AI的需求也迅速增加。從機(jī)器學(xué)習(xí)到深度學(xué)習(xí)(DL)邁出了一大步,因?yàn)镈L比ML需要更多的數(shù)據(jù)。原因是DL通常只能識(shí)別神經(jīng)網(wǎng)絡(luò)各層之間的概念差異。當(dāng)暴露給數(shù)百萬個(gè)數(shù)據(jù)點(diǎn)時(shí),DL確定概念的邊緣。DL允許機(jī)器像人的大腦一樣通過神經(jīng)網(wǎng)絡(luò)來表示概念,從而可以解決更復(fù)雜的問題。人工智能還可以解決答案更加不確定或模棱兩可的模糊問題。這些通常是判斷或識(shí)別問題,可以擴(kuò)展到創(chuàng)作或其他右腦活動(dòng)。這又需要更多數(shù)據(jù),
從數(shù)據(jù)驅(qū)動(dòng)到結(jié)果驅(qū)動(dòng)的轉(zhuǎn)變
隨著AI在其協(xié)助或解決的復(fù)雜問題中不斷發(fā)展,它將成為數(shù)據(jù)驅(qū)動(dòng)和目標(biāo)/結(jié)果驅(qū)動(dòng)的。這意味著AI可能會(huì)即時(shí)請(qǐng)求解決特定問題或進(jìn)行特定推論所需的數(shù)據(jù),從而使數(shù)據(jù)管理變得復(fù)雜。它可能涉及解決方案的歸納數(shù)據(jù)驅(qū)動(dòng)部分與基于達(dá)到目標(biāo)的假設(shè)的數(shù)據(jù)演繹需求的交互。對(duì)于面向結(jié)果的問題,需要進(jìn)行這種動(dòng)態(tài)交互。這與僅查詢數(shù)據(jù)以尋找有趣的事件和模式有很大不同。決策驅(qū)動(dòng)方法恰好適合這兩種截然不同的方法。通過將數(shù)據(jù)與結(jié)果進(jìn)行匹配,一些決策將集中在運(yùn)營(yíng)上并加以改進(jìn)。在歸納法和演繹法上都會(huì)有更多的戰(zhàn)略決策。這只是增加數(shù)據(jù)使用量的另一個(gè)需求渠道。
不斷變化的問題范圍影響數(shù)據(jù)需求
AI解決方案的范圍通常會(huì)從狹窄的領(lǐng)域開始,并隨著時(shí)間的流逝而擴(kuò)大到更大的范圍,因此需要更多數(shù)據(jù)。復(fù)雜解決方案通常針對(duì)多個(gè)答案,并且需要更多數(shù)據(jù)來支持支路解決方案集,從而導(dǎo)致復(fù)雜/混合結(jié)果。隨著決策,行動(dòng)和結(jié)果的范圍跨越組織內(nèi)部和外部的更多上下文,將需要獲取更多數(shù)據(jù)以了解每種上下文及其相互作用。這些上下文中的每一個(gè)都可能以不同的速率變化和變形,因此,需要更多的數(shù)據(jù)。
凈; 凈:
顯然,更多數(shù)據(jù)將成為AI輔助解決方案的標(biāo)志。數(shù)據(jù)需求可能來自更具挑戰(zhàn)性的問題,高級(jí)AI /分析的更好利用或端到端價(jià)值鏈的增長(zhǎng)。有一件事情是肯定的。組織最好為“ AI /數(shù)據(jù)交互”的新世界做好準(zhǔn)備。它可以更改或擴(kuò)展數(shù)據(jù)管理策略,方法,技術(shù)或技術(shù)。請(qǐng)參閱圖1,以查看交互可能性。