越來(lái)越強(qiáng)大的硬件功能和大量數(shù)據(jù)使現(xiàn)有的機(jī)器學(xué)習(xí)方法(例如模式識(shí)別,自然語(yǔ)言處理和強(qiáng)化學(xué)習(xí))成為可能。人工智能正在影響開(kāi)發(fā)過(guò)程;它增加了版本控制,CI / CD和測(cè)試之類(lèi)的復(fù)雜性。
ThoughtWorks人工智能全球負(fù)責(zé)人Christoph Windheuser在Goto Berlin 2018上談到了該行業(yè)的AI應(yīng)用。InfoQ將通過(guò)問(wèn)答,摘要和文章涵蓋本次會(huì)議。
Windheuser認(rèn)為,機(jī)器學(xué)習(xí)方法的最大優(yōu)點(diǎn)是可以通過(guò)從數(shù)據(jù)中學(xué)習(xí)而不是編程來(lái)優(yōu)化算法的行為。這意味著算法可以實(shí)現(xiàn)無(wú)法編程的行為,例如光學(xué)和聲學(xué)模式識(shí)別或自然語(yǔ)言處理。他說(shuō),因此,全新的應(yīng)用成為可能,而可能性是無(wú)限的。
Windheuser表示,在數(shù)據(jù)科學(xué)和機(jī)器學(xué)習(xí)項(xiàng)目中,開(kāi)發(fā)人員不僅必須照顧自己的編程代碼,而且還必須照顧大量數(shù)據(jù),例如訓(xùn)練模式,從這些模式中提取的功能以及參數(shù)和超參數(shù)。學(xué)習(xí)算法。他認(rèn)為,這給開(kāi)發(fā)過(guò)程帶來(lái)了新的復(fù)雜性。
隨著當(dāng)今硬件功能的不斷增強(qiáng)和可用數(shù)據(jù)的大量增加,古老而著名的機(jī)器學(xué)習(xí)方法可以突然以可擴(kuò)展和可操作的方式應(yīng)用。各種模式識(shí)別,例如語(yǔ)音識(shí)別和圖像識(shí)別。在自然語(yǔ)言處理領(lǐng)域,諸如語(yǔ)言翻譯,情感分析,意圖識(shí)別,文本語(yǔ)音轉(zhuǎn)換和聊天機(jī)器人等都是眾所周知的。通過(guò)強(qiáng)化學(xué)習(xí),甚至可以學(xué)習(xí)玩電子游戲,下棋或圍棋或平穩(wěn)安全地駕駛汽車(chē)的策略。沒(méi)有機(jī)器學(xué)習(xí)方法,所有這些都是不可能的。
數(shù)據(jù)是任何機(jī)器學(xué)習(xí)算法的基礎(chǔ)。對(duì)于像反向傳播這樣的有監(jiān)督學(xué)習(xí),您需要的訓(xùn)練模式數(shù)量要遠(yuǎn)遠(yuǎn)多于要優(yōu)化的參數(shù)(權(quán)重)以實(shí)現(xiàn)網(wǎng)絡(luò)的良好泛化。對(duì)于深度學(xué)習(xí)模型,其中的層數(shù)很高,每層單元數(shù)很多,參數(shù)的數(shù)量很容易變成數(shù)百萬(wàn)個(gè),這需要更大數(shù)量的訓(xùn)練模式才能成功進(jìn)行訓(xùn)練。
對(duì)于有監(jiān)督的學(xué)習(xí),訓(xùn)練模式需要標(biāo)簽(例如,該模式的正確分類(lèi)),通常必須手動(dòng)策劃。除此之外,還必須將數(shù)據(jù)模式轉(zhuǎn)換為正確的格式,以便通過(guò)學(xué)習(xí)算法進(jìn)行消化。這意味著必須從訓(xùn)練數(shù)據(jù)中提取正確的特征。這對(duì)于獲得良好的訓(xùn)練算法非常重要。
例如,如果您想了解未來(lái)客戶對(duì)雜貨店中商品的需求,則可以使用歷史銷(xiāo)售數(shù)據(jù)來(lái)預(yù)測(cè)未來(lái)的銷(xiāo)售。您可以直接使用POS(銷(xiāo)售點(diǎn))數(shù)據(jù)來(lái)訓(xùn)練您的網(wǎng)絡(luò)。但是,例如從POS數(shù)據(jù)中的時(shí)間戳中提取工作日并將其作為附加功能饋入網(wǎng)絡(luò)非常有幫助。由于客戶需求高度依賴(lài)工作日,因此這將有助于網(wǎng)絡(luò)更輕松,更快速地學(xué)習(xí)和融合。