根據(jù)TechnologyReview 的一份報(bào)告,中國(guó)科技巨頭百度創(chuàng)造了一種向人工智能授課的新方法。與Google和Microsoft使用的新方法相比,新方法提供了更好的結(jié)果,在通用語言和理解評(píng)估(GLUE)競(jìng)爭(zhēng)中擊敗了兩家公司。
BERT和ERNIE
百度的新模型被稱為通過知識(shí)集成增強(qiáng)表示,即ERNIE。之所以以芝麻街角色命名,是因?yàn)镚oogle將前冠軍模型命名為來自Transformers或BERT的雙向編碼器表示形式。為了從Google奪冠,ERNIE在GLUE的9種不同語言測(cè)試中都跑贏了競(jìng)爭(zhēng)對(duì)手。測(cè)試AI理解上下文,專有名稱和語言其他方面的能力。人們?cè)?00分測(cè)驗(yàn)中的平均得分為87%。ERNIE的平均水平超過90%,這是有史以來的第一個(gè)AI。
BERT的革命性在于名稱的雙向部分。較早的語言模型可以在目標(biāo)單詞之前或之后使用該單詞來確定上下文。BERT可以使用一種稱為掩蔽的技術(shù)方法,使用句子中的所有單詞來解密目標(biāo)單詞,這意味著隱藏了某些單詞,而AI則嘗試使用上下文線索來預(yù)測(cè)它們。ERNIE將掩碼擴(kuò)展為字符串。這對(duì)于理解中文時(shí)至關(guān)重要,因?yàn)樵谥形闹懈鱾€(gè)字符會(huì)根據(jù)周圍的字符而改變含義,但是同樣的技術(shù)對(duì)于訓(xùn)練用英語和其他語言編寫的AI也很有用,尤其是對(duì)于非正式的言語和口語交流。
這不是ERNIE訓(xùn)練AI理解語言的唯一方法。程序中還可以進(jìn)行連續(xù)訓(xùn)練,句子順序和其他元素的訓(xùn)練,但是字符屏蔽是最重要的改進(jìn)。隨著研究人員不斷提高AI學(xué)習(xí)能力,ERNIE的統(tǒng)治可能不會(huì)持續(xù)很長(zhǎng)時(shí)間。但是,百度創(chuàng)作的概括性意義重大,并且可能會(huì)影響所有未來的AI語言培訓(xùn)系統(tǒng)。
更智能的教學(xué),更好的語音助手
百度已經(jīng)開始使用ERNIE來改善其Xiao Du AI助手對(duì)與其說話的人的反應(yīng)。更好的語言解釋引擎將對(duì)百度和任何其他開始使用它的語音助手開發(fā)人員產(chǎn)生巨大的推動(dòng)作用。了解人們?cè)谡f什么是語音助手開發(fā)人員之間競(jìng)爭(zhēng)的核心部分。這就是為什么兩家公司關(guān)注諸如Loup Ventures的語音助手智商測(cè)試之類的原因的一部分,盡管亞馬遜的Alexa正在縮小差距,但Google Assistant最近贏得了該獎(jiǎng)項(xiàng)。另一方面,Perficient最近的一份報(bào)告顯示,語音助手準(zhǔn)確回答問題的能力普遍下降。
小杜在這兩種情況下均未經(jīng)過測(cè)試,因此無法將中國(guó)語音助手與美國(guó)競(jìng)爭(zhēng)對(duì)手進(jìn)行直接比較。更好的語言學(xué)習(xí)引擎的額外優(yōu)勢(shì)可能會(huì)在不久的將來為百度帶來優(yōu)勢(shì),盡管百度在全球范圍內(nèi)的存在已在迅速上升。一年之內(nèi),它從一小部分智能揚(yáng)聲器發(fā)展成為全球第二大銷售商和中國(guó)第一大銷售商,并擁有超過4億臺(tái)設(shè)備的助手。