谷歌母公司Alphabet旗下的DeepMind過去一年損失總額達(dá)5.72億美元。作為全球規(guī)模最大的人工智能學(xué)術(shù)研究機(jī)構(gòu)之一,DeepMind在過去三年中始終虧損,累計(jì)金額已超10億美元。在未來12個月內(nèi),DeepMind還需要繼續(xù)投入超過10億美元。
這是否意味著AI技術(shù)正在走向崩潰?
這不一定。研究活動本來就相當(dāng)燒錢,與一系列最頂尖的科學(xué)項(xiàng)目相比,DeepMind的支出只能算是“九牛一毛”。歐洲的大型強(qiáng)子對撞機(jī)項(xiàng)目每年光是維護(hù)成本就高達(dá)10億美元,最終發(fā)現(xiàn)希格斯玻色子的總成本估計(jì)將超過100億美元。而且,人們印象中的真正人工智能(也被稱為人工通用智能,簡稱AGI)這類既能玩轉(zhuǎn)《星際迷航》、又能聽懂人類表達(dá)的重量級成果,開出的價(jià)碼也絕對不會便宜。
即便如此,DeepMind逐年上升的虧損水平仍然值得關(guān)注:2016年,DeepMind虧損額為1.54億美元;2017年增長至3.41億美元;2018年則進(jìn)一步提升至5.72億美元。在筆者看來,這其中包含著三大核心問題:
DeepMind是否找到了正確的科學(xué)探索方向?
從Alphabet的角度來看,這樣的投入規(guī)模是否合理?
如此可觀的虧損數(shù)字,又會給整個AI市場帶來怎樣的影響?
首先來看探索方向的問題。之所以值得討論,是因?yàn)镈eepMind明顯是把雞蛋都放進(jìn)了同一個籃子——也就是深度強(qiáng)化學(xué)習(xí)。這項(xiàng)技術(shù)主要用于通過模型識別將深度學(xué)習(xí)與強(qiáng)化學(xué)習(xí)加以結(jié)合,基于獎勵信號實(shí)現(xiàn)學(xué)習(xí)能力,從而使系統(tǒng)學(xué)會如何在游戲中獲得更高分?jǐn)?shù)、或者在象棋等游戲中對抗求勝。
DeepMind的成名之作是2013年發(fā)表的一篇論文。這篇令人振奮的成果闡述了如何對單一神經(jīng)網(wǎng)絡(luò)系統(tǒng)進(jìn)行訓(xùn)練,以教會其游玩多款雅達(dá)利游戲(包括〈突圍〉以及〈太空入侵者〉),并最終獲得近似甚至超越人類的成績。這篇論文讓DeepMind成了AI領(lǐng)域的搖滾巨星,并成功引起谷歌方面的注意。在2014年1月被谷歌收購之后,DeepMind進(jìn)一步推動技術(shù)開發(fā),先后在圍棋以及不朽神作《星際爭霸》游戲中接連取得勝利。
但問題在于,這項(xiàng)技術(shù)對環(huán)境有著非常具體甚至可以說是苛刻的要求。例如在游玩《突圍》時(shí),哪怕是一丁點(diǎn)微小的變化,例如將鏡頭對焦位置移動幾個像素點(diǎn),其性能都會受到巨大影響。DeepMind的《星際爭霸》系統(tǒng)同樣局限性明顯:在同一地圖內(nèi)使用同一種族進(jìn)行對戰(zhàn),其成功確實(shí)足以超越人類;但在其它地圖使用另一種族時(shí),成績就會快速下滑。要轉(zhuǎn)換作戰(zhàn)風(fēng)格,我們必須從頭開始重新進(jìn)行系統(tǒng)訓(xùn)練。
從某種程度上講,深度強(qiáng)化學(xué)習(xí)是一種經(jīng)過增強(qiáng)的記憶系統(tǒng);它在某些場景中確實(shí)擁有良好表現(xiàn),但對工作內(nèi)容的理解程度卻非常有限。因此,這類系統(tǒng)沒什么靈活性可言,無法即時(shí)根據(jù)環(huán)境變化做出調(diào)整,并最終導(dǎo)致極微小的變化都會顯著影響實(shí)際性能。(DeepMind最近公布的腎病檢查方案,也因?yàn)轭愃频膯栴}而遭到質(zhì)疑。)
深度強(qiáng)化學(xué)習(xí)同時(shí)需要大量數(shù)據(jù)作為支持——例如在學(xué)習(xí)圍棋時(shí),需要完成數(shù)百萬盤自我對局才能掌握個人奧妙。很明顯,人類棋手不需要也不可能完成如此龐大的訓(xùn)練量,而且這樣的過程難度極高且成本極巨,只有谷歌這樣的科技巨頭才能負(fù)擔(dān)得起恐怖的計(jì)算資源需求。換言之,絕大多數(shù)企業(yè)與客戶根本不可能在自己孱弱的獨(dú)立計(jì)算機(jī)上實(shí)現(xiàn)類似的現(xiàn)實(shí)問題解決能力。根據(jù)估算,AphaGo的整個訓(xùn)練周期耗資達(dá)3500萬美元,其消耗的能量足以支持12760個人連續(xù)三天不停進(jìn)行腦力勞動。
以上討論的只是經(jīng)濟(jì)問題。更重要的是,正如Ernest Davis和筆者在即將出版的《Robboting AI》一書中提到,我們能否信任現(xiàn)有AI方案。目前,深度強(qiáng)化學(xué)習(xí)只能在良好可控的環(huán)境下提供可靠的結(jié)果;這樣的局限對于圍棋這種兩千年來沒怎么發(fā)生變化的場景非常適用,但我們顯然不敢貿(mào)然把它引入到其它現(xiàn)實(shí)問題當(dāng)中。
>>> 難以實(shí)現(xiàn)商業(yè)應(yīng)用
之所以難以商業(yè)應(yīng)用,主要是因?yàn)槟壳按蠖鄶?shù)實(shí)際問題都不像游戲那樣擁有嚴(yán)格的場景與條件。也正因?yàn)槿绱?,DeepMind目前仍拿不出比較像樣的深度強(qiáng)化學(xué)習(xí)商業(yè)方案。與此同時(shí),Alphabet已經(jīng)在DeepMind身上燒掉了約20億美元(包括2014年收購DeepMind的6.5億美元)。但除了賺到的好名聲之外,DeepMind在過去一年中只帶來了約1.25億美元的實(shí)際收入,其中相當(dāng)一部分為Alphabet內(nèi)部利用深度強(qiáng)化學(xué)習(xí)技術(shù)降低冷卻成本省下的電費(fèi)。
而且在圍棋領(lǐng)域大顯身手的技能,也很難解決其它挑戰(zhàn)性問題——例如癌癥與清潔能源。這類狀況早已有之:IBM公司的Watson曾在問答節(jié)目當(dāng)中一鳴驚人,但卻一直無法成功進(jìn)軍醫(yī)學(xué)診斷領(lǐng)域。雖能夠在某些病例中提供良好表現(xiàn),但Watson在另一些病例中卻慘遭失敗,甚至還曾經(jīng)在心臟病發(fā)作癥狀的判斷上犯錯——要知道,這可是醫(yī)學(xué)新生都能準(zhǔn)確判斷的病癥。
當(dāng)然,時(shí)間也許能夠解決這個難題。至少自2013年以來,DeepMind就一直在努力研究深度強(qiáng)化學(xué)習(xí)技術(shù),而且科技進(jìn)步也向來難以快速轉(zhuǎn)化為實(shí)際產(chǎn)品。DeepMind以及其它研究機(jī)構(gòu),最終也許能夠找到一種可行的方式,促進(jìn)深度強(qiáng)化學(xué)習(xí)帶來更穩(wěn)定也更契合任務(wù)內(nèi)容的結(jié)果;又或者,這項(xiàng)技術(shù)未來能夠與其它技術(shù)結(jié)合起來,迸發(fā)出新的能量。也許深度強(qiáng)化學(xué)習(xí)最終能夠像當(dāng)年的晶體管一樣,成為一種徹底改變世界的實(shí)驗(yàn)室發(fā)明,也有可能永遠(yuǎn)停留在探索階段,僅僅作為人類不斷探索真理的道路上的又一塊鋪路石。但無論如何,筆者個人猜測最終結(jié)果可能介于這兩者之間——有用而且廣泛存在,但又不足以改變整個世界。
雖然DeepMind目前的成果沒能完全符合人們的期待,相信也不會有人對其妄加指摘。深度強(qiáng)化學(xué)習(xí)不一定是通往人工通用智能的正確道路,但這絲毫不妨礙DeepMind自身的偉大——這仍是一個運(yùn)營嚴(yán)密、資金充裕而且人才濟(jì)濟(jì)的機(jī)構(gòu)。而且如果接下來AI的發(fā)展方向有所變化,DeepMind也一定會是能夠迅速抓住機(jī)會的參與者之一。就目前來看,能夠與DeepMind相抗衡的研究機(jī)構(gòu)仍然屈指可數(shù)。與此同時(shí),Alphabet也是一家財(cái)力雄厚的企業(yè),對他們來說一年5億美元也不是啥大問題。Alphabet公司曾非常英明地決定投資AI技術(shù),其中包括目前同樣在快速成長的Google Brain項(xiàng)目。Alphabet方面可能會通過多種途徑調(diào)整自家AI方案的組合方式,不過考慮到這是一家年收入高達(dá)1000億美元的行業(yè)巨頭,而且旗下搜索服務(wù)及廣告推薦等大部分業(yè)務(wù)都依賴于AI技術(shù),相信他們有能力也有理由繼續(xù)支持這些重量級研發(fā)項(xiàng)目。
>>> 過度炒作難題
關(guān)于最后一個問題,我們目前還很難判斷DeepMind的經(jīng)濟(jì)狀況會給整個AI市場帶來怎樣的影響。如果交付的成果完全跟不上當(dāng)初的炒作宣傳,那么“人工智能寒冬”也許終將來臨,甚至導(dǎo)致原本的支持者失去信心而停止投入。另外,如果DeepMind在未來幾年中的虧損額繼續(xù)一路飆升,恐怕Alphabet自己也有可能被迫退出。畢竟到目前為止,DeepMind還是拿不出像樣的財(cái)報(bào)數(shù)據(jù),時(shí)間久了投資者難免要重新思考自己對于AI技術(shù)抱持的立場。
同樣麻煩纏身的,遠(yuǎn)不只是DeepMind。無論是無人駕駛汽車還是能夠順暢理解人類語言的聊天機(jī)器人,這些幾年前被炒得火熱的概念至今仍然沒有實(shí)現(xiàn)。Mark Zuckerberg在2018年4月的美國國會聽證會上曾保證,虛假新聞問題很快就會在AI技術(shù)面前土崩瓦解。但是情況顯然沒這么簡單,這也使得整個社會對于AI技術(shù)的看法變得愈發(fā)保守——不信承諾,信“療效”。
至少就當(dāng)下看,人工通用智能還只是個目標(biāo),距離真正落地還有很長的路。雖然AI技術(shù)在廣告及語音識別等一部分領(lǐng)域取得良好進(jìn)展,但必須承認(rèn),AI發(fā)展還遠(yuǎn)稱不上成熟。但在另一方面,我們也要認(rèn)可AI在大數(shù)據(jù)分析領(lǐng)域的強(qiáng)大能力;而且哪怕只是當(dāng)前的水平,AI也已經(jīng)是一種卓越的技術(shù)工具。因此即使未來企業(yè)不再傾力投入,AI的研究與發(fā)展也絕對不會沉寂下去。
>>> 預(yù)測未來
在筆者看來,十年之后我們可能會得出結(jié)論,發(fā)現(xiàn)深度強(qiáng)化學(xué)習(xí)的意義其實(shí)被高估了。這也使得其它不少真正重要的研究方向遭到忽視。畢竟在強(qiáng)化學(xué)習(xí)領(lǐng)域投入的第一塊錢,都代表著其它研發(fā)經(jīng)費(fèi)的縮減——例如對于人類認(rèn)知科學(xué)的研究。當(dāng)下,很多機(jī)器學(xué)習(xí)研究人員都在問,“機(jī)器如何利用大量數(shù)據(jù)優(yōu)化復(fù)雜問題?”但我們真正應(yīng)該關(guān)心的,其實(shí)是“為什么孩子們用不著那么多數(shù)據(jù)和那么復(fù)雜的處理流程,就能掌握自然語言并理解現(xiàn)實(shí)世界?”如果我們能在后一個問題上多花點(diǎn)時(shí)間、資金和精力,也許人工通用智能的來臨還能更早一些。