斯圖爾特·拉塞爾(Stuart Russell)是AI的真正開拓者之一,數(shù)十年來一直處于該領(lǐng)域的最前沿。他的專業(yè)知識(shí)和前瞻性思想在他的最新作品《人類兼容:人工智能與控制問題》中達(dá)到了高潮。書是一塊基石,沿著超級(jí)智能和生命3.0,即闡明了文明的尺度問題,我們面臨著人類的目標(biāo)和價(jià)值觀對(duì)準(zhǔn)機(jī)器智能的。這不僅是對(duì)AI對(duì)齊問題的進(jìn)一步闡述和發(fā)展,而且Stuart還提出了一種新穎的解決方案,使我們可以更好地理解創(chuàng)建有益的機(jī)器智能所需要的東西。
“我認(rèn)為大約在2013年,確實(shí)讓我感到震驚的是,實(shí)際上我們一直在以錯(cuò)誤的方式思考AI。我們建立整個(gè)領(lǐng)域的方式基本上是一種人類智慧的復(fù)制品,因?yàn)槿绻祟惖男袆?dòng)達(dá)到了目標(biāo),那么人類就是聰明的。因此,如果機(jī)器的動(dòng)作實(shí)現(xiàn)了目標(biāo),則該機(jī)器應(yīng)該是智能的。然后,我們當(dāng)然必須以獎(jiǎng)勵(lì)函數(shù)或成本函數(shù)或邏輯目標(biāo)陳述的形式提供目標(biāo)。這一點(diǎn)可行。當(dāng)機(jī)器很笨時(shí),它可以工作。而且,如果您提供了錯(cuò)誤的目標(biāo),則可以重置它們并修復(fù)目標(biāo),并希望這次機(jī)器所做的工作實(shí)際上對(duì)您有所幫助。但是如果機(jī)器比人類更智能,那么給他們錯(cuò)誤的目標(biāo),基本上就是在人類和機(jī)器之間建立起國際象棋比賽,而該機(jī)器的目標(biāo)卻與我們自己的目標(biāo)相違背。而且我們不會(huì)贏得那場(chǎng)象棋比賽。”
“因此,當(dāng)一個(gè)人給另一個(gè)人一個(gè)目標(biāo)時(shí),很顯然這不是唯一的人生使命。因此,您要求某人取咖啡,這并不意味著不惜一切代價(jià)取咖啡??傮w而言,這只是意味著我寧愿喝咖啡,但要知道,不要?dú)⑷魏稳藖砗瓤Х取2灰蹇瘴业你y行帳戶來喝咖啡。不要在沙漠上跋涉300英里以獲得咖啡。在AI的標(biāo)準(zhǔn)模型中,機(jī)器對(duì)此一無所知。它只具有目標(biāo),這是生活中唯一的目的。更一般的模型是機(jī)器了解人的內(nèi)部具有某種整體的偏好結(jié)構(gòu),這個(gè)特定的目標(biāo)用來取咖啡或帶我去機(jī)場(chǎng)只是一個(gè)局部的體現(xiàn)。機(jī)器的目的應(yīng)該是幫助人們以最佳的方式實(shí)現(xiàn)他們的整體偏好結(jié)構(gòu)。如果目前碰巧包括喝杯咖啡,那就太好了,或者帶他去了機(jī)場(chǎng)。但是,機(jī)器始終知道并且不完全了解這種更大的首選項(xiàng)結(jié)構(gòu)。一種思考的方式是說AI的標(biāo)準(zhǔn)模型假設(shè)機(jī)器對(duì)目標(biāo)具有完備的知識(shí),而我提出的模型則假設(shè)該模型對(duì)目標(biāo)具有不完善的知識(shí)或?qū)δ繕?biāo)的部分知識(shí)。因此,這絕對(duì)是更一般的情況。”
“目標(biāo)是重新定位AI領(lǐng)域,以便將來我們使用與標(biāo)準(zhǔn)模型不一樣的風(fēng)險(xiǎn)來構(gòu)建系統(tǒng)……這就是我認(rèn)為對(duì)于AI社區(qū)來說,這是我們存在的第一步。結(jié)束,我們需要繼續(xù)采用這種其他方式。因?yàn)檫@是隨著機(jī)器變得更加智能化的唯一途徑。我們不能忍受標(biāo)準(zhǔn)模型,因?yàn)檎缥宜f,目標(biāo)不正確的系統(tǒng)可能會(huì)帶來任意不良后果。”