該項(xiàng)目將人工智能(AI)研究人員Anima Anandkumar(布倫計(jì)算和數(shù)學(xué)科學(xué) 教授)和政治學(xué)教授Michael Alvarez的實(shí)驗(yàn)室聯(lián)合起來(lái) 。他們的工作于12月14日在加拿大溫哥華舉行的2019年神經(jīng)信息處理系統(tǒng)會(huì)議上的AI for Social Good研討會(huì)上進(jìn)行了介紹。他們的研究團(tuán)隊(duì)包括博士后學(xué)者劉安琪。加州理工學(xué)院的大三學(xué)生Maya Srikanth;斯坦福大學(xué)的Nicholas Adams-Cohen(MS '16,PhD '19)。阿爾瓦雷斯說(shuō):“這是我對(duì)加州理工學(xué)院的最愛(ài)之一:跨越界限,發(fā)展社會(huì)科學(xué)與計(jì)算機(jī)科學(xué)之間的協(xié)同作用的能力。”
要防止在線騷擾,需要快速檢測(cè)到令人反感的,騷擾的和負(fù)面的社交媒體帖子,進(jìn)而需要監(jiān)視在線互動(dòng)。當(dāng)前獲取此類社交媒體數(shù)據(jù)的方法是完全自動(dòng)化且無(wú)法解釋的,或者依賴一組靜態(tài)的關(guān)鍵字,而這些關(guān)鍵字很快就會(huì)過(guò)時(shí)。斯里坎特說(shuō),這兩種方法都不是很有效。
她說(shuō):“讓人類嘗試手工完成這項(xiàng)工作是不可擴(kuò)展的,而這些人類可能有偏見(jiàn)。” “另一方面,關(guān)鍵字搜索受到在線對(duì)話發(fā)展速度的困擾。新術(shù)語(yǔ)出現(xiàn)了,舊術(shù)語(yǔ)改變了含義,因此真誠(chéng)地使用一天的關(guān)鍵字可能在第二天被諷刺。
取而代之的是,該團(tuán)隊(duì)使用GloVe(全球單詞表示向量)模型來(lái)發(fā)現(xiàn)新的相關(guān)關(guān)鍵字。GloVe是一個(gè)詞嵌入模型,意味著它代表向量空間中的詞,其中兩個(gè)詞之間的“距離”是其語(yǔ)言或語(yǔ)義相似性的量度。從一個(gè)關(guān)鍵字開(kāi)始,此模型可用于查找與該單詞密切相關(guān)的其他關(guān)鍵字,以揭示實(shí)際使用的相關(guān)術(shù)語(yǔ)的群集。例如,在Twitter中搜索對(duì)話中對(duì)“ MeToo”的使用,產(chǎn)生了一系列相關(guān)的標(biāo)簽,如“ SupportSurvivors”,“ ImWithHer”和“ NotSilent”。這種方法為研究人員提供了一個(gè)動(dòng)態(tài)且不斷發(fā)展的關(guān)鍵字集來(lái)進(jìn)行搜索。
但是僅僅知道某個(gè)對(duì)話是否與感興趣的話題有關(guān)還不夠。上下文很重要。為此,GloVe顯示了某些關(guān)鍵字的關(guān)聯(lián)程度,提供了有關(guān)其用法的輸入。例如,在一個(gè)專門針對(duì)厭女癥的在線Reddit論壇中,“女性”一詞與“性”,“陰性”和“性交”密切相關(guān)。在有關(guān)#MeToo運(yùn)動(dòng)的Twitter帖子中,“女性”更可能與“公司”,“欲望”和“受害者”相關(guān)。
該項(xiàng)目是一種概念證明,旨在有一天為社交媒體平臺(tái)提供一種更強(qiáng)大的工具,以發(fā)現(xiàn)在線騷擾。Anandkumar參與了將“神經(jīng)信息處理系統(tǒng)”會(huì)議的簡(jiǎn)稱從其首字母縮寫“ NIPS”更改為“ NeurIPS”的活動(dòng),從而增強(qiáng)了對(duì)該主題的興趣。
“人工智能研究領(lǐng)域變得越來(lái)越具有包容性,但總有人抵制變革。”阿南德庫(kù)瑪爾說(shuō)。他在2018年發(fā)現(xiàn)自己是網(wǎng)上騷擾和威脅的目標(biāo),因?yàn)樗晒Φ嘏Ω挠昧耸鬃帜缚s寫詞,沒(méi)有潛在的冒犯性含義。 。“關(guān)于如何獲得丑陋的巨魔,這真是令人大開(kāi)眼界。希望我們現(xiàn)在正在開(kāi)發(fā)的工具將有助于將來(lái)應(yīng)對(duì)各種騷擾。”