麻省理工學院媒體實驗室的研究人員開發(fā)了一種機器學習系統(tǒng),可以“讀取”面部表情來確定人類的情緒。
急于開發(fā)能夠解釋人類交流和表達錯綜復雜的機器的時候,有些人認為情感計算可以提供傳統(tǒng)機器人,軟件和對某些人真正有益的解決方案之間缺失的聯(lián)系。
情緒閱讀系統(tǒng)的潛在應用范圍從不引人注意地追蹤心理健康到衡量學生對課堂的興趣或顧客對商店的興趣。
解釋情感的挑戰(zhàn)
能夠“閱讀”人是許多人認為理所當然的技能。對于機器而言,它并不像直覺或情感智能人士那么容易。特別是當有很多變量發(fā)揮作用且背景如此重要時 - 更不用說文化差異了。
例如,一個人可能以不同的方式表達情緒。而且在此之前,諸如年齡,文化和性別等因素被添加到組合中。深入研究,一天中的時間,互動中其他人的存在,以及當下一個人的情緒都會使閱讀情緒成為一個復雜的過程。
這就是機器學習的用武之地。憑借足夠的培訓數(shù)據(jù),麻省理工學院媒體實驗室的研究人員開發(fā)出一種系統(tǒng),在識別小型面部表情及其相應情緒方面優(yōu)于現(xiàn)有模型。
該團隊聲稱,通過“一些額外的訓練數(shù)據(jù)”,該模型可以適應于分析新的情境,例如新的一群人,而不會犧牲功效。
“這是監(jiān)控我們心情的一種不引人注目的方式,”媒體實驗室研究員Oggi Rudovic說道,他是一篇描述該模型的論文的合著者,該論文于上周在機器學習和數(shù)據(jù)挖掘會議上發(fā)表。“如果你想要具有社交智能的機器人,你必須聰明地做出這些機器人并自然地回應我們的情緒和情緒,更像人類。”
麻省理工學院團隊的機器學習模型與傳統(tǒng)情感計算的不同之處在于使用了一種稱為“專家混合”的技術。該方法不是在一組圖像上訓練系統(tǒng)并將各種面部表情及其相應的情緒映射到新的,而是與個體神經(jīng)網(wǎng)絡模型 - “專家”相結合。
這些“專家”每人都經(jīng)過專業(yè)培訓,專門從事單獨的處理任務,并從中生成單一輸出。新系統(tǒng)還依賴于“門控網(wǎng)絡”,該網(wǎng)絡計算哪位專家最能檢測到情緒的概率。
“基本上,網(wǎng)絡可以辨別個體,并說'這是給定圖像的合適專家',”該研究的主要作者Michael Feffer說。