眾包自動測試公司Applause今天宣布推出新的 人工智能培訓解決方案,它將幫助機器學習算法更好地處理人工輸入數(shù)據(jù)。
新的可擴展,可用于企業(yè)的解決方案訓練機器學習算法來快速學習并測試它們以檢測和糾正偏差,從而確保它們能夠正確處理和響應(yīng)。
為此,掌聲正在使用其龐大的經(jīng)過審查的人類測試人員社區(qū),以便在最能與被測試產(chǎn)品和服務(wù)的實際條件相匹配的環(huán)境中,提供最廣泛的潛在培訓輸入。然后,該數(shù)據(jù)將通過系統(tǒng)反饋并在所有可能的設(shè)備,位置和環(huán)境中進行測試,以幫助識別可能出現(xiàn)的問題并實時提供可操作的用戶反饋。
用戶希望AI更自然,更人性化。Applause的眾包方法提供了AI所缺少的東西:在發(fā)布之前會有大量的真實人類交互,” Applause產(chǎn)品副總裁Kristin Simonini說。
通過設(shè)計,掌聲收集的數(shù)據(jù)旨在避免出現(xiàn)孤立的小群體的偏見,這對任何人群來說都是一個很差的代表。對于有才華的測試人員而言,這尤其是個問題,他們的人群很容易引入偏見,因為培訓測試產(chǎn)品的人可能很容易來自相同的背景。
因此,公司收集的機器學習培訓數(shù)據(jù)來自許多國家,不同年齡,性別,種族,文化政治派別,意識形態(tài),社會經(jīng)濟背景,教育水平等等的人們。與從較小的組中獲取數(shù)據(jù)相比,這種廣泛的數(shù)據(jù)樣本基礎(chǔ)可以更好地模擬偏差較小的輸出。
Simonini說:“這不僅將改善各地消費者的AI體驗,而且社區(qū)的廣度還具有緩解偏見的潛力,并使AI更加代表現(xiàn)實世界。”
當前市場上的所有類型的AI都遇到了極為相似的問題:獲取足夠的數(shù)據(jù)來教授ML算法如何解釋和響應(yīng)。這一挑戰(zhàn)阻礙了從旨在識別食物的營養(yǎng)應(yīng)用程序到虛擬助手(了解不同用戶如何要求相同事物)的許多AI解決方案的產(chǎn)生。
掌聲的新AI解決方案可在五種不同類型的AI互動中運行:語音,光學字符識別,圖像識別,生物識別和聊天機器人。
對于語音,數(shù)據(jù)池使用源話語來訓練啟用語音的設(shè)備。對于OCR,它在視覺上包含閱讀的文檔和相應(yīng)的文本以構(gòu)建上下文。通過圖像識別,它為機器學習算法提供了檢測和分類預定義對象和位置的能力。對于生物識別,它獲取諸如面部和指紋之類的生物識別輸入。對于聊天機器人,數(shù)據(jù)源會采樣問題和意圖,以更好地了解用戶需求并以更人性化的方式進行響應(yīng)。
當訓練AI系統(tǒng)的團隊未能考慮到各種各樣的潛在人工輸入時,不僅可能導致不良的客戶服務(wù)或產(chǎn)品,還可能導致更多的后果。一些極端的機器學習失敗之所以成為新聞,是因為它們無法正確識別人臉,例如在2015年,Google LLC照片識別算法將黑人誤認為是“大猩猩”(該公司通過從培訓庫存中移除大猩猩來糾正這一問題)。2016年,新西蘭護照驗證算法誤以為他是22歲的具有亞洲特色的DJ 理查德·李,他閉著眼睛。
盡管這些失敗已廣為人知,并且事后看來潛在的問題很明顯,但它們也揭示了一個深層的文化問題,即如何培訓AI系統(tǒng)以與不同人群互動。機器學習在與人互動時的擴散和實施是一個以人為本的問題,需要考慮到這一點的解決方案。
Applause希望利用其眾包的人力數(shù)據(jù)池,幫助邁出建立更好的AI培訓系統(tǒng)的第一步,從而減少將來出現(xiàn)這些錯誤的可能性,并有可能在偏見成為人類問題之前對其進行檢測并發(fā)出警告。