準確檢測更改照片的人工智能變得更加智能??吹较嘈?,直到技術(shù)出現(xiàn)了強大的頭腦并給了我們強大而廉價的照片編輯工具?,F(xiàn)在,將一個人的面部表情映射到另一個人的面部表情的真實視頻(稱為深層偽造)呈現(xiàn)出強大的政治武器。
但無論是縱向皺紋的良性平滑,還是操縱視頻使其看起來像政治家說些冒犯性的東西,所有照片編輯都留下了正確工具的痕跡。
由 加州大學河濱分校的Amit Roy-Chowdhury 視頻計算小組領(lǐng)導的研究 開發(fā)了一種深度神經(jīng)網(wǎng)絡(luò)架構(gòu),可以高精度地識別像素級別的被操縱圖像。Roy-Chowdhury是Marlan和Rosemary Bourns工程學院的電氣和計算機工程教授以及Bourns家庭教師研究員。
深度神經(jīng)網(wǎng)絡(luò)是人工智能研究人員所稱的計算機系統(tǒng),這些計算機系統(tǒng)經(jīng)過培訓可以完成特定的任務(wù),在這種情 這些網(wǎng)絡(luò)以連接層組織; “架構(gòu)”是指層的數(shù)量和它們之間的連接結(jié)構(gòu)。
圖像中的對象具有邊界,并且每當從圖像插入或移除對象時,其邊界將具有與圖像中的對象的邊界自然不同的質(zhì)量。具有良好Photoshop技能的人將盡最大努力通過平滑這些邊界使插入的對象看起來盡可能自然。
雖然這可能會愚弄肉眼,但是當逐個像素地檢查時,插入對象的邊界是不同的。例如,插入的邊界通常比自然對象更平滑。通過檢測插入和移除的對象的邊界,計算機應該能夠識別改變的圖像。
研究人員在大型照片數(shù)據(jù)集中標記了非操作圖像和操縱圖像邊界區(qū)域中的相關(guān)像素。目的是教授神經(jīng)網(wǎng)絡(luò)關(guān)于照片的操縱和自然區(qū)域的一般知識。他們用一組前所未見的圖像測試了神經(jīng)網(wǎng)絡(luò),并且大部分時間都檢測到了改變過的圖像。它甚至發(fā)現(xiàn)了被操縱的區(qū)域。
“我們訓練系統(tǒng)區(qū)分被操縱和非操縱的圖像,現(xiàn)在如果你給它一個新的圖像,它能夠提供該圖像被操縱與否的概率,并定位操作發(fā)生的圖像區(qū)域, “Roy-Chowdhury說。
目前研究人員正在研究靜止圖像,但他們指出這也可以幫助他們檢測深度視頻。
“如果你能理解靜止圖像中的特征,那么在視頻中它基本上只是將靜止圖像一個接一個地放在一起,”Roy-Chowdhury說。“更根本的挑戰(zhàn)可能是弄清楚視頻中的幀是否被操縱。”
即使是單個操縱的框架也會引發(fā)紅旗。但Roy-Chowdhury認為,在自動化工具可以檢測到野外的深度視頻之前,我們還有很長的路要走。
“這是一個具有挑戰(zhàn)性的問題,”Roy-Chowdhury說道。“這是一種貓捉老鼠的游戲。整個網(wǎng)絡(luò)安全領(lǐng)域在某些方面試圖找到更好的防御機制,但攻擊者也找到了更好的機制。“
他說,在不久的將來可能無法實現(xiàn)完全自動化的深度檢測。
“如果你想看看互聯(lián)網(wǎng)上的所有內(nèi)容,一方面人類無法做到這一點,而自動化系統(tǒng)可能無法可靠地完成任務(wù)。所以它必須是兩者的混合,“Roy-Chowdhury說。
深度神經(jīng)網(wǎng)絡(luò)架構(gòu)可以生成可疑視頻和圖像列表供人們查看。自動化工具可以減少人們(如Facebook內(nèi)容審核人員)必須篩選以確定圖像是否被操縱的數(shù)據(jù)量。
對于這種用途,工具就在附近。
“這可能是這些技術(shù)可能會在很短的時間內(nèi)產(chǎn)生的,可能在幾年后,”Roy-Chowdhury說。
該論文“ 用于圖像偽造檢測的混合LSTM和編碼器 - 解碼器架構(gòu) ”發(fā)表在IEEE圖像處理交易問題上,由DARPA資助。其他作者包括Jawadul H. Bappy,Cody Simons,Lakshmanan Nataraj和BS Manjunath。
在相關(guān)工作中,他的小組開發(fā)了一種除了對象插入和移除之外還用于檢測其他類型的圖像處理的方法。該方法將模糊邊界的識別擴展為關(guān)于操縱區(qū)域和非操縱區(qū)域之間的過渡類型的一般知識,以比當前工具更準確地預測篡改。