深度學(xué)習(xí)是AI的重要元素,可幫助推進(jìn)診斷和治療,但它仍然是一個相對未知的領(lǐng)域。
該技術(shù)的第一作者Fei Wang博士和紐約Weill Cornell Medicine的同事在《JAMA Internal Medicine》上寫道,迄今為止,該技術(shù)最成功的應(yīng)用是醫(yī)學(xué)成像。人工智能技術(shù)的其他應(yīng)用領(lǐng)域非常廣泛,但是科學(xué)家仍然面臨著巨大的障礙。
Wang和合著者說:“深度學(xué)習(xí)有可能解開圖像中復(fù)雜的,微妙的區(qū)分模式,這表明這些技術(shù)可能在醫(yī)學(xué)的其他領(lǐng)域有用。” “但是,在深度學(xué)習(xí)可以更廣泛地應(yīng)用之前,必須解決重大挑戰(zhàn)。”
Wang和他的團(tuán)隊認(rèn)為,這些是其中五個挑戰(zhàn):
1.我們可能沒有足夠的數(shù)據(jù)
Wang等人在深度學(xué)習(xí)模型中分別使用128,175張視網(wǎng)膜圖像和129,450張皮膚圖像來對糖尿病性視網(wǎng)膜病變和皮膚癌進(jìn)行分類。寫道。“模型的復(fù)雜性由問題的復(fù)雜性決定”,這意味著更復(fù)雜或異構(gòu)的疾病可能需要大量我們尚未掌握的可靠數(shù)據(jù)。深度學(xué)習(xí)模型可能需要數(shù)以千萬計的樣本才能為慢性心臟病或腎衰竭創(chuàng)建合適的診斷模型。
作者寫道:“模型很復(fù)雜,設(shè)計其最佳架構(gòu)可能很困難。”
從電子健康記錄中確保數(shù)據(jù)的質(zhì)量也很困難,其中包含“高度異類,有時不一致”的患者信息,這可能會妨礙AI算法的準(zhǔn)確性。
2. AI模型產(chǎn)生結(jié)果,但沒有解釋
Wang和合著者說,典型的皮膚科醫(yī)生對黑色素瘤的檢測將評估一系列主要和次要標(biāo)準(zhǔn)的圖像,從而為診斷提供依據(jù)。接受過培訓(xùn)的深度學(xué)習(xí)模型可以做到這一點,例如“該患者患有黑色素瘤的可能性為0.8”,但仍然難以為他們的結(jié)論提供清晰的解釋。
這組作者說,正在影像領(lǐng)域做出一些努力來改善這個問題,但是他們承認(rèn)“一種僅表示診斷的深度學(xué)習(xí)模型可能會受到懷疑。”
3.創(chuàng)建通用模型很困難
該團(tuán)隊說,模型的偏見和互操作性使得很難設(shè)計可擴(kuò)展到其他人群,國家或系統(tǒng)的深度學(xué)習(xí)模型。如果主要對白人患者的數(shù)據(jù)進(jìn)行訓(xùn)練,那么該模型將難以為少數(shù)群體提供準(zhǔn)確的預(yù)測。同樣,在亞洲接受培訓(xùn)的模型在歐洲可能做得不好。
EHR的可變性也帶來了一個問題,因為使用不同EHR的兩個衛(wèi)生系統(tǒng)可能無法使用相同的AI算法。
4.我們需要更好的人工智能來開發(fā)更好的數(shù)據(jù)
Wang等人說:“由于深度學(xué)習(xí)模型適合數(shù)據(jù),但對它們的處理過程卻知之甚少,因此可靠,高質(zhì)量的輸入很重要。” 寫道。“創(chuàng)建提高數(shù)據(jù)收集過程質(zhì)量的工具也很重要,例如糾錯,有關(guān)數(shù)據(jù)丟失的警告和差異的調(diào)和。”
作者提到了《 IBM Watson Imaging臨床評論》,該評論分析了臨床成像報告中的結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù),并將其與EHR中記錄的診斷進(jìn)行比較,以識別任何報告差異。
5.深度學(xué)習(xí)需要更多規(guī)范
Wang和同事寫道,隨著AI,機(jī)器學(xué)習(xí)和深度學(xué)習(xí)在醫(yī)學(xué)領(lǐng)域的普及,這些技術(shù)越來越受到計算機(jī)黑客的歡迎。盡管一些社會正在聯(lián)合起來提供有關(guān)AI倫理學(xué)的指導(dǎo),但作者說科學(xué)家可能需要更嚴(yán)格的法規(guī)以確保模型安全。
他們寫道:“現(xiàn)有法規(guī)側(cè)重于醫(yī)療數(shù)據(jù)的隱私,而新法規(guī)也應(yīng)保護(hù)分析模型。”