一項新的研究發(fā)現(xiàn),結(jié)合大約一百萬張乳腺X線攝影圖像進行訓(xùn)練的人工智能工具,與放射線醫(yī)師分析相結(jié)合,可以以大約90%的準(zhǔn)確率識別出乳腺癌。
這項研究檢查了一種類型的人工智能(AI)(一種機器學(xué)習(xí)計算機程序)為診斷14位放射線醫(yī)師檢查720 幅乳腺X線照片所達到的診斷價值的能力。
紐約大學(xué)格羅斯曼醫(yī)學(xué)院放射學(xué)系助理教授,高級研究作者Krzysztof Geras說:“我們的研究發(fā)現(xiàn)AI在放射科醫(yī)生無法識別的數(shù)據(jù)中識別出與癌癥相關(guān)的模式,反之亦然。”
“人工智能檢測到人眼看不見的組織中像素級的變化,而人類則使用了人工智能無法獲得的推理形式,”數(shù)據(jù)科學(xué)中心的附屬教師杰拉斯補充道。“我們工作的最終目標(biāo)是增加而不是替代人類放射科醫(yī)生。”
2014年,美國的女性(無癥狀)接受了超過3,900萬例的乳房X線檢查,以篩查乳腺癌并確定是否需要進行更深入的隨訪。將其檢查結(jié)果顯示出異常的乳房X線檢查結(jié)果的女性進行活檢,該活檢是從乳房組織中取出少量樣本進行實驗室檢查的過程。
在這項新研究中,研究團隊設(shè)計了統(tǒng)計技術(shù),使他們的程序可以“學(xué)習(xí)”如何更好地完成一項任務(wù),而無需確切地告訴他們?nèi)绾巫?。這樣的程序會建立數(shù)學(xué)模型,從而能夠根據(jù)輸入的數(shù)據(jù)示例進行決策,并且隨著程序查看越來越多的數(shù)據(jù),該程序?qū)⒆兊?ldquo;更智能”。
從人腦中汲取靈感的現(xiàn)代AI方法使用復(fù)雜的電路來分層處理信息,每個步驟將信息饋送到下一個步驟,并在此過程中或多或少地為每條信息分配重要性。
本研究的作者在許多與過去進行的活檢結(jié)果相匹配的圖像上訓(xùn)練了他們的AI工具。他們的目標(biāo)是使該工具能夠幫助放射科醫(yī)生減少向前發(fā)展所需的活檢數(shù)量。Geras說,這只能通過提高醫(yī)師對篩查檢查的評估準(zhǔn)確性的信心(例如,減少假陽性和假陰性結(jié)果)來實現(xiàn)。
對于當(dāng)前的研究,研究團隊分析了七年來作為常規(guī)臨床護理的一部分而收集的圖像,對收集的數(shù)據(jù)進行篩選,并將圖像與活檢結(jié)果聯(lián)系起來。作者說,這項工作為他們的AI工具創(chuàng)建了一個非常龐大的數(shù)據(jù)集,供其進行訓(xùn)練,其中包括229,426次數(shù)字篩查乳房X線檢查和1,001,093張圖像。迄今為止,研究人員在研究中使用的大多數(shù)數(shù)據(jù)庫僅限于10,000張或更少的圖像。
因此,研究人員通過對神經(jīng)網(wǎng)絡(luò)進行編程來訓(xùn)練他們的神經(jīng)網(wǎng)絡(luò),以分析來自已經(jīng)確定了癌癥診斷的數(shù)據(jù)庫中的圖像。這意味著研究人員在測試工具的準(zhǔn)確性時就知道了每個乳房X線照片(無論是否癌癥)的“真相”,而工具卻不得不猜測。研究人員測量了正確預(yù)測頻率的準(zhǔn)確性。
此外,研究人員設(shè)計了AI研究模型,首先要考慮全分辨率圖像的很小部分,以創(chuàng)建熱圖,即疾病可能性的統(tǒng)計圖。然后,程序會考慮整個乳房的與癌癥相關(guān)的結(jié)構(gòu)特征,并更加注意像素級熱圖中標(biāo)記的區(qū)域。
研究人員沒有發(fā)現(xiàn)研究人員為其AI尋找圖像特征,而是自行發(fā)現(xiàn)哪些圖像特征可提高預(yù)測精度。展望未來,該團隊計劃通過在更多數(shù)據(jù)上訓(xùn)練AI程序來進一步提高這種準(zhǔn)確性,甚至可能識別尚未癌變但有潛力的乳房組織變化。
“在診斷放射學(xué)領(lǐng)域向AI支持的過渡應(yīng)該像采用自動駕駛汽車一樣緩慢而謹(jǐn)慎地進行,建立信任,并在注重安全的同時改進系統(tǒng),”第一作者Nan Wu表示,他是博士論文的作者。數(shù)據(jù)科學(xué)中心。