如此眾多的化石,如此之短的時(shí)間—訓(xùn)練人們對(duì)其進(jìn)行識(shí)別。
隨著科學(xué)家們努力應(yīng)對(duì)大量待定的海洋化石積壓,由耶魯大學(xué)領(lǐng)導(dǎo)的國(guó)際組織已開(kāi)始使用機(jī)器學(xué)習(xí)技術(shù)來(lái)解決研究海洋最豐富的生命形式的研究人員面臨的艱巨任務(wù)。
由耶魯大學(xué)地質(zhì)學(xué)家Pincelli Hull實(shí)驗(yàn)室領(lǐng)導(dǎo)的研究小組 建立了一個(gè)自動(dòng)化系統(tǒng),可以瀏覽大量浮游生物化石圖像并正確識(shí)別單個(gè)物種。這項(xiàng)新技術(shù)代表著科學(xué)家評(píng)估過(guò)去和現(xiàn)在全球生態(tài)變化對(duì)浮游生物的影響的能力的重大提升。
一項(xiàng)宣布這項(xiàng)技術(shù)的研究發(fā)表在《古海洋學(xué)和古氣候?qū)W》雜志上。
“數(shù)以百萬(wàn)計(jì)地球上的物種,以及數(shù)百萬(wàn)更在化石記錄中,有太多幾個(gè)分類學(xué)專家,以確定他們,這樣我們就可以理解這樣的關(guān)鍵事情,物種和生態(tài)系統(tǒng)如何應(yīng)對(duì)氣候變化,說(shuō):”赫爾,該研究的資深作者。
赫爾補(bǔ)充說(shuō):“在這里,我們通過(guò)匯集全球分類學(xué)家的專業(yè)知識(shí)來(lái)解決此問(wèn)題,從而創(chuàng)建了一個(gè)重要的浮游生物群體的最大圖像數(shù)據(jù)庫(kù)(按物種級(jí)別識(shí)別)。” “然后,我們使用機(jī)器學(xué)習(xí)技術(shù)來(lái)訓(xùn)練計(jì)算機(jī)做同樣的事情。”
從進(jìn)行地球化學(xué)研究到了解海洋中物理過(guò)程的復(fù)雜,相互聯(lián)系的動(dòng)力學(xué),識(shí)別浮游生物是海洋古生物學(xué)許多領(lǐng)域的核心。例如,可以對(duì)它們進(jìn)行分析以重建海面溫度,鹽度和某些大氣值。然而,鑒于缺乏可用于培訓(xùn)學(xué)生浮游生物分類學(xué)的資源,事實(shí)證明難以識(shí)別單個(gè)浮游生物種類進(jìn)行研究。
赫爾和她的同事們開(kāi)始了一個(gè)雄心勃勃的計(jì)劃,以對(duì)這種情況做些事情。他們通過(guò)一個(gè)名為Endless Forams的在線門戶網(wǎng)站 (“ forams ”是有孔蟲(chóng)的簡(jiǎn)稱,這是一種有著悠久化石記錄且可追溯到億萬(wàn)年的悠久歷史的單細(xì)胞生物)匯集了34,000多種典型浮游生物物種圖像的數(shù)據(jù)庫(kù)。 通過(guò)在公民科學(xué)平臺(tái)Zooniverse上托管的培訓(xùn)門戶網(wǎng)站。這些圖像來(lái)自耶魯大學(xué)皮博迪自然歷史博物館和倫敦自然歷史博物館的藏品。
接下來(lái),研究人員使用機(jī)器學(xué)習(xí)技術(shù),訓(xùn)練了計(jì)算機(jī)模型來(lái)識(shí)別浮游生物。表現(xiàn)最佳的模型能夠正確識(shí)別87.4%的物種。
赫爾說(shuō):“這真的很令人興奮,因?yàn)樗瓤梢宰詣?dòng)化也可以標(biāo)準(zhǔn)化一項(xiàng)重要任務(wù)。” “它在保留分類學(xué)專家的關(guān)鍵知識(shí)的同時(shí),提高了科學(xué)的可重復(fù)性。”
該研究的主要作者是前耶魯大學(xué)博士后的艾莉森·香(Allison Hsiang),他現(xiàn)在在瑞典自然歷史博物館。該研究的合著者來(lái)自英國(guó),德國(guó),法國(guó),荷蘭和美國(guó)的機(jī)構(gòu)。
研究人員指出,使用監(jiān)督式機(jī)器學(xué)習(xí)技術(shù)回答生物學(xué)問(wèn)題提出了獨(dú)特的挑戰(zhàn)。監(jiān)督圖像分類的大多數(shù)應(yīng)用用于許多不同的目的,例如實(shí)時(shí)識(shí)別自動(dòng)駕駛系統(tǒng)的對(duì)象或識(shí)別手寫字母和數(shù)字。研究人員說(shuō),同樣,某些機(jī)器學(xué)習(xí)識(shí)別技術(shù),包括翻轉(zhuǎn)和旋轉(zhuǎn)圖像,對(duì)于識(shí)別分類法可能是成問(wèn)題的,需要仔細(xì)實(shí)施。例如,對(duì)某些化石的識(shí)別取決于其殼被纏繞的方式,并且如果圖像被翻轉(zhuǎn)或旋轉(zhuǎn)將發(fā)生變化。
耶魯大學(xué)皮博迪自然歷史博物館生物多樣性信息學(xué)和數(shù)據(jù)科學(xué)負(fù)責(zé)人納爾遜·里奧斯(Nelson Rios)說(shuō):“我們的最終目標(biāo)是讓專家掌握更多數(shù)據(jù)。” “能夠評(píng)估氣候隨時(shí)間的變化并了解物種的反應(yīng)非常重要。”
赫爾補(bǔ)充說(shuō):“這個(gè)項(xiàng)目一直是我研究小組的長(zhǎng)期目標(biāo)之一,我們很高興看到這些結(jié)果。”