一種新的AI能夠在科學發(fā)現(xiàn)發(fā)生之前就對其進行預(yù)測

2020-02-06 16:27:44    來源:    作者:

大約70年前,著名的數(shù)學家,代碼破壞者和計算機科學家艾倫·圖靈(Alan Turing)問:“機器能思考嗎?” 如今,一些專家毫不懷疑,人工智能(AI)很快將能夠開發(fā)人類擁有的那種通用智能。但是其他人則認為機器永遠無法達到預(yù)期的效果。盡管在某些任務(wù)上,人工智能已經(jīng)可以超越人類,就像計算器一樣,但它們卻無法教給人類創(chuàng)造力。

一種新的AI能夠在科學發(fā)現(xiàn)發(fā)生之前就對其進行預(yù)測

畢竟,我們的創(chuàng)造力有時是出于熱情和直覺而不是邏輯和證據(jù)的驅(qū)使,使我們能夠做出驚人的發(fā)現(xiàn)-從疫苗到基本粒子。人工智能肯定不會競爭嗎?好吧,事實證明他們可能會這么做。最近在《自然》雜志上發(fā)表的一篇論文指出,人工智能現(xiàn)在已經(jīng)能夠通過簡單地從研究出版物中提取有意義的數(shù)據(jù)來預(yù)測未來的科學發(fā)現(xiàn)。

語言與思維有著深厚的聯(lián)系,它已經(jīng)塑造了人類社會,人際關(guān)系,并最終影響了智力。因此,毫不奇怪,人工智能研究的圣杯就是對人類語言的所有細微差別的充分理解。自然語言處理(NLP)是更大的一部分(稱為機器學習)的一部分,旨在評估,提取和評估文本數(shù)據(jù)中的信息。

兒童通過反復(fù)試驗與周圍的世界互動學習。學習如何騎自行車經(jīng)常會遇到一些顛簸和跌落。換句話說,我們犯了錯誤并從中學習。這恰恰是機器學習的運行方式,有時需要一些額外的“教育”輸入(監(jiān)督的機器學習)。

一種新的AI能夠在科學發(fā)現(xiàn)發(fā)生之前就對其進行預(yù)測

例如,AI可以通過從許多單獨的示例中構(gòu)建對象的圖片來學習識別圖像中的對象。在這里,人類必須向其顯示是否包含該物體的圖像。然后,計算機會對是否進行猜測,并根據(jù)猜測的準確性來調(diào)整其統(tǒng)計模型,如人類所判斷的那樣。但是,我們也可以讓計算機程序自己完成所有相關(guān)的學習(無監(jiān)督機器學習)。在這里,AI自動開始能夠檢測數(shù)據(jù)中的模式。無論哪種情況,計算機程序都需要通過評估錯誤程度來找到解決方案,然后嘗試對其進行調(diào)整以最大程度地減少此類錯誤。

假設(shè)我們想了解與特定材料相關(guān)的一些屬性。顯而易見的步驟是從書籍,網(wǎng)頁和任何其他適當?shù)馁Y源中搜索信息。但是,這很耗時,因為它可能涉及數(shù)小時的網(wǎng)絡(luò)搜索,閱讀文章和專業(yè)文獻。NLP可以幫助我們。通過復(fù)雜的方法和技術(shù),計算機程序可以從大型文本數(shù)據(jù)集中識別概念,相互關(guān)系,一般主題和特定屬性。

在這項新研究中,人工智能學會了通過無監(jiān)督學習從科學文獻中檢索信息。這具有顯著的含義。到目前為止,大多數(shù)基于NLP的自動化自動方法都受到監(jiān)督,需要人工輸入。盡管與純手工方法相比有所改進,但這仍然是一項勞動密集型工作。

但是,在這項新研究中,研究人員創(chuàng)建了一個可以獨立準確地識別和提取信息的系統(tǒng)。它使用了基于數(shù)據(jù)統(tǒng)計和幾何特性的復(fù)雜技術(shù)來識別化學名稱,概念和結(jié)構(gòu)。這是基于約150萬篇有關(guān)材料科學的科學論文摘要。

然后,機器學習程序會根據(jù)特定的特征(例如“元素”,“能量學”和“粘合劑”)對數(shù)據(jù)中的單詞進行分類。例如,“熱”被歸類為“能量學”的一部分,“氣體”被歸類為“元素”。這有助于將某些具有磁性類型和與其他材料相似的化合物連接起來,從而提供了在不需要人工干預(yù)的情況下單詞如何關(guān)聯(lián)的見解。

一種新的AI能夠在科學發(fā)現(xiàn)發(fā)生之前就對其進行預(yù)測

科學發(fā)現(xiàn)

這種方法可以捕獲復(fù)雜的關(guān)系并識別不同的信息層,這實際上是人類無法實現(xiàn)的。與科學家目前可以預(yù)測的相比,它提前提供了深刻的見解。實際上,人工智能可以在實際發(fā)現(xiàn)前幾年為功能性應(yīng)用推薦材料。有五種這樣的預(yù)測,所有這些預(yù)測都是基于2009年之前發(fā)表的論文。例如,人工智能設(shè)法識別出一種稱為CsAgGa2Se4as的物質(zhì)作為熱電材料,科學家僅在2012年才發(fā)現(xiàn)。因此,如果人工智能在2009年左右出現(xiàn), ,這可能會加快發(fā)現(xiàn)速度。

它通過將化合物與諸如“硫族化物”(包含“ 硫族元素 ”的材料,例如硫或硒),“ 光電 ”(提供,檢測和控制光的電子設(shè)備)和“ 光伏應(yīng)用 ” 等詞聯(lián)系起來進行預(yù)測。許多熱電材料都具有這種特性,而AI很快證明了這一點。

這表明有關(guān)未來發(fā)現(xiàn)的潛在知識在很大程度上已嵌入過去的出版物中。人工智能系統(tǒng)變得越來越獨立。沒有什么可擔心的。它們可以極大地幫助我們?yōu)g覽由人類活動不斷產(chǎn)生的大量數(shù)據(jù)和信息。盡管與隱私和安全有關(guān),但AI正在改變我們的社會。我相信它將引導我們做出更好的決策,改善我們的日常生活,并最終使我們變得更聰明。

鄭重聲明:本文版權(quán)歸原作者所有,轉(zhuǎn)載文章僅為傳播更多信息之目的,如作者信息標記有誤,請第一時間聯(lián)系我們修改或刪除,多謝。