沒有人類或人類團(tuán)隊(duì)可能能夠跟上當(dāng)今許多物理學(xué)和天文學(xué)實(shí)驗(yàn)所產(chǎn)生的大量信息。他們中的一些人每天記錄數(shù)TB的數(shù)據(jù) - 洪流只會(huì)增加。Square Kilometer Array是一臺(tái)預(yù)定在20世紀(jì)20年代中期開啟的射電望遠(yuǎn)鏡,每年將產(chǎn)生與整個(gè)互聯(lián)網(wǎng)一樣多的數(shù)據(jù)流量。
大洪水讓許多科學(xué)家轉(zhuǎn)向人工智能尋求幫助。人工神經(jīng)網(wǎng)絡(luò)(人工神經(jīng)網(wǎng)絡(luò) - 模擬大腦功能的神經(jīng)元的計(jì)算機(jī)模擬網(wǎng)絡(luò))等人工智能系統(tǒng)可以通過最少的人工輸入,在大量數(shù)據(jù)中掠過,突出異常并檢測人類永遠(yuǎn)無法發(fā)現(xiàn)的模式。
當(dāng)然,使用計(jì)算機(jī)來輔助科學(xué)研究大約可以追溯到75年前,并且手工研究數(shù)據(jù)以尋找有意義的模式的方法起源于數(shù)千年前。但是一些科學(xué)家認(rèn)為機(jī)器學(xué)習(xí)和人工智能的最新技術(shù)代表了一種全新的科學(xué)方法。一種這樣的方法,即生成建模,可以幫助在僅基于數(shù)據(jù)的觀察數(shù)據(jù)的競爭性解釋中找出最合理的理論,并且重要的是,沒有任何預(yù)編程的知識(shí),可以在所研究的系統(tǒng)中起作用的物理過程。 。生成模型的支持者認(rèn)為它足夠新穎,被認(rèn)為是學(xué)習(xí)宇宙的潛在“第三條道路”。
傳統(tǒng)上,我們通過觀察了解了自然。想想約翰內(nèi)斯·開普勒(Johannes Kepler)在第谷布拉赫(Tycho Brahe)的行星位置表上仔細(xì)研究,并試圖辨別出潛在的模式。(他最終推斷出行星在橢圓軌道上運(yùn)動(dòng)。)科學(xué)也通過模擬推進(jìn)。一位天文學(xué)家可能會(huì)模擬銀河系及其鄰近星系仙女座星系的運(yùn)動(dòng),并預(yù)測它們將在數(shù)十億年內(nèi)發(fā)生碰撞。觀察和模擬都有助于科學(xué)家產(chǎn)生假設(shè),然后可以通過進(jìn)一步的觀察進(jìn)行測試。生成建模不同于這兩種方法。
“它基本上是觀察和模擬之間的第三種方法,” 天文物理學(xué)家和生成模型最熱情的支持者之一Kevin Schawinski說道,他最近在瑞士聯(lián)邦理工學(xué)院(蘇黎世聯(lián)邦理工學(xué)院)工作。“這是解決問題的另一種方式。”
一些科學(xué)家將生成建模和其他新技術(shù)視為傳統(tǒng)科學(xué)的動(dòng)力工具。但大多數(shù)人都認(rèn)為人工智能正在產(chǎn)生巨大影響,而且它在科學(xué)中的作用只會(huì)增長。Fermi國家加速器實(shí)驗(yàn)室的天體物理學(xué)家Brian Nord使用人工神經(jīng)網(wǎng)絡(luò)來研究宇宙,他們擔(dān)心人類科學(xué)家沒有什么可以實(shí)現(xiàn)自動(dòng)化。“這是一個(gè)令人不寒而栗的想法,”他說。
按代發(fā)現(xiàn)
自研究生畢業(yè)以來,Schawinski一直以數(shù)據(jù)驅(qū)動(dòng)的科學(xué)為名。在攻讀博士學(xué)位期間,他面臨著根據(jù)外表對數(shù)千個(gè)星系進(jìn)行分類的任務(wù)。因?yàn)檫@份工作沒有現(xiàn)成的軟件,所以他決定對其進(jìn)行眾包 - 因此銀河動(dòng)物園公民科學(xué)項(xiàng)目誕生了。從2007年開始,普通計(jì)算機(jī)用戶通過記錄他們對哪個(gè)星系屬于哪個(gè)類別的最佳猜測幫助天文學(xué)家,多數(shù)規(guī)??則通常導(dǎo)致正確的分類。該項(xiàng)目取得了成功,但是,正如Schawinski指出的那樣,人工智能已經(jīng)過時(shí)了:“今天,具備機(jī)器學(xué)習(xí)和云計(jì)算訪問背景的才華橫溢的科學(xué)家可以在一個(gè)下午完成整個(gè)工作。”
Schawinski在2016年轉(zhuǎn)向了生成建模的強(qiáng)大新工具。從本質(zhì)上講,生成建模會(huì)詢問在條件X的情況下,你會(huì)觀察到結(jié)果Y的可能性。這種方法已被證明是非常有效和多才多藝的。例如,假設(shè)您為生成模型提供一組人臉圖像,每張臉都標(biāo)有人的年齡。當(dāng)計(jì)算機(jī)程序梳理這些“訓(xùn)練數(shù)據(jù)”時(shí),它開始在較舊的面部之間建立聯(lián)系并增加皺紋的可能性。最終,它可以“老化”它所給予的任何面孔 - 也就是說,它可以預(yù)測任何年齡的特定面部可能經(jīng)歷的物理變化。