機(jī)器學(xué)習(xí)清楚地解釋了基因調(diào)控

2019-12-31 16:45:07    來源:    作者:

在這個“大數(shù)據(jù)”時代,人工智能(AI)已成為科學(xué)家的寶貴盟友。例如,機(jī)器學(xué)習(xí)算法正在幫助生物學(xué)家理解控制基因功能的令人眼花number亂的分子信號。但是,隨著開發(fā)出新算法來分析更多數(shù)據(jù),它們也變得更加復(fù)雜且難以解釋。定量生物學(xué)家 Justin B. Kinney 和Ammar Tareen制定了設(shè)計高級機(jī)器學(xué)習(xí)算法的策略,使生物學(xué)家更容易理解。

該算法是一種人工神經(jīng)網(wǎng)絡(luò)(ANN)。受神經(jīng)元在大腦中連接和分支的方式的啟發(fā),人工神經(jīng)網(wǎng)絡(luò)是高級機(jī)器學(xué)習(xí)的計算基礎(chǔ)。盡管具有人工神經(jīng)網(wǎng)絡(luò)的名稱,但它并不是專門用于研究大腦的。

像塔里恩(Tareen)和金尼(Kinney)這樣的生物學(xué)家,都使用人工神經(jīng)網(wǎng)絡(luò)來分析來自稱為DNA的“大規(guī)模平行報告基因分析”(MPRA)實驗方法的數(shù)據(jù)。利用這些數(shù)據(jù),定量生物學(xué)家可以制作出人工神經(jīng)網(wǎng)絡(luò),以預(yù)測哪些分子在稱為基因調(diào)控的過程中控制特定基因。

細(xì)胞并不總是需要所有蛋白質(zhì)。相反,他們依靠復(fù)雜的分子機(jī)制根據(jù)需要打開或關(guān)閉產(chǎn)生蛋白質(zhì)的基因。當(dāng)這些規(guī)定失效時,通常會出現(xiàn)疾病。

Kinney說:“了解機(jī)制,例如基因調(diào)控的原理,這種機(jī)械知識通常是能夠開發(fā)針對疾病的分子療法與無法做到的區(qū)別。”

不幸的是,根據(jù)MPRA數(shù)據(jù)塑造標(biāo)準(zhǔn)ANN的方式與科學(xué)家在生命科學(xué)中提出問題的方式大不相同。這種錯位意味著生物學(xué)家發(fā)現(xiàn)很難解釋基因調(diào)控是如何發(fā)生的。

現(xiàn)在,Kinney和Tareen開發(fā)了一種新方法,可以彌合計算工具與生物學(xué)家的想法之間的鴻溝。他們創(chuàng)建了自定義的人工神經(jīng)網(wǎng)絡(luò),以數(shù)學(xué)方式反映了生物學(xué)中有關(guān)基因和控制它們的分子的常見概念。通過這種方式,這對夫婦實際上迫使他們的機(jī)器學(xué)習(xí)算法以生物學(xué)家可以理解的方式處理數(shù)據(jù)。

Kinney解釋說,這些努力強(qiáng)調(diào)了如何優(yōu)化現(xiàn)代工業(yè)AI技術(shù)以用于生命科學(xué)。Kinney的實驗室已經(jīng)驗證了這種用于制作自定義ANN的新策略,并將其用于研究各種各樣的生物系統(tǒng),包括涉及人類疾病的關(guān)鍵基因電路。

鄭重聲明:本文版權(quán)歸原作者所有,轉(zhuǎn)載文章僅為傳播更多信息之目的,如作者信息標(biāo)記有誤,請第一時間聯(lián)系我們修改或刪除,多謝。