新算法可幫助科學家連接來自多個來源的數(shù)據(jù)點,以解決高風險問題

2020-05-07 17:29:25    來源:新經(jīng)網(wǎng)    作者:馮思韻

開源圖形機器學習庫StellarGraph今天推出了一系列用于網(wǎng)絡(luò)圖形分析的新算法,以幫助發(fā)現(xiàn)數(shù)據(jù)中的模式,使用更大的數(shù)據(jù)集并提高性能,同時減少內(nèi)存使用量。

新算法可幫助科學家連接來自多個來源的數(shù)據(jù)點,以解決高風險問題

StellarGraph通過其數(shù)據(jù)科學部門Data61隸屬于澳大利亞國家科學機構(gòu)CSIRO 。

欺詐和網(wǎng)絡(luò)犯罪等問題非常復雜,涉及來自許多來源的緊密連接的數(shù)據(jù)。

數(shù)據(jù)科學家在處理關(guān)聯(lián)數(shù)據(jù)時面臨的挑戰(zhàn)之一是如何理解實體之間的關(guān)系,而不是查看孤島中的數(shù)據(jù),以提供對問題的更深入的理解。

StellarGraph Library團隊負責人Tim Pitman說,解決巨大的挑戰(zhàn)需要比更簡單的算法所允許的更廣泛的上下文。

“將數(shù)據(jù)捕獲為網(wǎng)絡(luò)圖,使組織能夠了解他們要解決的問題的全部內(nèi)容,無論是執(zhí)法,了解遺傳疾病還是欺詐檢測。”

StellarGraph庫提供了用于圖形機器學習的最新算法,為數(shù)據(jù)科學家和工程師提供了在其自身的網(wǎng)絡(luò)數(shù)據(jù)上構(gòu)建,測試和試驗強大的機器學習模型的工具,使他們能夠查看模式并幫助應(yīng)用他們的研究解決了跨行業(yè)的現(xiàn)實世界問題。

“我們?yōu)閿?shù)據(jù)科學家開發(fā)了一個功能強大,直觀的圖形機器學習庫,該庫使最新的研究可以訪問,從而解決了許多行業(yè)的數(shù)據(jù)驅(qū)動型問題。”

CSIRO Data61團隊的1.0版發(fā)布了三種新算法到庫中,支持圖分類和時空數(shù)據(jù),此外還提供了一種新的圖數(shù)據(jù)結(jié)構(gòu),從而顯著降低了內(nèi)存使用量并提高了性能。

從時空數(shù)據(jù)中發(fā)現(xiàn)模式和知識變得越來越重要,并且對許多現(xiàn)實世界的現(xiàn)象具有深遠的影響,例如交通預測,空氣質(zhì)量,甚至可能是傳染病的移動和接觸追蹤,這些問題適合于深度學習框架,可以從跨時空收集的數(shù)據(jù)中學習。

新的圖分類算法的測試包括試驗訓練圖神經(jīng)網(wǎng)絡(luò)以預測分子的化學性質(zhì),這些進展可能使數(shù)據(jù)科學家和研究人員能夠找到抗病毒分子來抵抗感染,例如COVID-19。

庫提供廣泛的功能和增強的性能是三年來交付可訪問的,領(lǐng)先的算法的工作的高潮。

皮特曼先生說:“此版本中的新算法將庫開放給需要解決的新類型問題,包括欺詐檢測和道路交通預測。

“我們還使該庫更易于使用,并致力于優(yōu)化性能,使我們的用戶可以處理更大的數(shù)據(jù)。”

StellarGraph已被用于成功預測阿爾茨海默氏癥的基因,提供先進的人力資源分析和檢測比特幣勒索軟件,并且作為Data61研究的一部分,該技術(shù)目前正被用于基于基因組標記物預測小麥種群特征,這可能會改善基因組學選擇策略以增加谷物產(chǎn)量。

該技術(shù)可以應(yīng)用于跨行業(yè),政府和研究領(lǐng)域的網(wǎng)絡(luò)數(shù)據(jù)集,并且已經(jīng)開始探索將StellarGraph應(yīng)用于復雜的欺詐,醫(yī)學圖像和運輸數(shù)據(jù)集。

CSIRO Data61小組負責人調(diào)查分析負責人Alex Collins說:“組織面臨的挑戰(zhàn)是從其數(shù)據(jù)中獲取最大價值。使用網(wǎng)絡(luò)圖分析可以開辟新的方式來告知高風險,高影響力的決策。”

鄭重聲明:本文版權(quán)歸原作者所有,轉(zhuǎn)載文章僅為傳播更多信息之目的,如作者信息標記有誤,請第一時間聯(lián)系我們修改或刪除,多謝。