開源圖形機器學習庫StellarGraph今天推出了一系列用于網(wǎng)絡(luò)圖形分析的新算法,以幫助發(fā)現(xiàn)數(shù)據(jù)中的模式,使用更大的數(shù)據(jù)集并提高性能,同時減少內(nèi)存使用量。
StellarGraph通過其數(shù)據(jù)科學部門Data61隸屬于澳大利亞國家科學機構(gòu)CSIRO 。
欺詐和網(wǎng)絡(luò)犯罪等問題非常復雜,涉及來自許多來源的緊密連接的數(shù)據(jù)。
數(shù)據(jù)科學家在處理關(guān)聯(lián)數(shù)據(jù)時面臨的挑戰(zhàn)之一是如何理解實體之間的關(guān)系,而不是查看孤島中的數(shù)據(jù),以提供對問題的更深入的理解。
StellarGraph Library團隊負責人Tim Pitman說,解決巨大的挑戰(zhàn)需要比更簡單的算法所允許的更廣泛的上下文。
“將數(shù)據(jù)捕獲為網(wǎng)絡(luò)圖,使組織能夠了解他們要解決的問題的全部內(nèi)容,無論是執(zhí)法,了解遺傳疾病還是欺詐檢測。”
StellarGraph庫提供了用于圖形機器學習的最新算法,為數(shù)據(jù)科學家和工程師提供了在其自身的網(wǎng)絡(luò)數(shù)據(jù)上構(gòu)建,測試和試驗強大的機器學習模型的工具,使他們能夠查看模式并幫助應(yīng)用他們的研究解決了跨行業(yè)的現(xiàn)實世界問題。
“我們?yōu)閿?shù)據(jù)科學家開發(fā)了一個功能強大,直觀的圖形機器學習庫,該庫使最新的研究可以訪問,從而解決了許多行業(yè)的數(shù)據(jù)驅(qū)動型問題。”
CSIRO Data61團隊的1.0版發(fā)布了三種新算法到庫中,支持圖分類和時空數(shù)據(jù),此外還提供了一種新的圖數(shù)據(jù)結(jié)構(gòu),從而顯著降低了內(nèi)存使用量并提高了性能。
從時空數(shù)據(jù)中發(fā)現(xiàn)模式和知識變得越來越重要,并且對許多現(xiàn)實世界的現(xiàn)象具有深遠的影響,例如交通預測,空氣質(zhì)量,甚至可能是傳染病的移動和接觸追蹤,這些問題適合于深度學習框架,可以從跨時空收集的數(shù)據(jù)中學習。
新的圖分類算法的測試包括試驗訓練圖神經(jīng)網(wǎng)絡(luò)以預測分子的化學性質(zhì),這些進展可能使數(shù)據(jù)科學家和研究人員能夠找到抗病毒分子來抵抗感染,例如COVID-19。
庫提供廣泛的功能和增強的性能是三年來交付可訪問的,領(lǐng)先的算法的工作的高潮。
皮特曼先生說:“此版本中的新算法將庫開放給需要解決的新類型問題,包括欺詐檢測和道路交通預測。
“我們還使該庫更易于使用,并致力于優(yōu)化性能,使我們的用戶可以處理更大的數(shù)據(jù)。”
StellarGraph已被用于成功預測阿爾茨海默氏癥的基因,提供先進的人力資源分析和檢測比特幣勒索軟件,并且作為Data61研究的一部分,該技術(shù)目前正被用于基于基因組標記物預測小麥種群特征,這可能會改善基因組學選擇策略以增加谷物產(chǎn)量。
該技術(shù)可以應(yīng)用于跨行業(yè),政府和研究領(lǐng)域的網(wǎng)絡(luò)數(shù)據(jù)集,并且已經(jīng)開始探索將StellarGraph應(yīng)用于復雜的欺詐,醫(yī)學圖像和運輸數(shù)據(jù)集。
CSIRO Data61小組負責人調(diào)查分析負責人Alex Collins說:“組織面臨的挑戰(zhàn)是從其數(shù)據(jù)中獲取最大價值。使用網(wǎng)絡(luò)圖分析可以開辟新的方式來告知高風險,高影響力的決策。”