知識(shí)圖形數(shù)據(jù)管理引入企業(yè)

2019-06-20 19:18:39    來源:    作者:

Data.world連接數(shù)據(jù)和人。這是我們對(duì)data.world大約一年前發(fā)布其企業(yè)平臺(tái)的報(bào)道的要點(diǎn)。Data.world已經(jīng)取得了巨大的成功,今天它正在引入Capsenta將事情提升到一個(gè)新的水平。

簡(jiǎn)而言之,data.world使用知識(shí)圖(又稱關(guān)聯(lián)數(shù)據(jù),又名語(yǔ)義Web)技術(shù)的超級(jí)大國(guó)來整合數(shù)據(jù)集,并為企業(yè)提供數(shù)據(jù)管理和協(xié)作平臺(tái)。Capsenta擁有專利技術(shù),可幫助整合數(shù)據(jù)源(主要是關(guān)系數(shù)據(jù)源),并使其可作為知識(shí)圖表訪問,無論是在內(nèi)部還是在云中。

這兩家公司已經(jīng)合作了一段時(shí)間,它們不僅在技術(shù)上匹配,而且在文化上也是如此。ZDNet與data.world首席執(zhí)行官兼聯(lián)合創(chuàng)始人Brett Hurt和Capsenta創(chuàng)始人Juan Sequeda進(jìn)行了討論,后者將擔(dān)任data.world的首席科學(xué)家。

通過虛擬知識(shí)圖集成數(shù)據(jù)

赫特提到,最近的收購(gòu)浪潮證明了數(shù)據(jù)和分析正在成為企業(yè)的核心要素。他接著補(bǔ)充說,數(shù)據(jù)。世界的產(chǎn)品在企業(yè)中非常受歡迎,包括四大專業(yè)服務(wù)公司和十大美國(guó)投資銀行等客戶。

其中一些客戶處于高度監(jiān)管的行業(yè),例如醫(yī)療保健或金融,有時(shí)這會(huì)帶來挑戰(zhàn)。Data.world運(yùn)行云服務(wù),可以提取和編目數(shù)據(jù),元數(shù)據(jù)或兩者。在受監(jiān)管的行業(yè)中,將數(shù)據(jù)移動(dòng)到云可能不是一種選擇。這是Capsenta的Ultrawrap數(shù)據(jù)集成軟件的用武之地。

Sequeda十多年來一直致力于知識(shí)圖譜虛擬化,他非常了解這項(xiàng)技術(shù)的優(yōu)勢(shì)和劣勢(shì)。知識(shí)圖和SPARQL查詢語(yǔ)言是數(shù)據(jù)集成和編目方案的理想選擇。正如Sequeda所說,問題在于SPARQL在某些方面試圖重新發(fā)明輪子:

“我們擁有超過30年積累經(jīng)驗(yàn)的關(guān)系技術(shù),為什么不重用這個(gè)?”。因此,Capsenta的技術(shù)所做的就是充當(dāng)SPARQL和關(guān)系數(shù)據(jù)源之間的橋梁。查詢?cè)赟PARQL中制定,利用其支持許多不同數(shù)據(jù)源的能力,然后在SQL中進(jìn)行翻譯和執(zhí)行,其中這些數(shù)據(jù)源是關(guān)系型的。

可以保持原樣,而攝取的元數(shù)據(jù)可以用于使其成為跨越許多數(shù)據(jù)的知識(shí)圖的一部分在內(nèi)部和云端都有來源。Sequeda指出,Capsenta的解決方案增加了可忽略的開銷,有效地使云中SPARQL的執(zhí)行時(shí)間等于SQL內(nèi)部的執(zhí)行時(shí)間。

正如赫特提到的那樣,data.world已經(jīng)與Capsenta合作了大約一年半。最初,Capsenta是data.world的合作伙伴,但是大量的企業(yè)客戶意味著可以使用Capsenta技術(shù)的用例激增。反過來,這使得聯(lián)合力量成為下一步,正如赫特和塞奎達(dá)所說的那樣,“感覺我們應(yīng)該一直在一起工作”。

通過消費(fèi)者級(jí)UI構(gòu)建知識(shí)圖

這意味著沒有太多的集成要做,因?yàn)榇蟛糠炙呀?jīng)存在。但虛擬知識(shí)圖并不是Capsenta帶給桌面的唯一東西。Data.world是關(guān)于其技術(shù)堆棧的聲音,但同時(shí)希望讓最終用戶看不到它。他們稱之為消費(fèi)級(jí)用戶界面(UI)是其中的關(guān)鍵部分,而Capsenta的Gra.fo是完美的匹配。

Gra.fo是一個(gè)視覺知識(shí)圖編輯器,Capsenta大約在3年前開始以隱身模式工作。構(gòu)建知識(shí)圖并非完全不復(fù)雜。部分原因與底層數(shù)據(jù)模型的復(fù)雜性有關(guān)。雖然市場(chǎng)上有一些用于構(gòu)建知識(shí)圖的可視化工具,但Sequeda覺得缺少了某些東西。

鄭重聲明:本文版權(quán)歸原作者所有,轉(zhuǎn)載文章僅為傳播更多信息之目的,如作者信息標(biāo)記有誤,請(qǐng)第一時(shí)間聯(lián)系我們修改或刪除,多謝。