Oracle宣布Oracle云數(shù)據(jù)科學(xué)平臺

2020-02-18 17:23:05    來源:    作者:

新服務(wù)使數(shù)據(jù)科學(xué)團隊能夠快速,輕松地協(xié)作構(gòu)建和部署強大的機器學(xué)習(xí)模型

Oracle宣布推出Oracle Cloud Data Science Platform。Oracle Cloud Infrastructure Data Science的核心是,它可以幫助企業(yè)協(xié)作構(gòu)建,訓(xùn)練,管理和部署機器學(xué)習(xí)模型,以提高數(shù)據(jù)科學(xué)項目的成功率。與其他專注于單個數(shù)據(jù)科學(xué)家的數(shù)據(jù)科學(xué)產(chǎn)品不同,Oracle云基礎(chǔ)架構(gòu)數(shù)據(jù)科學(xué)通過共享項目,模型目錄,團隊安全策略,可再現(xiàn)性和可審計性等功能來幫助提高數(shù)據(jù)科學(xué)團隊的效率。Oracle Cloud Infrastructure Data Science通過AutoML算法的選擇和調(diào)整,模型評估和模型解釋,自動選擇最佳的訓(xùn)練數(shù)據(jù)集。

Oracle宣布Oracle云數(shù)據(jù)科學(xué)平臺

如今,組織僅意識到數(shù)據(jù)巨大變革潛力中的一小部分,因為數(shù)據(jù)科學(xué)團隊無法輕松訪問正確的數(shù)據(jù)和工具來構(gòu)建和部署有效的機器學(xué)習(xí)模型。最終結(jié)果是,模型花費的時間太長,無法始終滿足企業(yè)對準(zhǔn)確性和魯棒性的要求,并且過于頻繁地永遠無法將其投入生產(chǎn)。

“有效的機器學(xué)習(xí)模型是成功的數(shù)據(jù)科學(xué)項目的基礎(chǔ),但是企業(yè)面臨的數(shù)據(jù)量和種類繁多,可能會使這些計劃在付諸實踐之前就停滯不前,” Oracle Data and AI產(chǎn)品開發(fā)高級副總裁Greg Pavlik說。服務(wù)。“借助Oracle Cloud Infrastructure Data Science,我們可以通過自動化其整個工作流程并增加強大的團隊支持協(xié)作來提高單個數(shù)據(jù)科學(xué)家的生產(chǎn)力,以幫助確保數(shù)據(jù)科學(xué)項目為企業(yè)帶來真正的價值。”

專為數(shù)據(jù)科學(xué)團隊和科學(xué)家而設(shè)計

Oracle Cloud Infrastructure Data Science包含自動化的數(shù)據(jù)科學(xué)工作流程,可通過以下功能節(jié)省時間并減少錯誤:

AutoML自動算法選擇和調(diào)整 使針對多種算法和超參數(shù)配置的運行測試過程自動化。它檢查結(jié)果的準(zhǔn)確性,并確認選擇了最佳模型和配置以供使用。這為數(shù)據(jù)科學(xué)家節(jié)省了大量時間,更重要的是,它旨在使每位數(shù)據(jù)科學(xué)家都能獲得與最有經(jīng)驗的從業(yè)人員相同的結(jié)果。

自動預(yù)測特征選擇 通過從大型數(shù)據(jù)集中自動識別關(guān)鍵預(yù)測特征來簡化特征工程。

模型評估會 生成一套全面的評估指標(biāo)和合適的可視化文件,以針對新數(shù)據(jù)衡量模型的性能,并可以隨時間對模型進行排名,以實現(xiàn)生產(chǎn)中的最佳行為。模型評估超出了原始性能,要考慮到預(yù)期的基線行為,并使用成本模型,以便可以完全合并誤報和誤報的不同影響。

Oracle宣布Oracle云數(shù)據(jù)科學(xué)平臺

模型說明: Oracle Cloud Infrastructure Data Science提供有關(guān)生成預(yù)測的因素的相對權(quán)重和重要性的自動說明。Oracle Cloud Infrastructure Data Science提供了不可知模型的第一個商業(yè)實現(xiàn)。例如,借助欺詐檢測模型,數(shù)據(jù)科學(xué)家可以解釋哪些因素是欺詐的最大驅(qū)動因素,因此企業(yè)可以修改流程或?qū)嵤┍Wo措施。

成功地將有效的機器學(xué)習(xí)模型成功投入生產(chǎn),不僅需要專門的人員。這需要數(shù)據(jù)科學(xué)家團隊共同合作。Oracle云基礎(chǔ)架構(gòu)數(shù)據(jù)科學(xué)提供強大的團隊功能,包括:

共享項目可 幫助用戶組織,啟用版本控制并可靠地共享團隊的工作,包括數(shù)據(jù)和筆記本會話。

使用模型目錄, 團隊成員可以可靠地共享已經(jīng)構(gòu)建的模型以及修改和部署它們所需的工件。

基于團隊的安全策略 允許用戶控制對模型,代碼和數(shù)據(jù)的訪問,這些模型,代碼和數(shù)據(jù)已與Oracle Cloud Infrastructure Identity and Access Management完全集成。

可再現(xiàn)性和可審計性 功能使企業(yè)能夠跟蹤所有相關(guān)資產(chǎn),從而即使團隊成員離開,也可以復(fù)制和審計所有模型。

借助Oracle Cloud Infrastructure Data Science,組織可以加速成功的模型部署,并產(chǎn)生企業(yè)級結(jié)果和性能以進行預(yù)測分析,以推動積極的業(yè)務(wù)成果。

全面的數(shù)據(jù)和機器學(xué)習(xí)服務(wù)

Oracle云數(shù)據(jù)科學(xué)平臺包括七項新服務(wù),這些服務(wù)可提供旨在加速和改善數(shù)據(jù)科學(xué)成果的全面的端到端體驗:

Oracle云基礎(chǔ)架構(gòu)數(shù)據(jù)科學(xué): 使用戶能夠使用Python和其他開源工具和庫(包括TensorFlow,Keras和Jupyter)在Oracle Clou上構(gòu)建,訓(xùn)練和管理新的機器學(xué)習(xí)模型。

Oracle自治數(shù)據(jù)庫中強大的新機器學(xué)習(xí)功能:機器學(xué)習(xí)算法緊密集成在 Oracle自治數(shù)據(jù)庫中, 并新增了對Python和自動機器學(xué)習(xí)的支持。即將與Oracle Cloud Infrastructure Data Science集成,將使數(shù)據(jù)科學(xué)家能夠使用開源和可伸縮的數(shù)據(jù)庫內(nèi)算法開發(fā)模型。獨特地,將算法應(yīng)用于Oracle數(shù)據(jù)庫中的數(shù)據(jù)可減少數(shù)據(jù)準(zhǔn)備和移動,從而加快了實現(xiàn)結(jié)果的速度。

Oracle Cloud Infrastructure數(shù)據(jù)目錄: 允許用戶發(fā)現(xiàn),查找,組織,豐富和跟蹤Oracle Cloud上的數(shù)據(jù)資產(chǎn)。Oracle Cloud Infrastructure數(shù)據(jù)目錄具有內(nèi)置的業(yè)務(wù)術(shù)語表,可輕松組織和發(fā)現(xiàn)正確的可信數(shù)據(jù)。

Oracle宣布Oracle云數(shù)據(jù)科學(xué)平臺

Oracle大數(shù)據(jù)服務(wù): 提供完整的Cloudera Hadoop實施,與其他Hadoop產(chǎn)品相比,其管理要簡單得多,只需單擊一下即可使集群具有高可用性并實現(xiàn)安全性。Oracle大數(shù)據(jù)服務(wù)還包括用于Spark的機器學(xué)習(xí),從而使組織可以使用一種產(chǎn)品和最少的數(shù)據(jù)移動在內(nèi)存中運行Spark機器學(xué)習(xí)。

Oracle Cloud SQL : 對HDFS,Hive,Kafka,NoSQL和對象存儲中的數(shù)據(jù)啟用SQL查詢。只有CloudSQL才能使能夠與Oracle數(shù)據(jù)庫對話的任何用戶,應(yīng)用程序或分析工具透明地使用其他數(shù)據(jù)存儲中的數(shù)據(jù),并具有下推,橫向擴展處理的優(yōu)勢,可最大程度地減少數(shù)據(jù)移動。

Oracle云基礎(chǔ)架構(gòu)數(shù)據(jù)流: 一項完全托管的大數(shù)據(jù)服務(wù),允許用戶在無需部署或管理基礎(chǔ)架構(gòu)的情況下運行Apache Spark應(yīng)用程序。它使企業(yè)能夠更快地交付大數(shù)據(jù)和AI應(yīng)用程序。與競爭的Hadoop和Spark服務(wù)不同,Oracle Cloud Infrastructure數(shù)據(jù)流包括一個窗口來跟蹤所有Spark作業(yè),從而使您可以輕松地識別昂貴的任務(wù)或解決問題。

面向數(shù)據(jù)科學(xué)的Oracle云基礎(chǔ)架構(gòu)虛擬機: 基于預(yù)配置的基于GPU的環(huán)境,具有常見的IDE,筆記本和框架,可以在15分鐘內(nèi)啟動并運行,每天收費30美元。

客戶在說什么

AgroScout致力于檢測早期農(nóng)作物病害,以提高農(nóng)作物產(chǎn)量,減少農(nóng)藥使用并增加利潤。“我們的愿景是使全球范圍內(nèi)有5億個農(nóng)場的10億農(nóng)民在經(jīng)濟上可以使用現(xiàn)代農(nóng)業(yè),占全球勞動力的30%。我們計劃通過提供基于云的,由AI驅(qū)動的可持續(xù)農(nóng)業(yè)技術(shù)來實現(xiàn)這一目標(biāo),它完全依賴于低成本無人機,手機和種植者的手動輸入的輸入,” Simcha Shore說,AgroScout創(chuàng)始人兼首席執(zhí)行官。“這一愿景的成功取決于管理連續(xù)不斷增長的輸入數(shù)據(jù)流的能力以及我們自己的基于AI的解決方案,以將數(shù)據(jù)大規(guī)模轉(zhuǎn)換為精確的決策農(nóng)業(yè)。Oracle Cloud的速度,規(guī)模和敏捷性幫助我們實現(xiàn)了夢想?,F(xiàn)在,最近增加的Oracle Cloud Infrastructure Data Science開辟了新的視野,它提高了我們的數(shù)據(jù)科學(xué)家協(xié)作構(gòu)建,訓(xùn)練和部署機器學(xué)習(xí)模型的能力。這種增加降低了成本,提高了效率,并幫助我們更快地擴大了全球足跡。”

IDenTV基于計算機視覺,自動語音識別和文本語義分類器支持的AI功能提供高級視頻分析。“借助Oracle云基礎(chǔ)架構(gòu)數(shù)據(jù)科學(xué),我們可以擴展我們的數(shù)據(jù)科學(xué)工作,以前所未有的速度提供業(yè)務(wù)價值。我們的數(shù)據(jù)科學(xué)團隊現(xiàn)在可以無縫訪問數(shù)據(jù),而不必擔(dān)心數(shù)據(jù)位置或訪問機制的復(fù)雜性。在使用嵌入到環(huán)境中的TensorFlow,Keras和Jupyter筆記本等開源功能時,我們可以簡化模型訓(xùn)練和部署任務(wù),從而節(jié)省大量成本并獲得更快的結(jié)果,” Amro Shihadah說道。,IDenTV創(chuàng)始人兼首席運營官。“我們認為Oracle云基礎(chǔ)架構(gòu)數(shù)據(jù)科學(xué)與自治數(shù)據(jù)庫的優(yōu)勢將為我們提供在市場上具有競爭力和獨特性所需的優(yōu)勢。”

鄭重聲明:本文版權(quán)歸原作者所有,轉(zhuǎn)載文章僅為傳播更多信息之目的,如作者信息標(biāo)記有誤,請第一時間聯(lián)系我們修改或刪除,多謝。