Kubeflow的第一個(gè)穩(wěn)定版本(由Google LLC支持的工具包,用于在Kubernetes上運(yùn)行人工智能工作負(fù)載)今天正式可用。
Kubeflow在2017年由一組Google工程師和其他科技公司的一些同行開源。它是一個(gè)工具套件,使組織能夠在由流行的容器編排框架Kubernetes支持的基礎(chǔ)架構(gòu)上部署AI工作負(fù)載。
Kubeflow 1.0版本引入了該軟件幾個(gè)核心組件的整數(shù)版本。這些組件現(xiàn)在符合企業(yè)用戶需求的“定義的穩(wěn)定性,可支持性和可升級(jí)性級(jí)別”,這意味著該工具包作為一個(gè)整體現(xiàn)在更適合生產(chǎn)使用。
Kubeflow 1.0帶來(lái)了穩(wěn)定的內(nèi)置管理控制臺(tái)版本,其中包含關(guān)鍵功能的快捷方式。這些功能之一是Jupyter Notebook控制器,該控制器也已升級(jí)到穩(wěn)定狀態(tài),并允許AI團(tuán)隊(duì)使用無(wú)處不在的Jupyter Notebook開發(fā)工具創(chuàng)建新的機(jī)器學(xué)習(xí)模型。
模型準(zhǔn)備好后,用戶可以使用TensorFlow或PyTorch對(duì)其進(jìn)行訓(xùn)練。Kubeflow 1.0通過(guò)TFJob和PyTorch Operator兩者都支持,這兩個(gè)代碼抽象使開發(fā)人員可以使用他們選擇的框架和相對(duì)簡(jiǎn)單的腳本來(lái)設(shè)置AI培訓(xùn)工作流。
今天的版本還為管理員提供了一些功能,這些管理員可以管理開發(fā)人員在其上構(gòu)建AI工作負(fù)載的基礎(chǔ)架構(gòu)。有一個(gè)kfctl,它可以在云環(huán)境中自動(dòng)部署Kubeflow,并具有可以在各個(gè)開發(fā)人員之間分配環(huán)境資源的控件。
Google開源戰(zhàn)略家Thea Lamkin在博客文章中詳細(xì)介紹:“有了Kubeflow,每個(gè)數(shù)據(jù)科學(xué)家或團(tuán)隊(duì)都可以得到一個(gè)自己的命名空間,可以在其中運(yùn)行他們的工作負(fù)載。” 命名空間提供了安全性和資源隔離。使用Kubernetes資源配額,平臺(tái)管理員可以輕松限制個(gè)人或團(tuán)隊(duì)可以消耗多少資源,以確保公平的調(diào)度。”
在另一篇文章中,Google云工程師Jeremy Lewi和Abhishek Gupta寫道,公司可以在其Anthos應(yīng)用程序平臺(tái)上部署Kubeflow 1.0,以利用這些新功能。展望未來(lái),這家搜索巨頭計(jì)劃加強(qiáng)對(duì)AI工具包的支持。Google將允許企業(yè)在本地Anthos部署上設(shè)置Kubeflow,并將與Google Cloud的網(wǎng)絡(luò)安全功能添加更緊密的集成。