強(qiáng)強(qiáng)聯(lián)手 百度智能云機(jī)器學(xué)習(xí)平臺BML上線NVIDIA RAPIDS加速庫

原標(biāo)題:強(qiáng)強(qiáng)聯(lián)手 百度智能云機(jī)器學(xué)習(xí)平臺BML上線NVIDIA RAPIDS加速庫

近日,百度智能云與英偉達(dá)合作,通過容器化技術(shù)將RAPIDS庫封裝到機(jī)器學(xué)習(xí)平臺BML,并利用Kubernetes進(jìn)一步管理,做到了開箱即用,高效靈活。

RAPIDS是NVIDIA數(shù)據(jù)科學(xué)平臺,包括了一系列開源軟件庫和API,能夠完全地在GPU上加速數(shù)據(jù)科學(xué)、機(jī)器學(xué)習(xí)、深度學(xué)習(xí)和數(shù)據(jù)分析。在機(jī)器學(xué)習(xí)平臺BML,開發(fā)者只要準(zhǔn)備好數(shù)據(jù)和訓(xùn)練代碼,就可以快速啟動訓(xùn)練任務(wù)。在保護(hù)用戶數(shù)據(jù)安全的前提下,極大提升了訓(xùn)練的速度與便捷程度,為開發(fā)者帶來福音。

機(jī)器學(xué)習(xí)平臺BML,一站式開發(fā)與部署

百度智能云機(jī)器學(xué)習(xí)平臺BML是一款端到端的AI開發(fā)和部署平臺。基于機(jī)器學(xué)習(xí)平臺BML,用戶可以一站式完成數(shù)據(jù)處理、模型訓(xùn)練與評估、服務(wù)部署等工作。平臺提供高性能的集群訓(xùn)練環(huán)境,海量算法框架與模型案例,以及操作便捷的預(yù)測服務(wù)工具。用戶可以專注于模型與算法本身,并得到優(yōu)質(zhì)的模型與預(yù)測效果。

機(jī)器學(xué)習(xí)平臺BML包含工作區(qū)、訓(xùn)練和預(yù)測三大模塊。

工作區(qū)為用戶提供了基于Jupyter Lab的運(yùn)行環(huán)境,方便用戶輕松構(gòu)建深度學(xué)習(xí)模型并為訓(xùn)練任務(wù)做好準(zhǔn)備;訓(xùn)練模塊提供了豐富的機(jī)器學(xué)習(xí)框架以及自動調(diào)參工具,其中深度學(xué)習(xí)框架包括PaddlePaddle、TensorFlow和PyTorch,傳統(tǒng)機(jī)器學(xué)習(xí)包括RAPIDS cuML以及百度自研的機(jī)器學(xué)習(xí)算法;預(yù)測模塊可按照部署模型應(yīng)用的需求,合理的配置調(diào)度預(yù)測服務(wù)資源,搭建部署高可用的在線預(yù)測集群服務(wù)。支持部署多種深度學(xué)習(xí)框架、機(jī)器學(xué)習(xí)框架訓(xùn)練生成的模型種類,支持實(shí)現(xiàn)在線流量分流和A/B Test。

RAPIDS加速庫,更多熱門功能并提供 GPU 加速

RAPIDS是針對數(shù)據(jù)科學(xué)的NVIDIA GPU加速庫的集合,包括深度學(xué)習(xí)、機(jī)器學(xué)習(xí)和數(shù)據(jù)分析。基于CUDA-X AI,RAPIDS包括用于加速深度學(xué)習(xí)原語的cuDNN、用于加速機(jī)器學(xué)習(xí)算法的cuML、用于加速數(shù)據(jù)處理的cuDF、用于優(yōu)化推理的訓(xùn)練模型的TensorRT?以及超過15個其他的庫。它們一起與NVIDIA Tensor Core GPU無縫協(xié)作,加速開發(fā)和部署基于AI的應(yīng)用程序的端到端的工作流。CUDA-X AI可以集成到深度學(xué)習(xí)框架中,包括TensorFlow、PyTorch和MXNet。

RAPIDS通過cuDF加速庫,能夠讓GPU加速計(jì)算應(yīng)用到更多機(jī)器學(xué)習(xí)的算法與場景當(dāng)中,為數(shù)據(jù)科學(xué)家提供標(biāo)準(zhǔn)化的流水線式工具。例如,數(shù)據(jù)處理方面,RAPIDS將會通過數(shù)據(jù)準(zhǔn)備、數(shù)據(jù)合并、數(shù)據(jù)降維三個步驟加速處理數(shù)據(jù)。使得數(shù)據(jù)科學(xué)家可以加快迭代和測試速度,提供更準(zhǔn)確的預(yù)測結(jié)果,從而改善業(yè)務(wù)成果。

RAPIDS還引入了不斷發(fā)展壯大的全新GPU加速M(fèi)L算法(cuML)庫,其中包括XGBoost、Kalman、K-means、KNN、DBScan、PCA、TSVD、OLS 線性回歸、Random forest、Kalman Filtering 等算法。

BML+RAPIDS,開箱即用,快速安全

機(jī)器學(xué)習(xí)平臺BML通過容器化技術(shù)封裝了RAPIDS庫,并通過Kubernetes管理這些容器,具有開箱即用、啟動快速、安全等優(yōu)勢。目前機(jī)器學(xué)習(xí)平臺BML在訓(xùn)練模塊集成了RAPIDS庫,并且支持包含NVIDIA V100、P4 GPU在內(nèi)的多種GPU套餐。在訓(xùn)練模塊,用戶只要準(zhǔn)備好數(shù)據(jù)和訓(xùn)練代碼,就可以快速啟動基于RAPIDS的訓(xùn)練任務(wù)。

當(dāng)用戶啟動訓(xùn)練任務(wù)之后,機(jī)器學(xué)習(xí)平臺BML會自動下載用戶數(shù)據(jù)并啟動訓(xùn)練腳本;訓(xùn)練結(jié)束之后,平臺會自動上傳訓(xùn)練過程中日志和模型輸出,最后銷毀容器,平臺不會保留用戶的任何數(shù)據(jù),確保用戶數(shù)據(jù)的安全性。

如何在機(jī)器學(xué)習(xí)平臺BML平臺上,使用RAPIDS

在機(jī)器學(xué)習(xí)平臺BML的訓(xùn)練模塊中,選擇機(jī)器學(xué)習(xí),然后新建作業(yè)。如圖4-1所示,在新建作業(yè)頁面的算法或框架中,選擇RAPIDS-cuML。由于機(jī)器學(xué)習(xí)平臺BML提供了默認(rèn)配置,用戶只要點(diǎn)擊確定就可以快速啟動一個RAPIDS-cuML訓(xùn)練任務(wù)。

圖4-1 新建RAPIDS-cuML作業(yè)

對于用戶代碼,機(jī)器學(xué)習(xí)平臺BML提供了2種錄入方式:選取代碼文件和直接編輯代碼。在選取代碼文件中,用戶先上傳訓(xùn)練代碼到百度智能云的對象存儲中,然后在代碼文件路徑中指定路徑即可。在直接編輯代碼中,如圖4-2所示,機(jī)器學(xué)習(xí)平臺BML提供了多種RAPIDS-cuML代碼模版,用戶可以直接使用這些代碼模版。

圖4-2 直接編輯代碼的代碼模版

對于用戶數(shù)據(jù),分為輸入數(shù)據(jù)和輸出數(shù)據(jù)。輸入數(shù)據(jù)分為訓(xùn)練數(shù)據(jù)和測試數(shù)據(jù)。如果用戶想使用自己的數(shù)據(jù)進(jìn)行訓(xùn)練,可以先將數(shù)據(jù)上傳到百度智能云對象存儲中,然后在機(jī)器學(xué)習(xí)平臺BML中指定對應(yīng)的路徑。輸出數(shù)據(jù)包含訓(xùn)練過程中的日志和用戶保存在當(dāng)前輸出目錄下的內(nèi)容,由于要保存輸出數(shù)據(jù),因此輸出數(shù)據(jù)路徑是必選參數(shù)。目前輸出數(shù)據(jù)路徑支持百度智能云上的對象存儲,只要用戶設(shè)置一個對象存儲路徑即可。

集群配置中,用戶可以選擇機(jī)器學(xué)習(xí)平臺BML集群、資源套餐等配置。目前機(jī)器學(xué)習(xí)平臺BML支持RAPIDS-cuML單機(jī)訓(xùn)練任務(wù),可以選擇多種GPU套餐。在機(jī)器學(xué)習(xí)平臺BML的NVIDIA V100 GPU單卡套餐上,使用GPU加速的Kmeans訓(xùn)練任務(wù),可以獲得45倍以上的加速;使用GPU加速的XGBoost訓(xùn)練任務(wù),可以獲得33倍的加速。

注:GPU配置V100 16GB顯存;CPU配置Intel Xeon Gold 6148,12個邏輯核心。

機(jī)器學(xué)習(xí)作為人工智能的核心,是使機(jī)器具有智能的根本途徑,其應(yīng)用遍及人工智能的各個領(lǐng)域,一直是百度智能云研發(fā)的重點(diǎn)方向之一。百度智能云自主開發(fā)的端到端機(jī)器學(xué)習(xí)平臺BML,自面向企業(yè)與開發(fā)者開放之日起,就獲得了廣泛好評,這次與英偉達(dá)的強(qiáng)強(qiáng)聯(lián)手,更進(jìn)一步提升了機(jī)器學(xué)習(xí)平臺BML的性能。未來,百度智能云將繼續(xù)攜手更多合作伙伴,為各領(lǐng)域提供最先進(jìn)的技術(shù)與最全面的能力,助推產(chǎn)業(yè)智能化升級。

免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進(jìn)一步核實(shí),并對任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實(shí)內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。

2019-09-12
強(qiáng)強(qiáng)聯(lián)手 百度智能云機(jī)器學(xué)習(xí)平臺BML上線NVIDIA RAPIDS加速庫
目前機(jī)器學(xué)習(xí)平臺BML在訓(xùn)練模塊集成了RAPIDS庫,并且支持包含NVIDIA V100、P4 GPU在內(nèi)的多種GPU套餐。

長按掃碼 閱讀全文