明略科技機(jī)器學(xué)習(xí)平臺(tái)的功能亮點(diǎn)與落地實(shí)踐

近日,由國內(nèi)專業(yè)咨詢機(jī)構(gòu)百林哲匠心打造的軟件行業(yè)技術(shù)領(lǐng)域頂級(jí)盛會(huì)——2020 CSDI Summit中國軟件研發(fā)管理行業(yè)技術(shù)峰會(huì),成功舉辦。本屆大會(huì),以“上云+轉(zhuǎn)型,探索未來:產(chǎn)業(yè)智能,部署技術(shù)新邊界”為主題,吸引了來自微軟、Google、阿里、華為等國內(nèi)外知名科技企業(yè)的行業(yè)領(lǐng)袖和一線研發(fā)技術(shù)專家,共同探討大數(shù)據(jù)和AI技術(shù)浪潮下的軟件研發(fā)趨勢(shì),明略科技高級(jí)總監(jiān)劉喆受邀分享機(jī)器學(xué)習(xí)平臺(tái)的建設(shè)與落地實(shí)踐。

據(jù)悉,明略科技的機(jī)器學(xué)習(xí)平臺(tái),基于內(nèi)部數(shù)據(jù)科學(xué)家的需求而孵化,經(jīng)過小版本不斷迭代升級(jí),逐漸完善整個(gè)平臺(tái)的搭建,最終實(shí)現(xiàn)不同部門的數(shù)據(jù)科學(xué)家用統(tǒng)一的平臺(tái)進(jìn)行模型的開發(fā)、發(fā)布、使用和分享。同時(shí),成功整合了內(nèi)部的計(jì)算、存儲(chǔ)資源,互通共享。目前,明略科技機(jī)器學(xué)習(xí)平臺(tái)正服務(wù)于金融、汽車、美妝、快消等多個(gè)領(lǐng)域的標(biāo)桿性客戶。

從內(nèi)部客戶到外部客戶,離不開對(duì)用戶的需求洞察。劉喆指出,數(shù)據(jù)科學(xué)家和模型使用者,對(duì)機(jī)器學(xué)習(xí)平臺(tái)訴求不同。就數(shù)據(jù)科學(xué)家而言,專注做算法產(chǎn)出模型是核心需求,開發(fā)環(huán)境準(zhǔn)備以及數(shù)據(jù)接入、模型上線等工程化工作盡量平臺(tái)自動(dòng)化完成。而模型使用者,需要的是模型量多,多版本易切換,模型評(píng)分和推薦機(jī)制,有API服務(wù),性能高,訪問速度快。

基于此,明略科技的機(jī)器學(xué)習(xí)平臺(tái),把寫代碼作為系統(tǒng)的核心,兼容notebook方式,增強(qiáng)了各種定制化的功能,支持R語言、Python、Spark,甚至Spark集群。預(yù)先準(zhǔn)備了多種開發(fā)環(huán)境,包括Torch、TensorFlow,GPU、CPU、分布式、Spark,開箱即用。針對(duì)數(shù)據(jù)清洗,數(shù)據(jù)對(duì)齊和數(shù)據(jù)標(biāo)準(zhǔn)化工作,提供了多種工具??蓪?shí)現(xiàn)一鍵上線,生成SDK或者API形式??紤]到不同的行業(yè)存在不同的場(chǎng)景,平臺(tái)還能發(fā)布Docker image,Yaml文件,把整體開發(fā)環(huán)境打包使用。自動(dòng)化方面,平臺(tái)專門提供調(diào)度系統(tǒng)HummingBird,可以每一步在notebook自己寫,也可以調(diào)用外部組件,進(jìn)行組合。

此外,平臺(tái)提供模型生命周期的統(tǒng)一管理,確保模型服務(wù)的標(biāo)準(zhǔn)化,以及模型的穩(wěn)定、高效、高可用性。具體而言,通過Model Market,統(tǒng)一管理各個(gè)渠道的模型匯總。不同部門的每個(gè)模型有多個(gè)不同版本,會(huì)告訴用戶每個(gè)版本有哪些功能提升,并按標(biāo)簽分類,依據(jù)模型調(diào)用次數(shù)進(jìn)行排名,并且用戶和系統(tǒng)均可對(duì)模型進(jìn)行評(píng)分。同時(shí),通過自主研發(fā)的Model Serving,提供標(biāo)準(zhǔn)化模型服務(wù),包括SDK、API形式。例如,一個(gè)100兆的模型,輸入100多個(gè)維度,時(shí)延不超過5毫秒,以此為基準(zhǔn)線,實(shí)現(xiàn)多實(shí)力、高可用,無斷點(diǎn)。

在具體的實(shí)踐中,國內(nèi)某大型銀行應(yīng)用明略科技機(jī)器學(xué)習(xí)平臺(tái)進(jìn)行用戶升等和信用卡的AI推薦。通過運(yùn)用Notebook、Model Serving、統(tǒng)一存儲(chǔ)、模型訓(xùn)練和特征分組等功能,甄別什么樣的用戶愿意升級(jí)成什么等級(jí)的卡別,判斷什么樣的用戶更有意向調(diào)整信用額度,不會(huì)逾期,以及給用戶每筆消費(fèi)做短信提醒的貼尾推薦等,實(shí)現(xiàn)AI能力對(duì)業(yè)務(wù)的賦能和價(jià)值挖掘。

(免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。
任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。 )