你是不是也曾在人聲鼎沸的超市里,剛精挑細(xì)選好幾樣新鮮蔬菜水果,扭頭卻看到待稱重的隊(duì)伍已排到“天際”。生活真是時(shí)不時(shí)就要來點(diǎn)無奈,打散你我心里的“小確幸”。那是否存在一種“聰明”的機(jī)器,它可自行辨認(rèn)物品并結(jié)合重量“一步到位,自食其力”地計(jì)算出總價(jià),免去排長隊(duì)等稱重的步驟呢?事實(shí)上,它存在——飛槳企業(yè)版EasyDL零門檻AI開發(fā)平臺的全新升級帶著更快速易用的解決方案來了!
5月20日“WAVE SUMMIT 2020”深度學(xué)習(xí)開發(fā)者峰會(huì)上,百度AI開發(fā)平臺部總監(jiān)忻舟宣布EasyDL全新升級,重磅發(fā)布了業(yè)內(nèi)首個(gè)專注于AI開發(fā)領(lǐng)域的智能數(shù)據(jù)服務(wù)平臺EasyData,進(jìn)一步加強(qiáng)數(shù)據(jù)管理與加工能力,并在完整地支持Master模式的訓(xùn)練與開發(fā)、端云一體服務(wù)部署方面帶來了4項(xiàng)重要升級。
(圖:EasyDL平臺的全新發(fā)布與重要升級)
據(jù)介紹,EasyDL已成為目前市場上重點(diǎn)面向中小企業(yè)功能最全的一站式AI開發(fā)平臺。以“簡單、專業(yè)”為最核心理念的EasyDL希望通過平臺建立一條連接需求和復(fù)雜技術(shù)之間鴻溝的橋梁,幫助開發(fā)者實(shí)現(xiàn)零門檻AI開發(fā),從繁雜的數(shù)據(jù)準(zhǔn)備、環(huán)境配置、代碼開發(fā)和服務(wù)部署中脫身,專注于業(yè)務(wù)與創(chuàng)新。
由于大量開發(fā)者在結(jié)合業(yè)務(wù)進(jìn)行模型訓(xùn)練前,常常深受“數(shù)據(jù)”一環(huán)的困擾,因此EasyDL此次全新推出EasyData, 面向AI開發(fā)領(lǐng)域,提供了一站式數(shù)據(jù)采集、清洗、標(biāo)注、擴(kuò)充、數(shù)據(jù)閉環(huán)等能力,與EasyDL模型訓(xùn)練和部署環(huán)節(jié)配合,幫助開發(fā)者更高效更低成本的解決AI開發(fā)及應(yīng)用過程中遇到的數(shù)據(jù)問題。
首先,在采集環(huán)節(jié)EasyData提供了業(yè)內(nèi)首發(fā)的軟硬一體、端云協(xié)同的自動(dòng)數(shù)據(jù)采集方案,極大降低了開發(fā)者在“設(shè)備選型、調(diào)測和集成開發(fā)工作上的成本”,將數(shù)據(jù)采集效率從“周級”提升到“小時(shí)級”。緊接著,針對采回的數(shù)據(jù),平臺還提供自動(dòng)數(shù)據(jù)清洗方案,將人工處理成本降低80%。而針對AI開發(fā)中另一耗費(fèi)時(shí)間的“數(shù)據(jù)標(biāo)注”環(huán)節(jié),EasyData可提供豐富的智能標(biāo)注方案,支持物體檢測、圖像分割和文本分類三種任務(wù)場景,只需標(biāo)注少量數(shù)據(jù),即可通過啟動(dòng)“智能標(biāo)注”自動(dòng)挖掘難例,并通過標(biāo)注難例加速提升系統(tǒng)效果。與以往相同任務(wù)相比,基于EasyData智能標(biāo)注解決方案,達(dá)到同等模型效果的數(shù)據(jù)標(biāo)注量平均減少70%。在之后的模型訓(xùn)練與發(fā)布環(huán)節(jié),自動(dòng)數(shù)據(jù)閉環(huán)使得整體模型迭代周期從月到周甚至到天,極大提升了AI開發(fā)全流程效率。
舉例來看,果蔬智能識別系統(tǒng)開發(fā)企業(yè)中科立業(yè)基于EasyDL快速開發(fā)的“智能云秤”已落地20家店鋪,通過秤上的攝像頭來智能判斷商品,實(shí)現(xiàn)稱重結(jié)算一步到位。而在此前的實(shí)際開發(fā)中,中科立業(yè)遇到遮擋、光線影響、樣本多樣性等數(shù)據(jù)問題,在接入EasyDL后,基于EasyData 的自動(dòng)去模糊、過濾無效圖像、智能標(biāo)注和數(shù)據(jù)增強(qiáng),每天可以自動(dòng)收集7000張有效樣本,整體減少了80%的數(shù)據(jù)處理量和70%的人工成本,通過EasyDL Master模式,快速實(shí)現(xiàn)模型開發(fā),對50種水果實(shí)現(xiàn)智能識別,準(zhǔn)確率超過95%。
此次峰會(huì)中,EasyDL平臺除了針對數(shù)據(jù)管理方面全新發(fā)布了EasyData,還針對AI開發(fā)中的其他環(huán)節(jié)進(jìn)行了4項(xiàng)全新升級。首先,EasyDL平臺對預(yù)訓(xùn)練模型、預(yù)置算法進(jìn)行了升級,使Master模式應(yīng)用更簡單高效。如在NLP領(lǐng)域預(yù)置了效果領(lǐng)先的ERNIE2.0模型,將持續(xù)針對醫(yī)療、法律等專業(yè)領(lǐng)域擴(kuò)展“領(lǐng)域模型”;在CV領(lǐng)域則預(yù)置了“超大規(guī)模視覺”預(yù)訓(xùn)練模型,大幅提升通用分類和檢測的模型效果,并在零售、安防等領(lǐng)域發(fā)展場景化預(yù)置模型。EasyDL平臺目前共預(yù)置了36套經(jīng)典NLP網(wǎng)絡(luò)與模型組合、26套經(jīng)典CV網(wǎng)絡(luò)與模型組合,支持開發(fā)者更加高效快捷地進(jìn)行模型開發(fā)。
其次,自動(dòng)數(shù)據(jù)增強(qiáng)和超參搜索能力也針對實(shí)際的工業(yè)應(yīng)用做了優(yōu)化。其中,自動(dòng)數(shù)據(jù)增強(qiáng)方面,平臺開放超過40種數(shù)據(jù)增強(qiáng)算子,可靈活配置,基于工業(yè)級搜索算法實(shí)現(xiàn)更高的搜索效率。同時(shí),對于自動(dòng)超參搜索,創(chuàng)新基于隨機(jī)微分方程的無梯度優(yōu)化的調(diào)參算法,收斂速度快,不依賴平滑性假設(shè),可支持大規(guī)模并行搜索調(diào)參。這使得EasyDL線上多場景模型精度平均提升10%以上。另外,分布式訓(xùn)練加速也是EasyDL平臺的一大特點(diǎn),基于PaddlePaddle DGC的優(yōu)化,在常見的沒有專門經(jīng)過通信優(yōu)化的公有云環(huán)境中,能夠使訓(xùn)練時(shí)長平均減少70%。
總體來看,由于AI核心算法發(fā)展迅速,效果和復(fù)雜度不斷提升,并且涉及到數(shù)據(jù)處理、環(huán)境配置、結(jié)果分析、模型部署、運(yùn)行監(jiān)控等等,龐雜繁復(fù)的各環(huán)節(jié),讓專注于各自領(lǐng)域的企業(yè),對于所需的“定制AI開發(fā)”往往存在門檻過高的現(xiàn)象。而EasyDL為了讓各領(lǐng)域企業(yè)在進(jìn)行“智能化”升級時(shí)可解放更多人力與資源聚焦在業(yè)務(wù)與創(chuàng)新上,在降低技術(shù)門檻、加快開發(fā)的同時(shí),也確保了核心AI開發(fā)體驗(yàn)的順暢和效果。例如,瀚才獵頭作為一家只有5個(gè)人力資源專家組成的創(chuàng)業(yè)公司,借助EasyDL智能標(biāo)注和預(yù)訓(xùn)練模型ERNIE,公司的人力資源專家輕松快速,且具有行業(yè)創(chuàng)新性地將房地產(chǎn)行業(yè)“簡歷數(shù)據(jù)”建立了分類模型,針對100多個(gè)細(xì)分職業(yè)和11個(gè)通用職級進(jìn)行分類,讓員工在面對“背景經(jīng)驗(yàn)差距巨大”卻是同一職位名稱的候選人時(shí)可進(jìn)行更高效的篩選匹配。而該模型只使用了1萬條標(biāo)注數(shù)據(jù),就達(dá)到了95%以上的準(zhǔn)確率,讓人才檢索效率迅速提升200倍。
(免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進(jìn)一步核實(shí),并對任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。
任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。 )