雙11可以說(shuō)是阿里巴巴龐大商業(yè)操作系統(tǒng)的集中展示,僅僅半個(gè)月之后,阿里巴巴宣布將其中一大重要業(yè)務(wù)板塊——阿里媽媽的重要技術(shù)框架進(jìn)行開(kāi)源,這也是該商業(yè)操作系統(tǒng)中最具商業(yè)價(jià)值的業(yè)務(wù)板塊之一。
作為阿里巴巴旗下的大數(shù)據(jù)營(yíng)銷(xiāo)平臺(tái),阿里媽媽基于自身廣告業(yè)務(wù),自主研發(fā)了深度學(xué)習(xí)框架X-Deep Learning(下文簡(jiǎn)稱(chēng)XDL),并已經(jīng)大規(guī)模部署應(yīng)用在核心生產(chǎn)場(chǎng)景。
這是阿里巴巴首次公開(kāi)的深度學(xué)習(xí)框架,也是業(yè)界首個(gè)面向高維稀疏數(shù)據(jù)場(chǎng)景的深度學(xué)習(xí)開(kāi)源框架,突破了現(xiàn)有深度學(xué)習(xí)開(kāi)源框架大都面向圖像、語(yǔ)音等低維稠密數(shù)據(jù)而設(shè)計(jì)的現(xiàn)狀,相關(guān)代碼鏈接將在12月中旬正式發(fā)布。
數(shù)據(jù)的高維稀疏性既是阿里媽媽業(yè)務(wù)場(chǎng)景的重要特征,也是互聯(lián)網(wǎng)的眾多核心應(yīng)用場(chǎng)景(如廣告/推薦/搜索等)的特征,覆蓋了大多數(shù)互聯(lián)網(wǎng)企業(yè)的數(shù)據(jù)應(yīng)用模式。對(duì)于難以與BAT研發(fā)能力比肩的眾多互聯(lián)網(wǎng)公司而言,工業(yè)級(jí)深度學(xué)習(xí)框架XDL及內(nèi)置算法方案的開(kāi)源,將助力各大公司的技術(shù)升級(jí),大大提升廣告/推薦/搜索場(chǎng)景的精準(zhǔn)性,縮短技術(shù)迭代周期。
面向廣告、推薦、搜索研發(fā),XDL覆蓋互聯(lián)網(wǎng)最核心的場(chǎng)景
隨著深度學(xué)習(xí)的風(fēng)靡,阿里媽媽以算法先行的方式進(jìn)行了探索,實(shí)驗(yàn)效果非常好,但很快也發(fā)現(xiàn),已有的開(kāi)源框架很難滿(mǎn)足其廣告場(chǎng)景的規(guī)模性及生產(chǎn)迭代要求,自研面向工業(yè)應(yīng)用的分布式深度學(xué)習(xí)框架隨即被提上了日程。
新框架XDL針對(duì)阿里媽媽業(yè)務(wù)數(shù)據(jù)高維稀疏的場(chǎng)景特點(diǎn)進(jìn)行了極致優(yōu)化,性能遠(yuǎn)超當(dāng)時(shí)業(yè)界眾多的開(kāi)源框架,自2016年下半年開(kāi)始逐步部署到阿里媽媽的業(yè)務(wù)系統(tǒng),至2017年初全面完成了生產(chǎn)化。以阿里媽媽定向廣告為例,XDL框架助力了業(yè)務(wù)場(chǎng)景所有核心算法的深度學(xué)習(xí)創(chuàng)新,當(dāng)年,以XDL為基礎(chǔ)的深度學(xué)習(xí)算法升級(jí)帶來(lái)的廣告收入提升超過(guò)百億。
不僅是廣告場(chǎng)景,互聯(lián)網(wǎng)其它的核心場(chǎng)景如推薦、搜索等,也具有典型的高維稀疏數(shù)據(jù)特性,例如微博、抖音、今日頭條等都屬于該范疇內(nèi)。因此,XDL在這些場(chǎng)景中也具有非常高的通用性,這為開(kāi)源提供了基礎(chǔ)。不管是以廣告、推薦、搜索為代表業(yè)務(wù)的企業(yè)級(jí)用戶(hù),還是對(duì)此感興趣的個(gè)人用戶(hù),都可以加入到開(kāi)源計(jì)劃當(dāng)中。
值得一提的是,在阿里巴巴XDL開(kāi)源之前,業(yè)界的深度學(xué)習(xí)開(kāi)源框架基本是面向圖像、語(yǔ)音處理等場(chǎng)景數(shù)據(jù)而設(shè)計(jì),這與整個(gè)人工智能領(lǐng)域的研究重點(diǎn)有關(guān),圖像和語(yǔ)音是率先取得理論突破的場(chǎng)景,但在工業(yè)級(jí)互聯(lián)網(wǎng)場(chǎng)景中實(shí)現(xiàn)大突破還屬首次。
開(kāi)放與易用,阿里巴巴引領(lǐng)業(yè)界高維稀疏數(shù)據(jù)的技術(shù)標(biāo)準(zhǔn)
據(jù)阿里媽媽透露,XDL框架從設(shè)計(jì)之初,就具備了足夠的開(kāi)放性和易用性,開(kāi)源是水到渠成的一步。
XDL創(chuàng)造性地采用了橋接的架構(gòu)設(shè)計(jì)理念,重點(diǎn)打造面向工業(yè)級(jí)應(yīng)用的分布式規(guī)模能力,單機(jī)能夠處理的計(jì)算則引用現(xiàn)有開(kāi)源框架。這種橋接的架構(gòu),使得XDL跟業(yè)界的開(kāi)源社區(qū)是無(wú)縫對(duì)接的,例如用戶(hù)可以非常方便地在XDL框架上應(yīng)用基于Tensorflow或者Pytorch編寫(xiě)的最先進(jìn)開(kāi)源深度學(xué)習(xí)算法。此外,對(duì)于已經(jīng)在使用其它開(kāi)源框架的企業(yè)或者個(gè)人用戶(hù),也可以在原有系統(tǒng)基礎(chǔ)上輕松進(jìn)行擴(kuò)展,享受XDL帶來(lái)的高維稀疏數(shù)據(jù)場(chǎng)景下極致的分布式能力。
除了核心的XDL訓(xùn)練框架外,阿里媽媽透露將全面開(kāi)源面向高維稀疏數(shù)據(jù)場(chǎng)景的系統(tǒng)化解決方案,計(jì)劃分批次對(duì)外發(fā)布,包括面向在線(xiàn)實(shí)時(shí)服務(wù)的高性能深度學(xué)習(xí)預(yù)估引擎、面向全庫(kù)實(shí)時(shí)檢索的全新深度學(xué)習(xí)匹配引擎;同時(shí)還內(nèi)置阿里媽媽自主研發(fā)的一系列創(chuàng)新算法,涉及CTR預(yù)估模型、CVR預(yù)估模型、匹配召回模型、模型壓縮訓(xùn)練算法等等。
阿里媽媽“讓天下沒(méi)有難做的營(yíng)銷(xiāo)”的使命在近年來(lái)又多了一層含義,Ad Tech 技術(shù)驅(qū)動(dòng)廣告的色彩明顯。阿里媽媽產(chǎn)品技術(shù)部資深總監(jiān)蓋坤表示,阿里媽媽不只自身在打造前沿的AI技術(shù),更希望通過(guò)技術(shù)開(kāi)源來(lái)賦能大家,推動(dòng)整個(gè)領(lǐng)域技術(shù)的前進(jìn),讓創(chuàng)新的算法方案層出不窮。
(免責(zé)聲明:本網(wǎng)站內(nèi)容主要來(lái)自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。
任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁(yè)或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書(shū)面權(quán)利通知或不實(shí)情況說(shuō)明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開(kāi)相關(guān)鏈接。 )