最新消息,騰訊開源項(xiàng)目Angel從LF AI基金會畢業(yè),也是中國首個從LF AI基金會畢業(yè)的開源項(xiàng)目。
騰訊云副總裁、騰訊數(shù)據(jù)平臺部總經(jīng)理蔣杰表示:“畢業(yè)是Angel新的開始,未來我們將進(jìn)一步開放Angel在圖計(jì)算和聯(lián)邦學(xué)習(xí)領(lǐng)域的核心能力。”
騰訊首個AI開源項(xiàng)目已長成
Angel是騰訊的首個AI開源項(xiàng)目,于 2016 年底推出、2017年開源。作為面向機(jī)器學(xué)習(xí)的第三代高性能計(jì)算平臺,Angel致力于解決稀疏數(shù)據(jù)大模型訓(xùn)練以及大規(guī)模圖數(shù)據(jù)分析問題。騰訊在2018年成為LF AI基金會的創(chuàng)始白金會員之一,并于同年向基金會貢獻(xiàn)了開源項(xiàng)目Angel。
據(jù)LF AI 基金會董事、騰訊AI專家肖涵介紹,LF AI基金會對開源項(xiàng)目的畢業(yè)流程有非常嚴(yán)格的規(guī)定,基于項(xiàng)目的技術(shù)含量、開源生態(tài)、社區(qū)互動等維度,嚴(yán)格評估項(xiàng)目的成熟度,最終由董事會投票決定能否準(zhǔn)予畢業(yè)。能夠從LF AI畢業(yè),意味著項(xiàng)目已經(jīng)得到全球技術(shù)專家的認(rèn)可,成為最頂級的AI開源項(xiàng)目。
Angel在基金會的孵化過程中獲得了快速發(fā)展,并完成了從2.0版本到3.0版本的跨越,從一個單純的模型訓(xùn)練系統(tǒng)進(jìn)化成包含從自動特征工程到模型服務(wù)的全棧機(jī)器學(xué)習(xí)平臺。
Angel的特征工程模塊基于Spark開發(fā),增強(qiáng)了Spark的特征選擇功能,同時使用特征交叉和重索引實(shí)現(xiàn)了自動特征生成。這些組件可以無縫地整合進(jìn)Spark的流水線。為了讓整個系統(tǒng)更加的智能,Angel 3.0新增了超參數(shù)調(diào)節(jié)的功能。
在模型服務(wù)方面,Angel 3.0提供了一個跨平臺的組件Angel Serving,不僅可以滿足Angel自身的需求,還可以為其他平臺提供模型服務(wù)。在生態(tài)方面,Angel也嘗試將參數(shù)服務(wù)器(PS)能力共享給其他的計(jì)算平臺,目前已經(jīng)完成了Spark On Angel和PyTorch On Angel兩個平臺的建設(shè)。
在3.0版本中,Angel重點(diǎn)研發(fā)了圖機(jī)器學(xué)習(xí)功能,包括圖表示和圖神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)模型,同時提供預(yù)處理、圖挖掘等端到端數(shù)據(jù)處理能力,具有豐富的算法庫,提供了同構(gòu)圖、異構(gòu)圖多種圖計(jì)算范式和不同種類的圖算法。經(jīng)過騰訊內(nèi)部業(yè)務(wù)的大規(guī)模實(shí)踐,Angel在圖算法性能上同樣表現(xiàn)出眾,例如十億節(jié)點(diǎn)、千億邊規(guī)模的圖結(jié)構(gòu),運(yùn)行算法時能以Spark GraphX三分之一的計(jì)算資源,達(dá)到十倍處理性能。
除了技術(shù)功能上的完善,Angel在社區(qū)生態(tài)上也日趨成熟。據(jù)了解,在全行業(yè)Angel擁有超過 100家公司和機(jī)構(gòu)用戶,其中包括微博、華為、微眾銀行、小米、滴滴等大型互聯(lián)網(wǎng)企業(yè)?;贏ngel構(gòu)建的一站式機(jī)器學(xué)習(xí)應(yīng)用平臺智能鈦TI,支持了包括微信支付、騰訊廣告、微視等在內(nèi)的諸多騰訊內(nèi)部產(chǎn)品,同時也通過騰訊云對外開放為更多行業(yè)企業(yè)提供服務(wù)。
截止目前,Angel在GitHub上已經(jīng)獲得了5500 Star,1400 Fork,在技術(shù)、應(yīng)用、生態(tài)等方面的優(yōu)秀表現(xiàn)均得到了開源社區(qū)的認(rèn)可。此前在騰訊2019 Techo開發(fā)者大會上,蔣杰還宣布了資源管理平臺核心TKE和分布式數(shù)據(jù)庫TBase的正式開源。騰訊正在成為大數(shù)據(jù)領(lǐng)域開源最全面的公司。
2019,騰訊的開源大年
開源協(xié)同是當(dāng)前騰訊最重要的技術(shù)戰(zhàn)略之一。在今年的重慶智博會上,騰訊公司董事會主席兼首席執(zhí)行官馬化騰專門提及了對開源的重視,他表示,騰訊希望在科研領(lǐng)域投入更多力量,將通過內(nèi)外部開源等方式,積極參與“全球科技共同體”的共建。
截止2019年11月,僅在Github上,騰訊就開源了91個項(xiàng)目,有超過1000個貢獻(xiàn)者參與,獲得超過26萬個Star數(shù),在Github全球公司貢獻(xiàn)榜上居于前列。騰訊還加入了Linux、Apache等9大開源基金會,并成為最高級別會員。其中LF AI基金會是由Linux基金會發(fā)起的人工智能領(lǐng)域的專項(xiàng)開源基金會,旨在倡導(dǎo)和組織AI開源平臺和工具共同參與建設(shè),共同享有IP知識產(chǎn)權(quán),創(chuàng)建可持續(xù)發(fā)展的開源AI生態(tài)系統(tǒng)。
2018年,騰訊因在AI開源領(lǐng)域的卓越技術(shù)影響力,受邀作為LF AI基金會的初始白金會員加入,擁有董事會和技術(shù)咨詢委員會席位,并于同年向基金會捐贈高性能分布式機(jī)器學(xué)習(xí)平臺Angel。
(免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進(jìn)一步核實(shí),并對任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負(fù)任何法律責(zé)任。
任何單位或個人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實(shí)內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。 )