阿里發(fā)布千億參數(shù)規(guī)模AI模型,可設(shè)計30多種物品高清圖像

3月2日,阿里巴巴與清華大學(xué)聯(lián)合發(fā)布業(yè)界最大的中文多模態(tài)預(yù)訓(xùn)練AI模型M6,該模型參數(shù)規(guī)模超千億,同時具備文本、圖像的理解和生成能力,圖像設(shè)計效率超越人類,可應(yīng)用于產(chǎn)品設(shè)計、信息檢索、機器人對話、文學(xué)創(chuàng)作等領(lǐng)域。

阿里M6模型根據(jù)文本內(nèi)容,自動設(shè)計特定風(fēng)格圖片

預(yù)訓(xùn)練語言模型是讓AI具備認(rèn)知能力的關(guān)鍵技術(shù),它突破了傳統(tǒng)深度學(xué)習(xí)方法的瓶頸,是一種新型AI訓(xùn)練思路,即首先自動學(xué)習(xí)大量語言文字和圖像數(shù)據(jù),記憶和理解人類豐富的先驗知識,再進(jìn)一步學(xué)習(xí)專業(yè)領(lǐng)域信息,從而讓AI同時掌握常識和專業(yè)知識。目前,谷歌、微軟和 Facebook等企業(yè)已投入該技術(shù)的研發(fā)。

此次發(fā)布的M6模型參數(shù)規(guī)模達(dá)到1000億,是多模態(tài)預(yù)訓(xùn)練領(lǐng)域史上最大的模型,其理解和生成能力超越傳統(tǒng)AI。以圖像生成為例,模型可設(shè)計包括服飾、鞋類、家具、首飾、書籍等在內(nèi)的30多個物品類別的圖像,最短一分鐘即可完成作品的創(chuàng)作,效率超越普通設(shè)計師。

阿里M6模型自動生成相關(guān)圖像效果

M6的突破源自多項底層技術(shù)創(chuàng)新。阿里巴巴研究團隊基于自研Whale分布式框架,將參數(shù)規(guī)模擴展到千億的同時,利用大規(guī)模數(shù)據(jù)并行和模型并行,訓(xùn)練速度提升10倍以上,僅需1-2天即可完成上億數(shù)據(jù)的預(yù)訓(xùn)練。此外,M6模型首次將多模態(tài)預(yù)訓(xùn)練模型應(yīng)用到基于文本的圖像生成任務(wù),結(jié)合向量量化生成對抗網(wǎng)絡(luò)學(xué)習(xí)文本與圖像編碼共同建模的任務(wù),能夠生成清晰度高且細(xì)節(jié)豐富的圖像。

阿里巴巴達(dá)摩院智能計算實驗室資深算法專家楊紅霞表示:“多模態(tài)預(yù)訓(xùn)練是下一代人工智能的基礎(chǔ),M6模型實現(xiàn)了訓(xùn)練效率和生成精度等多項突破,是當(dāng)前眾多中文多模態(tài)下游任務(wù)最優(yōu)模型。”

作為國內(nèi)最早投入認(rèn)知智能研究的科技公司之一,阿里巴巴已有30多項認(rèn)知智能領(lǐng)域研究成果被國際頂級會議收錄;據(jù)介紹,研究團隊還將研發(fā)更高規(guī)模的萬億參數(shù)多模態(tài)預(yù)訓(xùn)練模型,進(jìn)一步突破算力及預(yù)訓(xùn)練模型的極限,最終實現(xiàn)通用領(lǐng)域的高質(zhì)量泛內(nèi)容生成。(來源:獵云網(wǎng))

極客網(wǎng)企業(yè)會員

免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進(jìn)一步核實,并對任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。

2021-03-02
阿里發(fā)布千億參數(shù)規(guī)模AI模型,可設(shè)計30多種物品高清圖像
M6的突破源自多項底層技術(shù)創(chuàng)新。

長按掃碼 閱讀全文