最近ChatGPT火了!寫代碼、寫情書、寫文章、做題……它啥都會。在ChatGPT強大的功能背后,離不開業(yè)內(nèi)不斷精進的人工智能技術(shù)的支撐。零樣本學習就是ChatGPT的核心技術(shù)之一。
近日,天翼云智能邊緣事業(yè)部AI團隊在中文語言理解零樣本學習權(quán)威榜單ZeroCLUE中拔得頭籌,這標志著天翼云AI在認知智能領域處于行業(yè)領先地位。
天翼云智能邊緣事業(yè)部AI團隊部分成員合影
ZeroCLUE是中文語言理解零樣本學習的權(quán)威榜單,在學術(shù)和工業(yè)界有著廣泛影響力,吸引了IDEA研究院、OpenBMB等眾多高水平科研單位和企業(yè)競相角逐。天翼云AI團隊以76.217的總分奪得榜單桂冠,成績大幅領先第二名。同時,天翼云AI團隊在榜單“BUSTM任務”中占據(jù)榜首,成為該任務中唯一突破90分的團隊。
ZeroCLUE榜單(2023.02.15),其中Human表示人類測評成績
零樣本學習(Zero-Shot Learning)是自然語言處理技術(shù)中重要的研究方向,旨在突破全監(jiān)督學習范式,讓AI算法在數(shù)據(jù)稀缺、標注困難的場景中更好地發(fā)揮作用。
ZeroCLUE榜單包含EPRSTMT(電商評論情感分析)、CSLDCP(科學文獻學科分類)、TNEWSF(新聞分類)、IFLYTEKF(應用描述主題分類)、OCNLIF(自然語言推理)、BUSTM(對話短文本匹配)、CHIDF(成語閱讀理解)、CSLF(摘要判斷關鍵詞判別)、CLUEWSCF(代詞消歧)9大任務,涵蓋了當今自然語言處理技術(shù)的主流研究方向。參賽者的排名則由上述9個任務的平均得分決定。下圖展示了上述任務的具體數(shù)據(jù)細節(jié)。
本次打榜競賽中,天翼云AI團隊的算法核心之一是采用了“統(tǒng)一多項選擇”(Unified Multiple Choice)的思想,將不同范式的自然語言處理任務統(tǒng)一轉(zhuǎn)化為多項選擇任務,使得在訓練和微調(diào)階段,每個任務都能從其它數(shù)據(jù)與任務中獲益。
基于以上思想對每個任務進行范式的設計和統(tǒng)一,并結(jié)合開源模型進行算法優(yōu)化和測試,最終不僅能夠增強模型在本任務中的性能,也提升了其處理不同任務的泛化能力。
本次天翼云AI團隊在競爭激烈的ZeroCLUE打榜中脫穎而出,源于其在認知智能領域的技術(shù)沉淀,以及對業(yè)務場景的深度理解和應用。
值得一提的是,天翼云的零樣本學習技術(shù)在實際業(yè)務中已獲得了廣泛應用。例如,在知識平臺中使用零樣本學習技術(shù)對大量非結(jié)構(gòu)化數(shù)據(jù)進行知識挖掘和管理;在缺乏樣本的場景中使用零樣本學習技術(shù)提升底層算法的知識抽取能力,進而提高平臺上層智能搜索、推薦、問答等業(yè)務性能。
未來,天翼云將繼續(xù)推進人工智能技術(shù)的創(chuàng)新突破,加快打造原創(chuàng)技術(shù)策源地,以更多的數(shù)字技術(shù)應用,賦能千行百業(yè)數(shù)字化轉(zhuǎn)型。
(免責聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網(wǎng)站對有關資料所引致的錯誤、不確或遺漏,概不負任何法律責任。
任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關文章源頭核實,溝通刪除相關內(nèi)容或斷開相關鏈接。 )