近日,神經(jīng)信息處理系統(tǒng)大會 NeurIPS 2020(Conference and Workshop on Neural Information Processing Systems)于線上舉行。在官方公布的論文入選名單中,云知聲與 CMU (卡內(nèi)基梅隆大學(xué))張坤教授團(tuán)隊等合作的針對機器學(xué)習(xí)典型的無監(jiān)督領(lǐng)域自適應(yīng)問題論文《Domain Adaptation As a Problem of Inference on Graphical Models》,憑借基于數(shù)據(jù)驅(qū)動的圖模型框架解決方案的創(chuàng)新研究成功入選,彰顯了云知聲在人工智能與機器學(xué)習(xí)原創(chuàng)技術(shù)領(lǐng)域的持續(xù)創(chuàng)新能力。
近幾年,得益于越來越多真實場景數(shù)據(jù)和充足的算力,現(xiàn)有技術(shù)在領(lǐng)域匹配或者數(shù)據(jù)覆蓋到的場景效果表現(xiàn)不錯,但是在跨領(lǐng)域場景,尤其是目標(biāo)領(lǐng)域沒有標(biāo)注(無監(jiān)督)的情況下性能還有進(jìn)一步提升空間,如何利用無監(jiān)督領(lǐng)域自適應(yīng)技術(shù)解決跨領(lǐng)域場景問題是目前人工智能技術(shù)發(fā)展的熱點研究領(lǐng)域,也是未來人工智能技術(shù)實現(xiàn)跨代發(fā)展和更加智能化繞不過去的技術(shù)門檻。
在本論文中,針對目前機器學(xué)習(xí)典型的無監(jiān)督領(lǐng)域自適應(yīng)問題,提出了一種基于數(shù)據(jù)驅(qū)動的圖模型框架下的解決方案。典型的無監(jiān)督領(lǐng)域自適應(yīng)問題是指利用源領(lǐng)域的數(shù)據(jù),如何在新的目標(biāo)領(lǐng)域準(zhǔn)確做出預(yù)測。一般來說,源和目標(biāo)領(lǐng)域之間的數(shù)據(jù)分布是不同的。我們假設(shè)不同領(lǐng)域的數(shù)據(jù)是獨立同分布的,為了利用已知源數(shù)據(jù)對目標(biāo)領(lǐng)域的數(shù)據(jù)分布進(jìn)行建模,引入隱變量 θ 表示領(lǐng)域相關(guān)的變化因子,同時利用增強有向無環(huán)圖(DAG)來描述領(lǐng)域之間聯(lián)合分布,通過將在目標(biāo)領(lǐng)域的預(yù)測問題轉(zhuǎn)化為增強圖模型框架下的貝葉斯推斷問題,實現(xiàn)基于數(shù)據(jù)自動驅(qū)動的無監(jiān)督領(lǐng)域自適應(yīng)。在模擬數(shù)據(jù)和三個真實數(shù)據(jù)集上的實驗結(jié)果均表明利用圖模型解決無監(jiān)督領(lǐng)域自適應(yīng)問題的有效性。
本文提出的全自動的端到端的無監(jiān)督領(lǐng)域自適應(yīng)技術(shù)方案除了為學(xué)術(shù)界提供新的研究思路外,對于工業(yè)界更具有重要的現(xiàn)實意義。在實際的應(yīng)用場景中,這些大量異構(gòu)未標(biāo)注的數(shù)據(jù)如果能夠通過此項技術(shù)得到有效利用,將會極大的提高目前人工智能技術(shù)的魯棒性和跨場景下的性能。
美國計算機科學(xué)家和哲學(xué)家 Judea Pearl(圖靈獎獲得者、貝葉斯網(wǎng)絡(luò)之父)在社交網(wǎng)站上推薦本論文的研究成果,表示本文的基于因果思維的方案提供了有別于傳統(tǒng)機器學(xué)習(xí)方式的、新的、有保障的遷移學(xué)習(xí)方式。
NeurIPS 是人工智能、機器學(xué)習(xí)和計算神經(jīng)科學(xué)領(lǐng)域頂級學(xué)術(shù)會議之一,也是 CCF 推薦的A 類國際學(xué)術(shù)會議。本屆 NeurIPS 會議共收到投稿 9454 篇,創(chuàng)下投稿數(shù)量歷史新高。其中錄用論文 1900 篇,接收率約 20.1%,為歷年難度最高的一屆。作為學(xué)術(shù)界、工業(yè)界公認(rèn)的人工智能領(lǐng)域國際頂級會議的翹楚,NeurIPS 代表著當(dāng)今人工智能研究的最高水平和技術(shù)發(fā)展趨勢,在谷歌發(fā)布的 2020 年最新版學(xué)術(shù)指標(biāo)(Google Scholar Metrics, GSM)榜單中, NeurIPS 在人工智能領(lǐng)域?qū)W術(shù)影響力排名全球第一。
此次入選 NeurIPS 論文集,是云知聲全棧和硬核技術(shù)的一次新突破,也是繼吳文俊人工智能科技進(jìn)步獎、北京市科學(xué)技術(shù)進(jìn)步一等獎,CHIP2019 臨床術(shù)語標(biāo)準(zhǔn)化任務(wù)評測冠軍、CCKS 2020 醫(yī)療命名實體識別評測冠軍、BC 2020語音合成技術(shù)評測冠軍,以及多篇論文入選 NLP 國際頂會 ACL、語音 AI 頂會 InterSpeech 等諸多技術(shù)成果之后,在前沿技術(shù)上的又一次新突破。
在人工智能底層技術(shù)方面的深厚積累,也將不斷促進(jìn)云知聲人工智能系統(tǒng)的“智力”提升,推動其更好地應(yīng)用于智慧生活、智慧城市以及出行、教育、醫(yī)療等千行百業(yè),為用戶創(chuàng)造更好的智能體驗。
(免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進(jìn)一步核實,并對任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負(fù)任何法律責(zé)任。
任何單位或個人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。 )