云知聲 AI 全棧能力再獲突破!人臉識(shí)別技術(shù)達(dá)業(yè)界領(lǐng)先水平

《經(jīng)濟(jì)學(xué)人》雜志稱:許多硅谷公司以“全棧”(fullstack)而自豪。其原意指打造一套完整的、端到端的產(chǎn)品或服務(wù)體系。在人工智能領(lǐng)域,“全棧”的概念更多的被理解為在人工智能的多個(gè)應(yīng)用領(lǐng)域(計(jì)算機(jī)視覺(jué)、語(yǔ)音、自然語(yǔ)言理解等多模態(tài)交互技術(shù)),具備提供業(yè)內(nèi)一流的技術(shù)和服務(wù)的能力。

近日,云知聲AI“全棧”能力再次取得重大突破——在國(guó)際權(quán)威的人臉識(shí)別標(biāo)準(zhǔn)評(píng)測(cè)數(shù)據(jù)庫(kù) LFW 和 MegaFace 上,云知聲團(tuán)隊(duì)研發(fā)的人臉識(shí)別 UFaceID 算法系統(tǒng),在上述兩項(xiàng)標(biāo)準(zhǔn)評(píng)測(cè)中,性能分別達(dá)到 99.80%和 98.47%,首次參與內(nèi)部測(cè)評(píng),系統(tǒng)性能即位居業(yè)內(nèi)前列。這兩個(gè)測(cè)試集是業(yè)內(nèi)公認(rèn)的標(biāo)準(zhǔn)評(píng)測(cè)數(shù)據(jù)集,經(jīng)常參與測(cè)試的還有阿里、騰訊優(yōu)圖、百度、搜狗、商湯、Face++ 等知名公司。該成績(jī)不僅彰顯了云知聲在計(jì)算機(jī)視覺(jué)領(lǐng)域的技術(shù)實(shí)力,也意味著云知聲多模態(tài) AI 能力再一次獲得拓展與驗(yàn)證。

LFW 和 MegaFace 均為人臉識(shí)別領(lǐng)域重要的評(píng)測(cè)數(shù)據(jù)集。前者是人臉識(shí)別研究領(lǐng)域最重要的人臉圖像測(cè)評(píng)集合之一,后者為目前最具權(quán)威的、熱門的評(píng)價(jià)人臉識(shí)別性能的數(shù)據(jù)集之一。LFW 是針對(duì)早期人臉驗(yàn)證任務(wù)提出評(píng)測(cè)方法與指標(biāo),結(jié)果有借鑒意義,但已不代表目前的最難問(wèn)題。MegaFace 提出的關(guān)于百萬(wàn)級(jí)別的 1:N 人臉辨識(shí)任務(wù)的評(píng)測(cè)指標(biāo),難度更大,是目前學(xué)術(shù)界測(cè)評(píng)的新主流。盡管兩個(gè)數(shù)據(jù)集都存在高分?jǐn)?shù)與實(shí)際應(yīng)用需求間的矛盾,但由評(píng)測(cè)過(guò)程中催生出來(lái)的新方法,無(wú)疑極大的推動(dòng)了人臉識(shí)別技術(shù)的長(zhǎng)足進(jìn)步。

云知聲 AI 全棧能力再獲突破!人臉識(shí)別技術(shù)達(dá)業(yè)界領(lǐng)先水平

通常在計(jì)算機(jī)視覺(jué)評(píng)測(cè)中,為了跑出更好的成績(jī),參賽團(tuán)隊(duì)普遍會(huì)使用多模型和較高的模型復(fù)雜度,既考驗(yàn)?zāi)P退惴ǖ男阅?,也相?yīng)對(duì)計(jì)算資源提出更高要求。此次,云知聲首次研發(fā)人臉識(shí)別算法即斬獲出色成績(jī),除了團(tuán)隊(duì)算法研究人員的不懈努力之外,云知聲分布式機(jī)器學(xué)習(xí)智能計(jì)算平臺(tái) —— Atlas 亦同樣功不可沒(méi)。

云知聲很早就開(kāi)始布局建設(shè)國(guó)內(nèi)領(lǐng)先的 GPU/CPU 異構(gòu)計(jì)算平臺(tái)和分布式文件存儲(chǔ)系統(tǒng),該計(jì)算集群能夠為智能計(jì)算提供高性能計(jì)算和海量數(shù)據(jù)的存儲(chǔ)訪問(wèn)能力。在該計(jì)算集群的基礎(chǔ)上,云知聲建設(shè)了被譽(yù)為云知聲版“TensorFlow + GKE (Google Kubernetes Engine) ”的 Atlas 機(jī)器學(xué)習(xí)計(jì)算平臺(tái),在云知聲向人工智能多領(lǐng)域技術(shù)橫向擴(kuò)展和縱向迭代中,發(fā)揮了至關(guān)重要的作用。

云知聲 AI 全棧能力再獲突破!人臉識(shí)別技術(shù)達(dá)業(yè)界領(lǐng)先水平

Atlas 機(jī)器學(xué)習(xí)智能計(jì)算平臺(tái)以 GPU 和 CPU 為計(jì)算集群的基礎(chǔ)硬件資源,針對(duì)智能計(jì)算的需求和任務(wù)特點(diǎn),使用云知聲內(nèi)部改進(jìn)的 Kubernetes 作為資源管理和調(diào)度系統(tǒng),通過(guò)計(jì)算任務(wù)容器化和圖形化的任務(wù)交互,最大化的簡(jiǎn)化算法研究人員提交計(jì)算任務(wù)的復(fù)雜度,實(shí)現(xiàn)計(jì)算任務(wù)的全流程管理和一鍵式分布式運(yùn)行。同時(shí),針對(duì)智能計(jì)算對(duì)海量真實(shí)應(yīng)用場(chǎng)景數(shù)據(jù)的訪問(wèn)特點(diǎn), Atlas 智能計(jì)算平臺(tái)構(gòu)建具備 PB 量級(jí)的高 IO 和高可靠的分布式存儲(chǔ)系統(tǒng)。

在計(jì)算機(jī)視覺(jué)等新的人工智能應(yīng)用領(lǐng)域,更加依賴高性能的計(jì)算和海量數(shù)據(jù)的讀寫能力,而此恰恰體現(xiàn)了云知聲在智能計(jì)算平臺(tái)的超前布局。到 2019 年,Atlas 計(jì)算平臺(tái)將具備 1000+ 的 GPU 計(jì)算資源和超過(guò)一億億次每秒的浮點(diǎn)計(jì)算能力,為在人工智能新領(lǐng)域的拓展奠定了強(qiáng)大的計(jì)算能力基礎(chǔ)。

除此之外,在 Atlas 智能計(jì)算平臺(tái)基礎(chǔ)上,為了更加高效地實(shí)現(xiàn)算法模塊共享和高效運(yùn)行,云知聲研發(fā)了 UniFlow 計(jì)算框架。支持 DNN、CNN、RNN/LSTM、seq2seq 等豐富的機(jī)器學(xué)習(xí)和深度學(xué)習(xí)算法模塊,支持 TensorFlow 、 PyTorch 、Caffe 等主流計(jì)算框架以及用戶自定義算法,同時(shí),優(yōu)化分布式任務(wù)的計(jì)算和通信邏輯,計(jì)算效率提升 50% 以上。在下一代的 UniFlow 中,還將集成自動(dòng)調(diào)參和模型壓縮模塊,實(shí)現(xiàn)全流程托管式自動(dòng)調(diào)參,能夠?yàn)椴煌瑘?chǎng)景下的 AI 數(shù)據(jù)處理、算法演進(jìn)提供高效的計(jì)算支撐。

云知聲 AI 全棧能力再獲突破!人臉識(shí)別技術(shù)達(dá)業(yè)界領(lǐng)先水平

基于 Atlas 計(jì)算平臺(tái)和 UniFlow 計(jì)算框架,云知聲實(shí)現(xiàn)在統(tǒng)一計(jì)算框架體系下的計(jì)算高效率和算法高產(chǎn)出,通過(guò)協(xié)同利用 AI 底層研發(fā)的技術(shù)成果,進(jìn)而實(shí)現(xiàn)在人工智能的多個(gè)應(yīng)用領(lǐng)域的快速拓展,從語(yǔ)音識(shí)別(ASR)、語(yǔ)義理解(NLU) 到機(jī)器翻譯(NMT)、計(jì)算機(jī)視覺(jué)(CV)等新的人工智能技術(shù)領(lǐng)域。

值得一提的是,在今年5月份的WMT2018國(guó)際機(jī)器翻譯大賽中英翻譯比賽中,組建不足一年的云知聲NMT機(jī)器翻譯團(tuán)隊(duì)首戰(zhàn)即斬獲英中第二、中英第四,綜合第三(BLEU關(guān)鍵評(píng)分僅次于第二名0.1)的成績(jī),同期參賽的還有阿里、騰訊、微軟、劍橋等頂尖巨頭與高校院所。結(jié)合此次在計(jì)算機(jī)視覺(jué)領(lǐng)域的佳績(jī),無(wú)疑證明了Atlas 計(jì)算平臺(tái)在云知聲探索多模態(tài) AI 技術(shù)能力過(guò)程中的威力與價(jià)值。

云知聲 AI 全棧能力再獲突破!人臉識(shí)別技術(shù)達(dá)業(yè)界領(lǐng)先水平

云知聲 CEO 黃偉指出,“在LFWMegaFace 評(píng)測(cè)數(shù)據(jù)集上的初露鋒芒,檢驗(yàn)了云知聲在計(jì)算機(jī)視覺(jué)研究方面的新進(jìn)展,也更加堅(jiān)定了我們發(fā)展多模態(tài) AI 能力的信心。但是,從另一方面來(lái)看,技術(shù)的最終目的是落地,由單純算法所驅(qū)動(dòng)的技術(shù)差距實(shí)際上正在變得越來(lái)越小,如何將技術(shù)落地到場(chǎng)景才是所有的 AI 公司應(yīng)該關(guān)心和考慮的。”

在技術(shù)場(chǎng)景化應(yīng)用方面,云知聲無(wú)疑擁有領(lǐng)先優(yōu)勢(shì)。目前,云知聲領(lǐng)先的語(yǔ)音技術(shù)已在包括家居、車載、醫(yī)療、教育、金融、零售等多個(gè)領(lǐng)域?qū)崿F(xiàn)落地。與此同時(shí),在汽車行業(yè),云知聲已與吉利汽車達(dá)成合作,共同研發(fā)融合語(yǔ)音、計(jì)算機(jī)視覺(jué)等技術(shù)的車規(guī)級(jí)前裝 AI 芯片??梢韵胂蟮氖牵殡S著計(jì)算機(jī)視覺(jué)技術(shù)的成熟,智能語(yǔ)音與計(jì)算機(jī)視覺(jué)技術(shù)的深入結(jié)合,將進(jìn)一步豐富云知聲 AI 產(chǎn)品與服務(wù)的形態(tài),也將有效提升用戶的使用體驗(yàn)。

極客網(wǎng)企業(yè)會(huì)員

免責(zé)聲明:本網(wǎng)站內(nèi)容主要來(lái)自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁(yè)或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書(shū)面權(quán)利通知或不實(shí)情況說(shuō)明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開(kāi)相關(guān)鏈接。

2018-11-21
云知聲 AI 全棧能力再獲突破!人臉識(shí)別技術(shù)達(dá)業(yè)界領(lǐng)先水平
《經(jīng)濟(jì)學(xué)人》雜志稱:許多硅谷公司以“全棧”(fullstack)而自豪。其原意指打造一套完整的、端到端的產(chǎn)品或服務(wù)體系。

長(zhǎng)按掃碼 閱讀全文