《經(jīng)濟學(xué)人》雜志稱:許多硅谷公司以“全棧”(fullstack)而自豪。其原意指打造一套完整的、端到端的產(chǎn)品或服務(wù)體系。在人工智能領(lǐng)域,“全棧”的概念更多的被理解為在人工智能的多個應(yīng)用領(lǐng)域(計算機視覺、語音、自然語言理解等多模態(tài)交互技術(shù)),具備提供業(yè)內(nèi)一流的技術(shù)和服務(wù)的能力。
近日,云知聲AI“全棧”能力再次取得重大突破——在國際權(quán)威的人臉識別標(biāo)準(zhǔn)評測數(shù)據(jù)庫 LFW 和 MegaFace 上,云知聲團隊研發(fā)的人臉識別 UFaceID 算法系統(tǒng),在上述兩項標(biāo)準(zhǔn)評測中,性能分別達(dá)到 99.80%和 98.47%,首次參與內(nèi)部測評,系統(tǒng)性能即位居業(yè)內(nèi)前列。這兩個測試集是業(yè)內(nèi)公認(rèn)的標(biāo)準(zhǔn)評測數(shù)據(jù)集,經(jīng)常參與測試的還有阿里、騰訊優(yōu)圖、百度、搜狗、商湯、Face++ 等知名公司。該成績不僅彰顯了云知聲在計算機視覺領(lǐng)域的技術(shù)實力,也意味著云知聲多模態(tài) AI 能力再一次獲得拓展與驗證。
LFW 和 MegaFace 均為人臉識別領(lǐng)域重要的評測數(shù)據(jù)集。前者是人臉識別研究領(lǐng)域最重要的人臉圖像測評集合之一,后者為目前最具權(quán)威的、熱門的評價人臉識別性能的數(shù)據(jù)集之一。LFW 是針對早期人臉驗證任務(wù)提出評測方法與指標(biāo),結(jié)果有借鑒意義,但已不代表目前的最難問題。MegaFace 提出的關(guān)于百萬級別的 1:N 人臉辨識任務(wù)的評測指標(biāo),難度更大,是目前學(xué)術(shù)界測評的新主流。盡管兩個數(shù)據(jù)集都存在高分?jǐn)?shù)與實際應(yīng)用需求間的矛盾,但由評測過程中催生出來的新方法,無疑極大的推動了人臉識別技術(shù)的長足進(jìn)步。
通常在計算機視覺評測中,為了跑出更好的成績,參賽團隊普遍會使用多模型和較高的模型復(fù)雜度,既考驗?zāi)P退惴ǖ男阅?,也相?yīng)對計算資源提出更高要求。此次,云知聲首次研發(fā)人臉識別算法即斬獲出色成績,除了團隊算法研究人員的不懈努力之外,云知聲分布式機器學(xué)習(xí)智能計算平臺 —— Atlas 亦同樣功不可沒。
云知聲很早就開始布局建設(shè)國內(nèi)領(lǐng)先的 GPU/CPU 異構(gòu)計算平臺和分布式文件存儲系統(tǒng),該計算集群能夠為智能計算提供高性能計算和海量數(shù)據(jù)的存儲訪問能力。在該計算集群的基礎(chǔ)上,云知聲建設(shè)了被譽為云知聲版“TensorFlow + GKE (Google Kubernetes Engine) ”的 Atlas 機器學(xué)習(xí)計算平臺,在云知聲向人工智能多領(lǐng)域技術(shù)橫向擴展和縱向迭代中,發(fā)揮了至關(guān)重要的作用。
Atlas 機器學(xué)習(xí)智能計算平臺以 GPU 和 CPU 為計算集群的基礎(chǔ)硬件資源,針對智能計算的需求和任務(wù)特點,使用云知聲內(nèi)部改進(jìn)的 Kubernetes 作為資源管理和調(diào)度系統(tǒng),通過計算任務(wù)容器化和圖形化的任務(wù)交互,最大化的簡化算法研究人員提交計算任務(wù)的復(fù)雜度,實現(xiàn)計算任務(wù)的全流程管理和一鍵式分布式運行。同時,針對智能計算對海量真實應(yīng)用場景數(shù)據(jù)的訪問特點, Atlas 智能計算平臺構(gòu)建具備 PB 量級的高 IO 和高可靠的分布式存儲系統(tǒng)。
在計算機視覺等新的人工智能應(yīng)用領(lǐng)域,更加依賴高性能的計算和海量數(shù)據(jù)的讀寫能力,而此恰恰體現(xiàn)了云知聲在智能計算平臺的超前布局。到 2019 年,Atlas 計算平臺將具備 1000+ 的 GPU 計算資源和超過一億億次每秒的浮點計算能力,為在人工智能新領(lǐng)域的拓展奠定了強大的計算能力基礎(chǔ)。
除此之外,在 Atlas 智能計算平臺基礎(chǔ)上,為了更加高效地實現(xiàn)算法模塊共享和高效運行,云知聲研發(fā)了 UniFlow 計算框架。支持 DNN、CNN、RNN/LSTM、seq2seq 等豐富的機器學(xué)習(xí)和深度學(xué)習(xí)算法模塊,支持 TensorFlow 、 PyTorch 、Caffe 等主流計算框架以及用戶自定義算法,同時,優(yōu)化分布式任務(wù)的計算和通信邏輯,計算效率提升 50% 以上。在下一代的 UniFlow 中,還將集成自動調(diào)參和模型壓縮模塊,實現(xiàn)全流程托管式自動調(diào)參,能夠為不同場景下的 AI 數(shù)據(jù)處理、算法演進(jìn)提供高效的計算支撐。
基于 Atlas 計算平臺和 UniFlow 計算框架,云知聲實現(xiàn)在統(tǒng)一計算框架體系下的計算高效率和算法高產(chǎn)出,通過協(xié)同利用 AI 底層研發(fā)的技術(shù)成果,進(jìn)而實現(xiàn)在人工智能的多個應(yīng)用領(lǐng)域的快速拓展,從語音識別(ASR)、語義理解(NLU) 到機器翻譯(NMT)、計算機視覺(CV)等新的人工智能技術(shù)領(lǐng)域。
值得一提的是,在今年5月份的WMT2018國際機器翻譯大賽中英翻譯比賽中,組建不足一年的云知聲NMT機器翻譯團隊首戰(zhàn)即斬獲英中第二、中英第四,綜合第三(BLEU關(guān)鍵評分僅次于第二名0.1)的成績,同期參賽的還有阿里、騰訊、微軟、劍橋等頂尖巨頭與高校院所。結(jié)合此次在計算機視覺領(lǐng)域的佳績,無疑證明了Atlas 計算平臺在云知聲探索多模態(tài) AI 技術(shù)能力過程中的威力與價值。
云知聲 CEO 黃偉指出,“在LFW和MegaFace 評測數(shù)據(jù)集上的初露鋒芒,檢驗了云知聲在計算機視覺研究方面的新進(jìn)展,也更加堅定了我們發(fā)展多模態(tài) AI 能力的信心。但是,從另一方面來看,技術(shù)的最終目的是落地,由單純算法所驅(qū)動的技術(shù)差距實際上正在變得越來越小,如何將技術(shù)落地到場景才是所有的 AI 公司應(yīng)該關(guān)心和考慮的。”
在技術(shù)場景化應(yīng)用方面,云知聲無疑擁有領(lǐng)先優(yōu)勢。目前,云知聲領(lǐng)先的語音技術(shù)已在包括家居、車載、醫(yī)療、教育、金融、零售等多個領(lǐng)域?qū)崿F(xiàn)落地。與此同時,在汽車行業(yè),云知聲已與吉利汽車達(dá)成合作,共同研發(fā)融合語音、計算機視覺等技術(shù)的車規(guī)級前裝 AI 芯片??梢韵胂蟮氖牵殡S著計算機視覺技術(shù)的成熟,智能語音與計算機視覺技術(shù)的深入結(jié)合,將進(jìn)一步豐富云知聲 AI 產(chǎn)品與服務(wù)的形態(tài),也將有效提升用戶的使用體驗。
- 小米召回SU7標(biāo)準(zhǔn)版車型,春運低價票來襲,12306客服回應(yīng),你怎么看?
- 智譜管理層變動引關(guān)注:兩名高管離職,公司未來走向成謎
- 特斯拉召回超120萬輛汽車:安全隱患不容忽視
- 小米召回SU7標(biāo)準(zhǔn)版車型:OTA升級解決,這次為何小米首度召回?
- Anthropic推出全新API:AI信息驗證之戰(zhàn)再掀波瀾
- 未來解碼:英偉達(dá)引領(lǐng)機器人技術(shù)產(chǎn)業(yè)融合,智造新篇章
- 網(wǎng)易云下架SM娛樂版權(quán)歌曲:數(shù)百萬用戶將受影響,版權(quán)之爭再起波瀾
- 百川智能全新模型Baichuan-M1:顛覆醫(yī)療循證模式,三大推理能力引領(lǐng)全場景深度思考
- 武漢阿里巴巴總部即將亮相,共繪數(shù)字產(chǎn)業(yè)新藍(lán)圖
- iPhone 16在禁令后苦盡甘來:蘋果即將與印尼達(dá)成協(xié)議,解禁在望
免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進(jìn)一步核實,并對任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。