1秒鐘能夠干什么?譯出半句話還是1.6萬字的復雜文章?
1分鐘能夠干什么?看個劇情梗概還是中英文字幕齊備?
機器翻譯能否代替人工翻譯?關于這個問題,尚無定論。
但隨著機器翻譯水平不斷提高,這一天似乎又近了一步。起碼企業(yè)級應用方面,快速需求和大量數(shù)據(jù)的門檻,似乎已經(jīng)將人工譯員攔在門外。
盡管谷歌、微軟等互聯(lián)網(wǎng)巨頭紛紛入局機器翻譯服務領域,但是垂直級機器翻譯由于對數(shù)據(jù)和算法要求極高,遲遲沒有巨頭涉足。
為了填補了這一領域的空白,中譯語通憑借豐富的語料數(shù)據(jù)和不斷迭代的算法率先推出MerCube,要知道,這是真正意義上的全球第一個企業(yè)級機器翻譯硬件。
AI魔方一出,誰與爭鋒!
2018年7月31日,中譯語通旗下一個名喚MerCube的AI魔方橫空出世,作為一款企業(yè)級人工智能服務器,想要為未來發(fā)展賦能。
中譯語通成立于2013年,2014年6月發(fā)布了中英機器翻譯引擎,成為了繼谷歌、微軟、百度之后國內(nèi)最早自主研發(fā)機器翻譯引擎的企業(yè)。
而后2016年,隨著機器翻譯水平發(fā)展,準確度和速度大幅提升,中譯語通的NMT中英機器翻譯引擎上線,是國內(nèi)最早對外提供NMT服務的企業(yè)。
中譯語通CEO于洋介紹:“機器翻譯領域里都是大塊頭的玩家,在這個道路上能堅持下來實屬不易,目前中譯語通已經(jīng)做到以37個語種覆蓋233個國家和地區(qū)官方語言中的224個,對官方語種的支持覆蓋世界總?cè)丝诔^90%。”
萬事俱備只欠東風,2017年5月,在市場驅(qū)動下,中譯語通開始打造MerCube的雛形。
To C競爭激烈,To B則是新的突破。雖然機器翻譯技術不斷革新,但是服務方式卻像被時光遺忘,從未有更新的痕跡。
面對這種情況,中譯語通相關負責人表示:“機器翻譯水平不斷提高、企業(yè)本地化部署需求以及安全性和速度等市場剛需驅(qū)動下,中譯語通決心打造MerCube,將前端服務與定制化硬件引擎串聯(lián)。”
據(jù)悉,由于用戶量增多、對于安全性和保密性提出新的要求,各種雜牌硬件、CPU的穩(wěn)定度和適配度已經(jīng)無法滿足企業(yè)需求,所以企業(yè)級人工智能服務器應運而生。
而且在信息安全越來越被重視的今天,MerCube提供專屬的私有化部署方式,信息在受控環(huán)境下運轉(zhuǎn),原文本、譯文本地化存儲,從根源上解決了數(shù)據(jù)安全問題。
從軟到硬,深度定制
人工智能企業(yè)四要素:數(shù)據(jù)、算法、場景和硬件,多年來中譯語通深耕數(shù)據(jù)、算法,從軟件到硬件,定制化打造MerCube。
據(jù)了解,MerCube搭載了NVIDIA有史以來極其先進的數(shù)據(jù)中心級GPU Tesla V100,其可提供比 CPU 服務器高30倍的處理能力。MerCube采用了NVIDIA® NVLink™技術,提供更高帶寬與更多鏈路,可提升多 GPU 和多 GPU/CPU 系統(tǒng)配置的可擴展性。單個 NVIDIA Tesla V100GPU 即可支持多達6條 NVLink 鏈路,總帶寬為 300 GB/秒,這是 PCIe 3 帶寬的 10 倍。
以機器翻譯和語音識別為例,MerCube MT G4單臺處理能力可達到8000字/秒,MT G8單臺處理能力可達到16000字/秒,MerCube ASR可實現(xiàn)將1小時的音視頻在1分鐘內(nèi)識別、解析完成并導出文件。
機器翻譯可以說是目前中譯語通產(chǎn)品的核心,并基于此研發(fā)了網(wǎng)頁翻譯插件、文檔翻譯系統(tǒng)、字幕通、視頻解析軟件等產(chǎn)品與MerCube MT硬件可無縫對接,在保證安全性的基礎上解決用戶的全方位需求。
以文檔翻譯為例,一篇45000+字符的醫(yī)療學術論文用中譯語通的文檔翻譯只需幾秒鐘,要注意這是在不排除網(wǎng)絡卡頓的前提下得出的數(shù)據(jù)。而且,文檔翻譯付費版的價格也只是每千字一元;但如果選擇企業(yè)級的應用服務,那么只需要支付硬件和應用的錢就一次性搞定了。
此外,MerCube MT還提供定制化服務,會結合用戶數(shù)據(jù)及自身通用數(shù)據(jù),提供專屬的機器翻譯引擎。除機器翻譯、語音識別外,MerCube還可將圖像識別、視頻解析、NLP算法、知識圖譜等人工智能算法和引擎內(nèi)置其中,并與硬件完美融合。
換句話說,MerCube是AI技術的可視化載體,可將翻譯引擎、語音識別引擎、NLP處理引擎、音視頻處理引擎靈活匹配,構建用戶獨有的AI智能硬件產(chǎn)品,為用戶提供定制化的AI服務。超快的翻譯速度,完全可輕松應對企業(yè)海量信息翻譯需求,極大地節(jié)省企業(yè)人力、財力支出。
正如中譯語通CEO于洋介紹,MerCube實際上是一個All In one的解決方案,在滿足企業(yè)業(yè)務需求的同時,可以解決服務效率、數(shù)據(jù)安全性、模型適應性等問題,是真正能夠在企業(yè)里成熟商用的解決方案。
目前,MerCube在醫(yī)療、金融、科技、政務等不同領域均有所應用,中譯語通對比百度、微軟、谷歌等行業(yè)巨頭,由于發(fā)展重心不同,背靠中國對外翻譯有限公司,數(shù)據(jù)量天然占優(yōu),似乎未來發(fā)展更有想象空間。
眾所周知,高水平高質(zhì)量的語料積累,是機器翻譯的重要基礎之一,登記在冊的超過50億句對的平行語料,100億單語語料,每年還在以2億句對平行語料,5億單語語料的速度在增加,就是中譯語通最大的優(yōu)勢。
此外,字幕通、視頻解析也是中譯語通主打的服務,現(xiàn)場演示中,幾十分鐘的視頻可以在1分鐘內(nèi)自動添加中英文字幕。
不過,于洋表示:“在一些特殊的小語種中,一個句對平行語料的成本超過1塊錢。如此雄厚的積累,是我們的任何競爭對手都不具備的。”
百億規(guī)模,有待開發(fā)
據(jù)中譯語通方面介紹,一整套的MerCube從引擎、硬件到軟件價格不菲,但相應的,企業(yè)海量信息翻譯需求得到滿足,從而節(jié)省的企業(yè)人力、財力支出則達到了另一個量級。
有業(yè)內(nèi)人士預測,目前企業(yè)級人工服務器的規(guī)模已經(jīng)接近10億,除去金融、醫(yī)療、科技等領域,尚有百億級的市場有待挖掘。而且短短幾天,MerCube近千臺的訂單似乎已經(jīng)能夠證明,企業(yè)級服務器可以為未來發(fā)展賦能。
iPhone自誕生開始,便憑借劃時代的操作和系統(tǒng),開啟了智能手機的時代,而MerCube也扮演著和iPhone類似的角色,高性能GPU、定制化應用、高效精準服務...每一項都在吸引著客戶,引領著未來。
據(jù)了解,目前MerCube在業(yè)內(nèi)暫無競品,畢竟比起復制其他企業(yè)的成功浪費內(nèi)存,誰都會更喜歡引領市場、徜徉藍海吧!
- 蜜度索驥:以跨模態(tài)檢索技術助力“企宣”向上生長
- AI超跑新秀揭秘:理想或?qū)⑸孀愣虅☆I域,廣電部門嚴查紅果短劇風波
- 紅果短劇回應被約談:5天內(nèi)暫停新劇上線,積極整改,重樹內(nèi)容標準
- 互聯(lián)網(wǎng)大廠春節(jié)福利揭秘:高薪休假與日常福利究竟誰更勝一籌?
- 亞馬遜CTO預測:2025年及未來五大科技趨勢,未來已來,你準備好了嗎?
- 鴨鴨羽絨服與夢餉科技攜手打造超級品牌日,GMV同比增長300%,共贏新零售未來
- 中國客戶海外安全案件激增,2025年需應對碎片化風險:SOS報告揭示新挑戰(zhàn)
- 小米布局GPU集群,探索AI大模型新領域,科技巨頭引領未來趨勢
- 阿里影業(yè)入股姚安娜經(jīng)紀公司:新篇章,新機遇
- 螞蟻森林再度捐資河北種樹,共筑綠色長城
- 谷歌不打算賤賣自家明星產(chǎn)品:Chrome瀏覽器
免責聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網(wǎng)站對有關資料所引致的錯誤、不確或遺漏,概不負任何法律責任。任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權或存在不實內(nèi)容時,應及時向本網(wǎng)站提出書面權利通知或不實情況說明,并提供身份證明、權屬證明及詳細侵權或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關文章源頭核實,溝通刪除相關內(nèi)容或斷開相關鏈接。