谷歌翻譯月活用戶超過10億 神經(jīng)網(wǎng)絡(luò)機(jī)器學(xué)習(xí)功不可沒

7月11日下午消息(岳明) 在今天舉行的“2017中國(guó)互聯(lián)網(wǎng)大會(huì)”上,谷歌翻譯研發(fā)科學(xué)家高勤介紹,谷歌翻譯現(xiàn)在提供超過100種語言互通,覆蓋全球99%的網(wǎng)民,每天提供超過10億次的翻譯,大約相當(dāng)于100萬本書的文本總量。

谷歌翻譯月度活躍用戶超過10億人次,其中95%來自于美國(guó)以外地區(qū)。在技術(shù)層面,谷歌利用機(jī)器學(xué)習(xí)帶來了許多全新的翻譯體驗(yàn),例如利用手機(jī)攝像頭做的即時(shí)翻譯,利用手機(jī)麥克風(fēng)和揚(yáng)聲器進(jìn)行即時(shí)對(duì)話翻譯,離線翻譯的支持為沒有數(shù)據(jù)服務(wù)的旅行者提供幫助。

高勤認(rèn)為,翻譯質(zhì)量一直是谷歌翻譯所關(guān)注的焦點(diǎn),在近十年以來,谷歌翻譯一直致力于翻譯質(zhì)量的提升,特別是最近一年以來,谷歌翻譯的質(zhì)量有了長(zhǎng)足的提升,無論從流暢度和準(zhǔn)確性上都有了巨大的提升,而其背后正是神經(jīng)網(wǎng)絡(luò)機(jī)器翻譯技術(shù)。

傳統(tǒng)的翻譯技術(shù),基于短語的統(tǒng)計(jì)機(jī)器翻譯是拼圖過程,通過對(duì)短語對(duì)的排列和組合,嘗試找出較好的翻譯選項(xiàng),而整個(gè)決策過程是離散的,而支持這個(gè)決策的信息也都是局部的。而神經(jīng)網(wǎng)絡(luò)機(jī)器學(xué)習(xí)是反其道而行之,做每一步翻譯過程中可以利用云語言與目標(biāo)語言所有信息,使整個(gè)決策過程既是連續(xù)也是全局的。

高勤表示,2015年最初預(yù)計(jì)完成項(xiàng)目計(jì)劃要花三年時(shí)間,但基于TensorFlow平臺(tái),在2016年11月針對(duì)16個(gè)語言的機(jī)器翻譯能力基本實(shí)現(xiàn)。這其中,多語言模型使200個(gè)模型的訓(xùn)練與維護(hù)成為可能。所謂多語言模型是指用同一套神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)多種語言的互相翻譯。如將英語、西班牙語、韓語放在同一個(gè)翻譯模型中進(jìn)行翻譯。在外界看來,谷歌翻譯之所以能夠做到如此快速,主要?dú)w功于多年的積累以及Tensor Processing Unit(張量處理單元,簡(jiǎn)稱TPU)處理器的引入。

極客網(wǎng)企業(yè)會(huì)員

免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁(yè)或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。

2017-07-11
谷歌翻譯月活用戶超過10億 神經(jīng)網(wǎng)絡(luò)機(jī)器學(xué)習(xí)功不可沒
谷歌翻譯月活用戶超過10億 神經(jīng)網(wǎng)絡(luò)機(jī)器學(xué)習(xí)功不可沒,C114訊 7月11日下午消息(岳明) 在今天舉行的2017中國(guó)互聯(lián)網(wǎng)大會(huì)上,谷歌翻譯研發(fā)科學(xué)家高勤

長(zhǎng)按掃碼 閱讀全文