高層速讀
關(guān)鍵信息:微軟亞洲研究院宣布開發(fā)出第一個機器翻譯系統(tǒng),該系統(tǒng)在通用新聞報道測試集newstest2017的中-英測試集上達到了人類水平,在自然語言處理上,實現(xiàn)了媲美人類專業(yè)譯者的里程碑式突破。
由微軟亞洲研究院與雷德蒙研究院的研究人員組成的團隊周三宣布,他們已經(jīng)開發(fā)出了第一個機器翻譯系統(tǒng),該系統(tǒng)在通用新聞報道測試集newstest2017的中-英測試集上達到了人類水平。當100分是標準滿分時,微軟的系統(tǒng)得分69.9,專業(yè)譯者68.6。
微軟表示,他們對來自各種在線報紙的大約2000個句子樣本進行了反復(fù)測試,并將測試結(jié)果與機器翻譯的結(jié)果進行了比較,甚至聘請了雙語語言顧問,以進一步驗證機器翻譯的準確性。
首個媲美人類專業(yè)譯者的里程碑式突破
這個名為newstest 2017的數(shù)據(jù)集是去年秋天在WMT 17的研究會議上發(fā)布的,由專業(yè)人員從在線報紙樣本翻譯而來,因此,研究人員能夠如此迅速地達到這一成果,可以說是機器翻譯領(lǐng)域的里程碑,特別是機器翻譯是人們幾十年來一直試圖解決的問題。微軟指出,許多人甚至認為,機器翻譯與人類水平相同的目標永遠不會實現(xiàn)。
黃學(xué)東院士在微軟的博文中表示:“在機器翻譯任務(wù)中,實現(xiàn)人與人之間的平等是我們所有人的夢想,我們只是沒想到這么快就能成功?!蓖瑫r研究人員也提醒大家,這并不代表人類已經(jīng)完全解決了機器翻譯的問題,只能說明我們離終極目標又更近了一步。
近年來,人工智能和語音識別技術(shù)的進步使得語音助理能夠進入我們的手機和家庭,幫助消費者完成日常的計算任務(wù),控制智能家居設(shè)備,以及聊天和娛樂。但是,對網(wǎng)頁或新聞文章進行機器翻譯,仍然會造成難以理解的語言上的混亂。因為機器翻譯最多能準確翻譯字面意思,但幾乎不可能用任何深刻的語言來供你深入理解文章。要想真正理解長篇文章,你需要人的幫助。
但,即使是不同的譯者,翻譯一個句子的方式也可能略有不同,你不能說兩者誰對誰錯?!皺C器翻譯要比單純的模式識別任務(wù)復(fù)雜得多”微軟亞洲副院長、從事該項目的自然語言處理小組負責人周明說,“人們可以用不同的詞來表達完全相同的東西,但你不一定能說哪個更好?!?/strong>
微信搜索【AI商業(yè)報道】,獲取國內(nèi)外AI巨頭新動向及行業(yè)資訊!
深度神經(jīng)網(wǎng)絡(luò)使翻譯更加流暢、自然
微軟還指出,人工智能的最新技術(shù)——深度神經(jīng)網(wǎng)絡(luò),為研究人員實現(xiàn)了這一突破做出了貢獻。深層神經(jīng)網(wǎng)絡(luò)是一種訓(xùn)練人工智能系統(tǒng)的方法,使研究人員能夠創(chuàng)造出更流暢、更自然的翻譯??紤]到更廣泛的使用場景,以前的方法稱為統(tǒng)計機器翻譯。
微軟的研究人員在系統(tǒng)中添加了自己的訓(xùn)練方法,以提高系統(tǒng)的準確性,這相當于人們一次又一次地檢查自己的翻譯作業(yè),以確保它是正確的。
周明表示,“由于翻譯沒有唯一的標準答案,它更像是一種藝術(shù),因此需要更加復(fù)雜的算法和系統(tǒng)去應(yīng)對。”自然語言計算組基于之前的研究積累,在此次的系統(tǒng)模型中增加了另外兩項新技術(shù):聯(lián)合訓(xùn)練(Joint Training)和一致性規(guī)范(Agreement Regularization),以提高翻譯的準確性。
聯(lián)合訓(xùn)練可以理解為用迭代的方式去改進翻譯系統(tǒng),用中英翻譯的句子對去補充反向翻譯系統(tǒng)的訓(xùn)練數(shù)據(jù)集,同樣的過程也可以反向進行。一致性規(guī)范則讓翻譯可以從左到右進行,也可以從右到左進行,最終讓兩個過程生成一致的翻譯結(jié)果。
▲微軟中-英翻譯系統(tǒng)試用界面
“這一機器翻譯研究成果可以應(yīng)用到人工智能的各個領(lǐng)域中”周明說。此外,它今后還將能夠準確、自然地翻譯其他語言,同時應(yīng)用到微軟的商用多語言翻譯系統(tǒng)產(chǎn)品中。
除了微軟,谷歌的研究人員也一直在致力于機器翻譯,包括使用神經(jīng)網(wǎng)絡(luò)的中英文查詢機器學(xué)習技術(shù)。這些技術(shù)已經(jīng)被用于改進谷歌面向消費者的產(chǎn)品中,比如谷歌翻譯的App,以及谷歌搜索。
微信搜索【AI商業(yè)報道】,獲取國內(nèi)外AI巨頭新動向及行業(yè)資訊!
- 美媒聚焦比亞迪“副業(yè)”:電子代工助力蘋果,下個大計劃瞄準AI機器人
- 微信零錢通新政策:銀行卡轉(zhuǎn)入資金提現(xiàn)免手續(xù)費引熱議
- 消息稱塔塔集團將收購和碩印度iPhone代工廠60%股份 并接管日常運營
- 蘋果揭秘自研芯片成功之道:領(lǐng)先技術(shù)與深度整合是關(guān)鍵
- 英偉達新一代Blackwell GPU面臨過熱挑戰(zhàn),交付延期引發(fā)市場關(guān)注
- 馬斯克能否成為 AI 部部長?硅谷與白宮的聯(lián)系日益緊密
- 余承東:Mate70將在26號發(fā)布,意外泄露引發(fā)關(guān)注
- 無人機“黑科技”亮相航展:全球首臺低空重力測量系統(tǒng)引關(guān)注
- 賽力斯發(fā)布聲明:未與任何伙伴聯(lián)合開展人形機器人合作
- 賽力斯觸及漲停,汽車整車股盤初強勢拉升
免責聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關(guān)資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負任何法律責任。任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。