1969年7月20日,美國(guó)宇航員尼爾•阿姆斯特朗走出登月艙,標(biāo)志人類征服了地球引力,而與其同時(shí)啟動(dòng)的“機(jī)器翻譯”計(jì)劃 ,50年過(guò)去了,仍然是一個(gè)世紀(jì)難題?!∑鋵?shí),從公元前5000新石器時(shí)代開(kāi)始,人們一直在為跨語(yǔ)言的溝通和交流堅(jiān)持不懈的努力,從人工翻譯到機(jī)器翻譯,到今天的人機(jī)結(jié)合,7000年左右時(shí)光中均未有實(shí)質(zhì)性的進(jìn)展和突破,那么人類語(yǔ)言有什么獨(dú)特之處,比登月還難的翻譯難究竟難在何處?人工智能驅(qū)動(dòng)下翻譯難題如何破解?誰(shuí)能回答這個(gè)終極之問(wèn)?
人類語(yǔ)言的特點(diǎn)決定翻譯具有不可譯性
語(yǔ)言是人類后天文化、思維與社會(huì)環(huán)境等諸多因素作用的結(jié)果,不能離開(kāi)人類大腦的分析而單獨(dú)存在,在多種因素的作用下,使得不同社會(huì)環(huán)境中的人群之間交流充滿障礙, 也使得不同語(yǔ)言間的轉(zhuǎn)換更為困難。
Transn傳神董事長(zhǎng)何恩培認(rèn)為:“語(yǔ)言是人類大腦思維產(chǎn)生反應(yīng)和工具,是眼、耳、鼻、口、舌六維通過(guò)口一維的表達(dá)方式,而且是人類必須使用的、無(wú)可選擇的溝通方式;而且同樣語(yǔ)言和詞匯,不同場(chǎng)景含義是不一樣的,要結(jié)合經(jīng)歷、屬性等大腦產(chǎn)生反應(yīng)進(jìn)行分析定義,當(dāng)語(yǔ)言發(fā)展到一個(gè)較為完備的狀態(tài)的時(shí)候,文字就順其自然的產(chǎn)生了,因此文字單獨(dú)存在沒(méi)有任何意義,文字要和大腦產(chǎn)生作用才能產(chǎn)生價(jià)值。”
在他看來(lái),文字是文化的支撐,文化的形成是一個(gè)需要時(shí)間積累的緩慢過(guò)程,是一個(gè)群體的生活共識(shí),當(dāng)形成這個(gè)群體的共識(shí)文化之后,具有不可推論、不可預(yù)測(cè)和不可論證,比如一些文章文字順序?qū)φ{(diào)或者沒(méi)有按照正常順序排列,并不影響人們正常閱讀。
例如下面這段話:
“研表究明,漢字序順并不定一影閱響讀。比如當(dāng)你看完這句話后,才發(fā)這現(xiàn)里的字全是都亂的。”
我們能夠看得懂是因?yàn)槲覀冄劬Λ@取的信息到達(dá)大腦經(jīng)過(guò)分析,能夠獲取到正確的意思。
不可推論、不可預(yù)測(cè)體現(xiàn)在,對(duì)同樣事物的語(yǔ)言表達(dá)今天和明天表達(dá)語(yǔ)境、邏輯、心情等具有不一樣,無(wú)法整齊劃一的預(yù)測(cè)。
同時(shí),由于語(yǔ)言內(nèi)部詞匯、句法等結(jié)構(gòu)的巨大差異,以及語(yǔ)言作為社會(huì)、文化等向外表達(dá)綜合體現(xiàn), 不同群體間的語(yǔ)言無(wú)法在轉(zhuǎn)化中做到絕對(duì)的等值。
美國(guó)語(yǔ)言學(xué)家奈達(dá)在《對(duì)等的原則》中也指出:“在語(yǔ)言間不可能做到完全的對(duì)等, 因此也沒(méi)有完全準(zhǔn)確的翻譯。譯文的總體影響只會(huì)接近原文, 而不可能在具體內(nèi)容上一致”。
技術(shù)性本質(zhì)決定機(jī)器翻譯具有天然的弊端
機(jī)器翻譯是通過(guò)計(jì)算機(jī)實(shí)現(xiàn)從一種自然語(yǔ)言文本到另一種或多種自然語(yǔ)言文本的翻譯,涉及到自然語(yǔ)言(Natural Language)的拆分、轉(zhuǎn)換、分析、組合,還要將語(yǔ)意和語(yǔ)境理解分析,將詞匯嵌入其中搭配組合,并且形成記錄不斷修正、糾錯(cuò),已涵蓋了自然語(yǔ)言處理的所有技術(shù)。
從起初的建立詞典和語(yǔ)法規(guī)則庫(kù),到語(yǔ)料庫(kù)和統(tǒng)計(jì)學(xué)規(guī)律,再到當(dāng)今流行的人工智能神經(jīng)網(wǎng)絡(luò),無(wú)論機(jī)器翻譯如何發(fā)展, 終究逃脫不了其技術(shù)的本性。
從其本質(zhì)來(lái)看,機(jī)器翻譯是一種“拆解”方式,即人為地將自然語(yǔ)言劃分為語(yǔ)法、結(jié)構(gòu)等,用規(guī)則約束它, 把拆分的碎片化納入“語(yǔ)料庫(kù)”中, 再賦予一定的算法模型,但值得注意的是,人類語(yǔ)言是不能被形式化、單義化、被強(qiáng)求和程序化的,否則這種 “自然性”被破壞之后,就缺乏了其本身所具有的藝術(shù)性、模糊性和靈活性。
人類的語(yǔ)言是較復(fù)雜的, 人與人交流的時(shí)候都有可能產(chǎn)生誤解, 更不用說(shuō)機(jī)器了, 所以機(jī)器翻譯或許可能無(wú)限接近人能夠讀懂和理解的能力,滿足基本“正確性”要求,在實(shí)際的翻譯過(guò)程中不是簡(jiǎn)單的對(duì)字面意思進(jìn)行翻譯, 還需要對(duì)作者想要表達(dá)的言外之意進(jìn)行深入領(lǐng)會(huì), 這是機(jī)器所欠缺的。
圖注:百度指數(shù)提供的“人工翻譯”“機(jī)器翻譯”關(guān)注度走勢(shì)圖
近些年來(lái),基于神經(jīng)網(wǎng)絡(luò)的翻譯可以學(xué)習(xí)和收集信息模仿人類大腦的神經(jīng)元建立聯(lián)系,充分利用上下文信息,對(duì)句子進(jìn)行整體編碼和解碼,從而生成更為流暢的譯文,于是人們樂(lè)觀地認(rèn)為機(jī)器翻譯將替代人類時(shí)代來(lái)臨,使用時(shí)才發(fā)現(xiàn)翻譯質(zhì)量太差,開(kāi)始懷疑機(jī)器翻譯而回歸到人工翻譯。
Transn傳神認(rèn)為,盡管機(jī)器翻譯在一定程度上保證翻譯的高效性和準(zhǔn)確性,但是可讀性和流暢性始終存在很大欠缺,滿足不了人們閱讀精細(xì)化的需求,如果要保證翻譯具有流暢性和可讀性,又要有“言外之意”,必須需要人工的干預(yù),即需要具備一定能力的專家對(duì)機(jī)器翻譯內(nèi)容進(jìn)行修改審校,彌補(bǔ)其不足。
所謂的“人工干預(yù)”,就是機(jī)器輔助人翻譯的“譯后編輯”,翻譯的效率背后還是由人類譯員的能力決定的。
人工翻譯“非標(biāo)化”和“極限值”決定翻譯難以有發(fā)展
翻譯活動(dòng)本身不僅僅涉及語(yǔ)言本身, 語(yǔ)言背后的社會(huì)、文化、經(jīng)濟(jì)、政治等因素決定了其是一個(gè)跨學(xué)科的交際行為,是人類譯者在一個(gè)復(fù)雜的生態(tài)系統(tǒng)中進(jìn)行適應(yīng)、進(jìn)化的過(guò)程,是一個(gè)非標(biāo)化的翻譯活動(dòng)。
如果把一篇文章給1000個(gè)不同的人翻譯,結(jié)果都不一樣,因?yàn)槊總€(gè)人教育背景、知識(shí)環(huán)境、文化、情感等不一樣。
值得注意的是,人類譯員在翻譯效率上劣勢(shì),決定了單純依靠人工翻譯難以有量的發(fā)展,無(wú)法滿足人類的需求。
Transn傳神董事長(zhǎng)何恩培舉了個(gè)實(shí)例,假設(shè)譯員翻譯的極限速度分鐘180個(gè)字,人的閱讀每分鐘1500字,二者有 7-15倍的差距,人工翻譯難以滿足人類實(shí)際閱讀速度需求。
在當(dāng)今信息爆炸時(shí)代,人們學(xué)習(xí)和獲取知識(shí)的速度以及需求也在急劇增長(zhǎng),人工翻譯的極限的天花板決定了其發(fā)展難以跟上信息的裂變式速度。
圖注:人類知識(shí)數(shù)據(jù)的增長(zhǎng)周期
聯(lián)合國(guó)教科文組織的研究表明:在18世紀(jì)時(shí),知識(shí)更新周期為80-90年;19世紀(jì)到20世紀(jì)初,知識(shí)更新周期縮短為30年;上世紀(jì)六七十年代,周期為5-10年;而進(jìn)入新世紀(jì),已縮短至2-3年,2010年之后周期變?yōu)?年。甚至有人預(yù)測(cè),2020年,知識(shí)更新周期將在每73天內(nèi)翻1倍。
人類語(yǔ)言猶如一條復(fù)雜的地下河,人類一直借助機(jī)器和人工智能破解“跨語(yǔ)言溝通”翻譯難題,機(jī)器翻譯、人工翻譯以及二者結(jié)合的人機(jī)共譯模式下均各有弊端,但人類從未放棄過(guò)嘗試和探索,Transn傳神始終以“讓人類溝通沒(méi)有語(yǔ)言障礙”為使命,提出第三產(chǎn)能“Twinslator”全新理念,讓“人賦慧于機(jī)器,機(jī)器賦能于人”,未來(lái)已來(lái),其或?qū)⒊蔀榻鉀Q人類多語(yǔ)溝通的最佳實(shí)踐手段。
- 蜜度索驥:以跨模態(tài)檢索技術(shù)助力“企宣”向上生長(zhǎng)
- 為什么年輕人不愛(ài)換手機(jī)了
- 柔宇科技未履行金額近億元被曝已6個(gè)月發(fā)不出工資
- 柔宇科技被曝已6個(gè)月發(fā)不出工資 公司回應(yīng)欠薪有補(bǔ)償方案
- 第六座“綠動(dòng)未來(lái)”環(huán)保公益圖書(shū)館落地貴州山區(qū)小學(xué)
- 窺見(jiàn)“新紀(jì)元”,2021元宇宙產(chǎn)業(yè)發(fā)展高峰論壇“廣州啟幕”
- 以人為本,景悅科技解讀智慧城市發(fā)展新理念
- 紐迪瑞科技/NDT賦能黑鯊4 Pro游戲手機(jī)打造全新一代屏幕壓感
- 清潔家電新老玩家市場(chǎng)定位清晰,攜手共進(jìn),核心技術(shù)決定未來(lái)
- 新思科技與芯耀輝在IP產(chǎn)品領(lǐng)域達(dá)成戰(zhàn)略合作伙伴關(guān)系
- 芯耀輝加速全球化部署,任命原Intel高管出任全球總裁
免責(zé)聲明:本網(wǎng)站內(nèi)容主要來(lái)自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁(yè)或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書(shū)面權(quán)利通知或不實(shí)情況說(shuō)明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開(kāi)相關(guān)鏈接。