原標題:AI翻譯新應(yīng)用,百度、網(wǎng)易、科大訊飛的新藍海?
文/ 智能相對論
作者/ 離離
“由于漢化組成員身體抱恙,本周暫時停止更新?!笨吹竭@樣的消息,小武嘆了口氣,默默退出應(yīng)用程序。這已經(jīng)是他喜歡的動漫在兩個月內(nèi)的第三次停更了。
環(huán)視四周,上下班時間的公交和地鐵上,隨處可見戴著耳機盯著手機屏幕、利用碎片時間追番看劇的年輕人。在步調(diào)緊湊的現(xiàn)代生活中,觀看影視劇和動漫已經(jīng)成為不少上班族的日常娛樂消遣。
信息傳播的日漸便利,讓人們有機會在網(wǎng)絡(luò)上觀賞更多來自不同國家地區(qū)、各式各樣題材的影視動漫作品。但在那之前,字幕、對話的翻譯與排版,以及改漫作品的圖像繪制可是一項耗費人力物力及時間的大工程。一些較少人關(guān)注的小眾作品經(jīng)常因為翻譯問題而無法及時更新。
“像我喜歡的一些動漫及小說、影集改漫作品,可能受眾太少吧,大型平臺沒有引進,只能通過特定的粉絲論壇和網(wǎng)站收看。但這些網(wǎng)站的漢化時間與翻譯質(zhì)量十分不穩(wěn)定,有時也挺糟心的。”即便作品內(nèi)容可以及時更新,但缺少了漢化翻譯,像小武這類沒有日文基礎(chǔ)的讀者根本無法理解劇情發(fā)展。
隨著科技進步,人工智能已經(jīng)能在文本、圖像的識別與翻譯方面發(fā)揮不少作用,應(yīng)用及商業(yè)化也早已成熟,Google、微軟等不少互聯(lián)網(wǎng)及科技公司都曾推出相關(guān)的服務(wù)。
“智能相對論”看到, 國內(nèi)的互聯(lián)網(wǎng)公司也推出了不少AI翻譯產(chǎn)品,并已取得不錯的商業(yè)成果。如百度大腦AI開放平臺就推出了在線通用文本翻譯業(yè)務(wù),可實現(xiàn)兩百個以上的語種在線互譯,做到實時文本翻譯及譯文語音合成,能應(yīng)用于移動端、PC網(wǎng)站及各類智能硬件。
其文檔翻譯及圖片翻譯功能則可識別不同檔案及圖片格式,在不改變文檔格式的前提下完成翻譯工作。去年三月,百度翻譯的每日翻譯量已達到千億次;也為滬江網(wǎng)校、OPPO、海淘1號等不同領(lǐng)域的企業(yè)提供通用文本翻譯服務(wù)。
網(wǎng)易的有道智云平臺也提供實時語音翻譯、文本翻譯、圖片翻譯及部份語言離線翻譯等服務(wù),支持超過110個語種的自動識別與互譯,能為直播、錄播視頻提供實時字幕轉(zhuǎn)寫翻譯。騰訊云也推出了機器翻譯產(chǎn)品,可實現(xiàn)文本翻譯、語音翻譯、圖像翻譯等多種功能,支持API方式接入。
科大訊飛則基于語音識別技術(shù)推出了一個視頻譯制智能協(xié)作平臺,這款A(yù).I.視頻字幕制作應(yīng)用具備自動創(chuàng)建視頻字幕、字幕機器翻譯、在線校對、譯后編輯和團隊協(xié)作等功能,可利用人工智能機器翻譯,自動為外國視頻添加中文字幕,目前累計用戶為105萬。
即便現(xiàn)有的AI翻譯產(chǎn)品種類多樣,但漫畫的表現(xiàn)形式與一般文本不同,其翻譯嵌字問題并非一般的翻譯軟件就能解決。
來自不同角色的對話、擬聲詞、文字注解、旁白等主體和作用不同的文字都會出現(xiàn)在同一幅圖片中,一頁漫畫中的文字通常包含多種字體、大小,且漫畫中的對話框文本排版并無規(guī)律。面對此類特殊的表現(xiàn)形式,普通的翻譯軟件往往無法完整地讀取、識別所有需要翻譯的文字。
“之前我曾經(jīng)試過將原文漫畫圖片上傳翻譯軟件,但效果不佳。翻譯出來的文字經(jīng)常超出對話框,一些手繪、異形及不同大小的文字經(jīng)常沒法識別,整體而言作用不大,試過一次就沒再用了?!毙∥涓嬖V“智能相對論”。
為了幫助像小武這類的讀者即時看到翻譯完成的作品,并解決民翻盜版問題。去年,一家專門從事漫畫的機器翻譯技術(shù)公司完成了一款從識別、翻譯到嵌字都能自動完成的AI自動翻譯系統(tǒng)“Mantra Engine”。
AI漢化組coming
漫畫的翻譯工作主要可分為文本轉(zhuǎn)錄識別、對話框內(nèi)及背景文字翻譯、翻譯后的文本排版三個步驟。
在文本識別方面,Mantra的研究團隊開發(fā)了專門用于漫畫字符識別的OCR引擎,可定位識別來自不同角色的對話、擬聲詞、文字注解、旁白等主體和作用不同的異形文字,即便漫畫圖片十分擁擠也能夠辨識。
在內(nèi)容翻譯上,這款應(yīng)用程序針對漫畫常出現(xiàn)的,因角色轉(zhuǎn)換或畫面連貫造成的主賓語銜接或缺位口語對話模式,以及傳統(tǒng)商務(wù)翻譯中少見的口吃與結(jié)巴等特殊句式加強訓(xùn)練。
通過文本分組、文本閱讀順序、提取視覺語義三種方式,結(jié)合對話語意和角色情緒、動作,實現(xiàn)多模態(tài)的上下文感知,幫助翻譯出最符合角色人設(shè)、表情與情感的多語言譯文。
作為一套AI自動化翻譯引擎,Mantra可自動擦除原文字符,并于圖像上嵌入符合譯文語言形態(tài)的文字排版,包含對話框的增減、拆分與文字對齊等功能。為漫畫翻譯中耗時最久、人力成本最高的嵌字工作提供更加快速有效的自動化解決方案。
實驗結(jié)果顯示,這款程序比傳統(tǒng)人工翻譯所需時間減少了一半;整體而言可減少六成至七成的翻譯成本。目前,這套系統(tǒng)可輸出JPG、PNG和PDF等格式,但能翻譯的語言并不太多,翻譯結(jié)果也仍需人工修正。
研究團隊表示,下一步將提高翻譯準確度,開發(fā)針對漫畫表情的識別系統(tǒng),并計劃拓展可用語言。希望能將該技術(shù)以計量收費的形式,幫助漫畫出版行業(yè)拓展海外市場,并協(xié)助漫畫作者在社交媒體上自由地發(fā)布作品。
有待發(fā)現(xiàn)的需求
事實上,Mantra自動翻譯系統(tǒng)的誕生并非由于研發(fā)團隊創(chuàng)造了全新的先進技術(shù),而是研發(fā)者看到細分市場的需求,將已經(jīng)發(fā)展成熟的AI翻譯技術(shù)與圖像識別轉(zhuǎn)換加以融合應(yīng)用,試圖優(yōu)化現(xiàn)有的生產(chǎn)方式,希望在降低成本的同時提高產(chǎn)出效率。
雖然國內(nèi)的OCR識別與AI文本翻譯技術(shù)早已成熟,除了漫畫漢化所需的自動嵌字技術(shù)尚待開發(fā),不少互聯(lián)網(wǎng)公司已有能力提供多種類型的AI翻譯服務(wù)。但在商業(yè)應(yīng)用方面,仍集中于商務(wù)交流、出國旅游、教育學(xué)習方面。
目前市面上應(yīng)用于影視文化、知識產(chǎn)權(quán)等文化產(chǎn)業(yè)的AI翻譯產(chǎn)品大多為基于語音識別技術(shù)的視頻字幕語言轉(zhuǎn)換服務(wù),針對漫畫及圖書繪本的翻譯需求所設(shè)計的自動化解決方案尚未出現(xiàn),漫畫翻譯的市場需求似乎仍未受到關(guān)注。
“智能相對論”以百度為例,其文字識別服務(wù)雖包含卡證、票據(jù)等多場景的OCR識別,使用方式有云端、離現(xiàn)實別SDK、私有化部署等;文字翻譯方面,也提供AI翻譯定制化服務(wù),可由用戶自行上傳特定領(lǐng)域的語料庫,為AI翻譯模型進行訓(xùn)練。但在應(yīng)用場景上仍需要客戶“自行想象”,尚未發(fā)展出像Mantra那樣專門針對漫畫、指向明確的自動化“一條龍”翻譯服務(wù)。
近年,國內(nèi)語言服務(wù)行業(yè)涉及的翻譯服務(wù)領(lǐng)域呈現(xiàn)多樣化。《2019中國語言服務(wù)行業(yè)發(fā)展報告》顯示,在受訪企業(yè)中,影視文化與知識產(chǎn)權(quán)的訂單占比各占36.7%和36%。國內(nèi)二次元群體不斷擴大,在線動漫市場規(guī)模持續(xù)增長,用戶為內(nèi)容付費進出口逆差也不斷增加,漫畫翻譯的市場需求也逐漸明顯。
Mantra的出現(xiàn)為人工智能在動漫制作與傳播方面開啟了新的應(yīng)用模式與細分市場。從生產(chǎn)商與出版社的角度而言,可節(jié)省創(chuàng)作時間與勞動成本,在促進作品的海外傳播效率并防止盜版;站在小武等讀者的立場,能更快看到新鮮出爐的作品,不再為語言翻譯問題所苦。
在二次元文化“出圈”、動漫受眾不斷增加的今日,AI所帶來的生產(chǎn)力與傳播效率提升,或可帶來不少商業(yè)機會。以動漫大國日本為例,據(jù)日本出版科學(xué)研究所統(tǒng)計,2020年,日本漫畫市場規(guī)模較上一年增加23%,達6126億日元,創(chuàng)1978年開始統(tǒng)計以來的最高紀錄。
據(jù)艾瑞咨詢統(tǒng)計,中國泛二次元用戶規(guī)模自2014年來持續(xù)上升,至2019年已達3.9億人,在線動畫及漫畫市場規(guī)模進入穩(wěn)步增長?!?020微博動漫白皮書》顯示,微博泛二次元用戶同比增長11.4%,連續(xù)4年保持穩(wěn)定增長;54%的動漫用戶是內(nèi)容付費用戶。在泛娛樂融合的產(chǎn)業(yè)背景下,動漫行業(yè)前景可觀。
一如Clubhouse的爆火,即便多人在線語音通訊技術(shù)早已成熟、語音社交早已出現(xiàn),仍有部份需求未被覆蓋。就像Mantra告訴我們的,一些AI技術(shù)發(fā)展成熟后想要走的更遠,還需要更有想象力的應(yīng)用場景。對于掌握成熟AI翻譯技術(shù)的百度、網(wǎng)易、科大訊飛等企業(yè)而言,AI自動翻譯漫畫這個暫時未被注意的應(yīng)用場景或許能帶來新的機會。
- 蜜度索驥:以跨模態(tài)檢索技術(shù)助力“企宣”向上生長
- 美媒聚焦比亞迪“副業(yè)”:電子代工助力蘋果,下個大計劃瞄準AI機器人
- 微信零錢通新政策:銀行卡轉(zhuǎn)入資金提現(xiàn)免手續(xù)費引熱議
- 消息稱塔塔集團將收購和碩印度iPhone代工廠60%股份 并接管日常運營
- 蘋果揭秘自研芯片成功之道:領(lǐng)先技術(shù)與深度整合是關(guān)鍵
- 英偉達新一代Blackwell GPU面臨過熱挑戰(zhàn),交付延期引發(fā)市場關(guān)注
- 馬斯克能否成為 AI 部部長?硅谷與白宮的聯(lián)系日益緊密
- 余承東:Mate70將在26號發(fā)布,意外泄露引發(fā)關(guān)注
- 無人機“黑科技”亮相航展:全球首臺低空重力測量系統(tǒng)引關(guān)注
- 賽力斯發(fā)布聲明:未與任何伙伴聯(lián)合開展人形機器人合作
- 賽力斯觸及漲停,汽車整車股盤初強勢拉升
免責聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關(guān)資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負任何法律責任。任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。