用帽子戲法打破次元壁:當(dāng)武磊牽手科大訊飛

最近留心體育行業(yè)的人會(huì)發(fā)現(xiàn),體育界正和AI界產(chǎn)生奇妙的交織。

西班牙當(dāng)?shù)貢r(shí)間8月5日,科大訊飛旗下消費(fèi)者產(chǎn)品訊飛翻譯機(jī)與皇家西班牙人足球俱樂(lè)部及武磊簽約儀式在巴塞羅那正式舉辦。自此武磊正式成為科大訊飛翻譯機(jī)首位品牌代言人,訊飛翻譯機(jī)則成為皇家西班牙人足球俱樂(lè)部官方翻譯合作伙伴。

在人們的普遍印象里,體育明星接的代言大多是運(yùn)動(dòng)品牌。這次武磊與訊飛翻譯機(jī)牽手,一個(gè)是國(guó)際足球賽事上知名的中國(guó)面孔,另一個(gè)是中國(guó)AI領(lǐng)軍企業(yè)推出的經(jīng)典產(chǎn)品,兩者之間的次元壁,為什么會(huì)突然破裂呢?

從一位球員的異國(guó)之旅,看我們?yōu)槭裁葱枰g機(jī)

首先我們需要了解到的一點(diǎn)是,當(dāng)很多人沒有接觸過(guò)翻譯機(jī)時(shí),往往會(huì)產(chǎn)生疑惑——手機(jī)上有大量翻譯軟件,我們?yōu)槭裁催€需要翻譯機(jī)?

其實(shí)對(duì)于武磊這樣身處異國(guó)的體育從業(yè)者來(lái)說(shuō),他們所面臨的困難,恰好是與翻譯機(jī)產(chǎn)品的功能相匹配的。我們不如想象一下,當(dāng)一位球員開啟異國(guó)之旅時(shí),在語(yǔ)言上會(huì)遇到哪些困難?

比較典型的是,當(dāng)我們趕赴海外時(shí),很快會(huì)發(fā)現(xiàn)大語(yǔ)種的普及率遠(yuǎn)沒有想象中那么高。就拿官方語(yǔ)言是西語(yǔ)的西班牙來(lái)說(shuō),也會(huì)有不少說(shuō)著小語(yǔ)種的移民。即使他們會(huì)說(shuō)官方語(yǔ)言,也常常因口音問(wèn)題出現(xiàn)難以理解的情況,尤其對(duì)于足球運(yùn)動(dòng)員這種工作環(huán)境相當(dāng)國(guó)際化的行業(yè)來(lái)說(shuō)更是如此。

這時(shí)想要與當(dāng)?shù)厝诉M(jìn)行通暢交流,光憑手機(jī)軟件上的幾種官方語(yǔ)言顯然是遠(yuǎn)不足夠的。

另外當(dāng)我們想到與他人交流時(shí),下意識(shí)涌入腦海的通常都是問(wèn)好、點(diǎn)菜等等旅游日常用語(yǔ)。實(shí)際對(duì)于武磊這種深入異國(guó)生活工作的人來(lái)說(shuō),每天面對(duì)的卻是大量行業(yè)術(shù)語(yǔ)。舉例來(lái)講,Sweeper一詞,在日常用語(yǔ)中是清潔工、掃地機(jī)器人的意思,但在足球行業(yè)中的解釋卻是“自由中衛(wèi)”。

這一點(diǎn)別說(shuō)是翻譯軟件,恐怕就連人工翻譯面對(duì)不同的領(lǐng)域都不一定能順利完成任務(wù)。

當(dāng)然還有最常出現(xiàn)的網(wǎng)絡(luò)問(wèn)題,在海外很多地方,互聯(lián)網(wǎng)信號(hào)鋪設(shè)是遠(yuǎn)不如中國(guó)的。當(dāng)網(wǎng)絡(luò)情況不支持翻譯軟件的云端數(shù)據(jù)請(qǐng)求時(shí),依賴互聯(lián)網(wǎng)的翻譯軟件顯然無(wú)法發(fā)揮作用。這一點(diǎn)對(duì)于頻繁出差,常常要面臨無(wú)網(wǎng)絡(luò)情況的球員來(lái)說(shuō)尤其如此。

總之我們可以發(fā)現(xiàn),在海外溝通需求上,還有很多場(chǎng)景存在的痛點(diǎn),是單純的翻譯軟件無(wú)法解決的。

訊飛翻譯機(jī)3.0的帽子戲法

在科大訊飛最新推出的訊飛翻譯機(jī)3.0上,我們就能清晰地看到翻譯機(jī)產(chǎn)品是如何解決上述問(wèn)題的。

首先是兩項(xiàng)“特殊能力”,方言翻譯和行業(yè)翻譯。

通過(guò)對(duì)海量方言語(yǔ)言數(shù)據(jù)的收集和標(biāo)注,科大訊飛獲得了獨(dú)有的方言數(shù)據(jù)集,增強(qiáng)語(yǔ)音識(shí)別算法的魯棒性。其中不僅包括中文的粵語(yǔ)、東北話、四川話、河南話,也包括了外語(yǔ)中頗令人頭疼的“印度腔英語(yǔ)”、“澳大利亞腔英語(yǔ)”等等。這一系列方言都可以被精準(zhǔn)識(shí)別,從而保證翻譯的正確性。

面對(duì)復(fù)雜的行業(yè)術(shù)語(yǔ),科大訊飛根據(jù)行業(yè)數(shù)據(jù)累積集合專家知識(shí),構(gòu)建了用于不同行業(yè)的知識(shí)圖譜,包括體育、醫(yī)療、金融、法律等七個(gè)行業(yè)。如此以來(lái),就可以很好地避免同一詞匯在不同行業(yè)術(shù)語(yǔ)中寓意不同而造成的翻譯錯(cuò)誤,提供更專業(yè)精準(zhǔn)的翻譯,也方便那些在海外生活、工作的人應(yīng)對(duì)不同場(chǎng)合的溝通需求。

除了特殊能力之外,訊飛翻譯機(jī)3.0上還能看到訊飛扎實(shí)的“基本功”。

其中包括原創(chuàng)自進(jìn)化離線引擎,通過(guò)終端算力與引擎的配合,支持弱網(wǎng)絡(luò)、無(wú)網(wǎng)絡(luò)情況下的翻譯需求。同時(shí)還有拍照翻譯能力,通過(guò)OCR識(shí)別從圖片中提取文字,進(jìn)而能滿足紙張、路牌、菜單等等語(yǔ)音之外的文本翻譯需求。

從特殊能力到基本功,訊飛翻譯機(jī)3.0使出了一套漂亮的帽子戲法,滿足了人們?cè)诜g上的三層需求。

1、 在溝通對(duì)象上的廣泛性。除了與服務(wù)人員這類官方語(yǔ)言標(biāo)準(zhǔn)的對(duì)象進(jìn)行溝通外,人們同樣也有與非服務(wù)人員溝通的需求,比如藥店的醫(yī)生、警察局里的警察等等。如果在海外工作、學(xué)習(xí)和生活,更要和各種各樣的當(dāng)?shù)鼐用翊蚪坏?。而方言翻譯的能力,就可以滿足人們?cè)谶@方面的需求。

2、 在溝通內(nèi)容上的深入性。隨著中國(guó)在國(guó)際化道路上越走越遠(yuǎn),我們?cè)诤M鉁贤ㄉ系男枨笠苍絹?lái)越多樣。大量中國(guó)人開始趕赴海外投資、就業(yè)、讀書,所涉及到的專業(yè)領(lǐng)域也越來(lái)越多。只有行業(yè)翻譯能力越來(lái)越豐富,才能滿足這種趨勢(shì)。

3、 在溝通能力上的穩(wěn)定性。想要人們對(duì)技術(shù)產(chǎn)生信任乃至依賴,保持繼續(xù)在各種環(huán)境下的穩(wěn)定表現(xiàn)是很重要的。其中就包括了不同網(wǎng)絡(luò)環(huán)境和不同的翻譯內(nèi)容介質(zhì)。一個(gè)人想要依靠機(jī)器翻譯能力在海外順暢的游玩甚至就業(yè),自然需要翻譯機(jī)在各種網(wǎng)絡(luò)環(huán)境下都能平穩(wěn)運(yùn)行,并且能應(yīng)對(duì)語(yǔ)音、文字、圖像等等多種翻譯需求。

通天塔的磚石:科大訊飛的技術(shù)底氣

和球場(chǎng)上一樣,神奇的帽子戲法不是天降奇跡,而是來(lái)自于球員長(zhǎng)期以來(lái)的累積。

訊飛翻譯機(jī)3.0的對(duì)于三層需求的滿足,究其根由來(lái)自于科大訊飛在機(jī)器翻譯技術(shù)上的累積。

科大訊飛的翻譯技術(shù)由神經(jīng)網(wǎng)絡(luò)機(jī)器翻譯驅(qū)動(dòng),相比統(tǒng)計(jì)方法的機(jī)器翻譯技術(shù),神經(jīng)網(wǎng)絡(luò)機(jī)器翻譯可以將語(yǔ)句向量化,轉(zhuǎn)化為計(jì)算機(jī)可以理解的形式再生成譯文。這樣一來(lái),可以極大地加快語(yǔ)料學(xué)習(xí)速度,并提升譯文的流暢性。

從科大訊飛發(fā)布過(guò)的論文《基于中斷循環(huán)神經(jīng)網(wǎng)絡(luò)的文本分類》來(lái)看,科大訊飛通過(guò)對(duì)CNN和RNN進(jìn)行變體,用全新的模型捕捉長(zhǎng)距離依賴信息,理解語(yǔ)境和上下文,又可以很好地抽取關(guān)鍵短語(yǔ)信息,保證翻譯的準(zhǔn)確性。

建立在技術(shù)底氣之下,科大訊飛機(jī)器翻譯技術(shù)取得了很多讓人印象深刻的成績(jī):2018、2019年,科大訊飛在智能語(yǔ)音及人工智能領(lǐng)域獲得20項(xiàng)世界冠軍,在語(yǔ)音識(shí)別、語(yǔ)音合成、機(jī)器翻譯等領(lǐng)域都占據(jù)國(guó)際領(lǐng)先優(yōu)勢(shì)。作為最早將神經(jīng)網(wǎng)絡(luò)算法應(yīng)用于機(jī)器翻譯領(lǐng)域的品牌,訊飛翻譯機(jī)中英離線翻譯準(zhǔn)確率高達(dá)95%,接近于大學(xué)英語(yǔ)六級(jí)水平。訊飛翻譯機(jī)所使用的機(jī)器翻譯系統(tǒng)達(dá)到了國(guó)家翻譯專業(yè)資格認(rèn)證考試(CATTI)技術(shù)標(biāo)準(zhǔn),比肩專業(yè)譯員水平;并連續(xù)十四年獲得 “國(guó)際語(yǔ)音合成大賽”冠軍。此外,訊飛翻譯機(jī)所使用的語(yǔ)言識(shí)別技術(shù)已經(jīng)連續(xù)兩屆獲得CHiME Challenge(國(guó)際多通道語(yǔ)音分離和識(shí)別大賽)冠軍。在剛剛結(jié)束的Blizzard Challenge 2019 國(guó)際語(yǔ)音合成大賽中,科大訊飛再次奪冠,拿下了該賽事的第14個(gè)冠軍。

憑借技術(shù)上的能力和口碑,科大訊飛還為整個(gè)行業(yè)制定下了AI翻譯標(biāo)準(zhǔn)——清、懂、準(zhǔn)和美。聽得清、聽得懂、語(yǔ)義準(zhǔn)、語(yǔ)言美??梢娍拼笥嶏w的目標(biāo),是讓機(jī)器翻譯達(dá)到人們?nèi)粘贤▽?duì)話時(shí)的標(biāo)準(zhǔn)。從這一標(biāo)準(zhǔn)中我們也能發(fā)現(xiàn),翻譯的本質(zhì),就是“溝通”,讓不同語(yǔ)言、不同文化、不同行業(yè)之間的人進(jìn)行順暢溝通。

結(jié)束語(yǔ)

訊飛翻譯機(jī)與武磊,機(jī)器翻譯與體育運(yùn)動(dòng),這些看似毫不相及領(lǐng)域之間次元壁的破裂,實(shí)則證明了AI與文體結(jié)合之后,所碰撞出的強(qiáng)大力量。這一次合作背后,也展示出了科大訊飛借以訊飛翻譯機(jī)更高效打入C端應(yīng)用市場(chǎng)的決心。

相信未來(lái)我們將會(huì)看到,科大訊飛在追求技術(shù)高度的同時(shí),將不斷推出更多適用性廣泛的軟硬件,把技術(shù)能力賦能到生活場(chǎng)景,讓AI在真正的應(yīng)用場(chǎng)景破土生長(zhǎng)。

免責(zé)聲明:此文內(nèi)容為第三方自媒體作者發(fā)布的觀察或評(píng)論性文章,所有文字和圖片版權(quán)歸作者所有,且僅代表作者個(gè)人觀點(diǎn),與極客網(wǎng)無(wú)關(guān)。文章僅供讀者參考,并請(qǐng)自行核實(shí)相關(guān)內(nèi)容。投訴郵箱:editor@fromgeek.com。

免責(zé)聲明:本網(wǎng)站內(nèi)容主要來(lái)自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁(yè)或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說(shuō)明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。

2019-08-09
用帽子戲法打破次元壁:當(dāng)武磊牽手科大訊飛
如此以來(lái),就可以很好地避免同一詞匯在不同行業(yè)術(shù)語(yǔ)中寓意不同而造成的翻譯錯(cuò)誤,提供更專業(yè)精準(zhǔn)的翻譯,也方便那些在海外生活、工作的人應(yīng)對(duì)不同場(chǎng)合的溝通需求。

長(zhǎng)按掃碼 閱讀全文