上周網(wǎng)易有道公司舉辦了一場AI開放日活動(dòng),這雖然是有道公司第三次面向開發(fā)者舉辦AI開放日,但卻是向媒體首次開放,會(huì)上有道大秀AI肌肉,一口氣展示了20來項(xiàng)AI技術(shù),并通過旗下智云平臺(tái)全部向行業(yè)開放。
小編今天整理了一下,帶大家回顧下現(xiàn)場幾個(gè)印象比較深刻的技術(shù)。
欲摘取人工智能皇冠上的“明珠”國內(nèi)自然語言處理(NLP)哪家強(qiáng)?
正如有道首席科學(xué)家段亦濤詳解了有道在圍繞人類自然語言四大交互方式(聽、說、讀、寫)而展開,人工智能的目標(biāo)是要理解和復(fù)制人類的智能,而語言是繞不開的一大環(huán)節(jié)。 NLP更是被譽(yù)為人工智能皇冠上的明珠。
在人類對(duì)語言隔閡這一“自然現(xiàn)象”對(duì)戰(zhàn)的過程中,今年大火的人工智能翻譯硬件正在成為讓我們跨入一個(gè)全新時(shí)代的工具模板,有道發(fā)布了全新第二代產(chǎn)品-有道翻譯王2.0 Pro。
看完發(fā)布環(huán)節(jié),小編不禁想問如果機(jī)器翻譯技術(shù)都能變得這樣高效易用,相信我們也距離下次“進(jìn)化”不遠(yuǎn)了。那么在這樣一款A(yù)I翻譯機(jī)的背后,到底都需要哪些AI技術(shù)作為儲(chǔ)備?
其實(shí)網(wǎng)易有道一直以來都在累積機(jī)器翻譯技術(shù),在2008年的詞典時(shí)代,網(wǎng)易有道就應(yīng)用上了機(jī)器翻譯技術(shù)。經(jīng)過十年的累積,有道已經(jīng)積累了應(yīng)用于全場景、全應(yīng)用四大AI核心技術(shù)手段: 包括神經(jīng)網(wǎng)絡(luò)翻譯(NMT)、語音識(shí)別(ASR)、語音合成(TTS)、文字識(shí)別(OCR)。
當(dāng)然最重要的神經(jīng)網(wǎng)絡(luò)翻譯(NMT)技術(shù)是有道一直以來的“看家手藝”,相比一個(gè)個(gè)單詞逐字逐句的翻譯,神經(jīng)網(wǎng)絡(luò)翻譯會(huì)從整個(gè)句子進(jìn)行理解,結(jié)合上下文判斷詞義。生成的譯文自然也更加準(zhǔn)確,接近人類的語序。在翻譯界通用的評(píng)判標(biāo)準(zhǔn)BLEU中,英譯中和中譯英的BLEU值均領(lǐng)先同行7個(gè)多百分點(diǎn)。
(有道自研NMT技術(shù)目前實(shí)現(xiàn)以中文為核心語言的12種語言互譯,和以英文為核心語言的6種語言互譯,翻譯質(zhì)量均處于行業(yè)領(lǐng)先水平)
第二個(gè)文字識(shí)別技術(shù)(OCR),可以從圖片、PDF等等圖像介質(zhì)中識(shí)別文字,應(yīng)對(duì)拍照翻譯、多格式文檔翻譯一類問題。網(wǎng)易有道是國內(nèi)首家可以實(shí)現(xiàn)全自動(dòng)多語言混合識(shí)別、橫豎斜排版面自動(dòng)識(shí)別的廠商。這樣一來雙語學(xué)術(shù)文檔或是大規(guī)模圖片翻譯,都不再是難題。
(OCR技術(shù)走在全球前端,國內(nèi)多個(gè)第一)
那么基于優(yōu)勢(shì)的OCR技術(shù),目前有道的圖像翻譯實(shí)現(xiàn)了三大模式,用戶體驗(yàn)節(jié)節(jié)攀升。
再早之前的拍照翻譯自不用多說,“原圖翻譯”在拍照翻譯基礎(chǔ)上基于原圖識(shí)別背景做處理后對(duì)用戶體驗(yàn)再次進(jìn)行大幅改進(jìn)。
國內(nèi)首家AR實(shí)景翻譯,所見即所譯,對(duì)攝像頭中的文字內(nèi)容實(shí)時(shí)翻譯,這里面涉及到動(dòng)態(tài)追蹤、神經(jīng)網(wǎng)絡(luò)翻譯、OCR組段分析、AR渲染等復(fù)雜技術(shù)。
當(dāng)然,最重要的語音識(shí)別(ASR)也是機(jī)器翻譯中的另一項(xiàng)重點(diǎn)技術(shù)。在語音識(shí)別技術(shù)中,如何過濾環(huán)境雜音、準(zhǔn)確捕捉語音,又如何面對(duì)多人對(duì)話場景精準(zhǔn)的分割出完整的會(huì)話邏輯,都是讓智能翻譯硬件應(yīng)對(duì)顯示場景的要點(diǎn)。此次有道在多語音識(shí)別、離線語音識(shí)別的研究上都有很多進(jìn)展,也奠定了有道翻譯王此次離線功能的基礎(chǔ)。
值得一提的是,有道此次AI開放日上還展示了全新的語音翻譯體驗(yàn),采用流式語音識(shí)別、實(shí)時(shí)語音翻譯,用戶可以一邊說一邊即刻看到翻譯結(jié)果。這項(xiàng)技術(shù)有道翻譯官APP上率先應(yīng)用。
除了語音識(shí)別,語音合成(TTS)也是語音翻譯中的重要元素。翻譯后生成的語音能否模仿人類的聲音、口吻、停頓,成了機(jī)器翻譯比肩人工的重要元素。這次所展示的有道語音合成技術(shù)只需十分鐘的錄音文件就能模擬出原聲,合成效果與原聲真假難辨。除了增加機(jī)器翻譯的擬人能力,甚至還能應(yīng)用在教育場景中,讓AI模仿老師的聲音給孩子講課。
有了這“四大金剛”,一個(gè)基于人工智能的翻譯硬件才算有了核心的基礎(chǔ)設(shè)施。
人類的進(jìn)化標(biāo)志從使用工具開始:AI企業(yè)在幫助人們找到“新石器”
人類的歷史就是一部“工具和技術(shù)”發(fā)展史。 真正幫助人類進(jìn)化的,并不是一樣工具,而是技術(shù)的全面工具化。讓人類一步步從原始走向文明的,也不僅僅是石錐石斧某一樣工具,而是磨制石器的普及。AI企業(yè)正在做著類似的事情。
智能交互技術(shù)使智能設(shè)備聽懂人話看懂世界,并給予反饋。 有道首次對(duì)外披露的“有道魔鏡”技術(shù),“萬物可識(shí)別”的時(shí)代已經(jīng)到來!
語音助手功能基于購物場景中的實(shí)際應(yīng)用 。
在AI開放日上還一次性地針對(duì)教育、政企辦公和手機(jī)廠商三大行業(yè)詳細(xì)的AI解決方案。
可見網(wǎng)易有道想做的,不僅僅是一個(gè)工具的售賣者,而是技術(shù)工具化的普及者和推廣者。目前來看,這也是AI技術(shù)最顯著的趨勢(shì)。谷歌、百度等等巨頭企業(yè)也都在打造技術(shù)開放平臺(tái),幫助AI技術(shù)快速落地,和各行各業(yè)結(jié)合塑造出適用的工具,一起去改變?nèi)祟愖约骸⒏淖兪澜纭?/p>
免責(zé)聲明:此文內(nèi)容為第三方自媒體作者發(fā)布的觀察或評(píng)論性文章,所有文字和圖片版權(quán)歸作者所有,且僅代表作者個(gè)人觀點(diǎn),與極客網(wǎng)無關(guān)。文章僅供讀者參考,并請(qǐng)自行核實(shí)相關(guān)內(nèi)容。投訴郵箱:editor@fromgeek.com。
- 國產(chǎn)手機(jī)大勝,蘋果銷量大跌,難怪急哄哄降價(jià)千元
- 這里不止“羊毛月”,少年也在以電商助農(nóng)
- 同仁堂醫(yī)養(yǎng)IPO: “三位一體”診療服務(wù)體系高效協(xié)同 “中醫(yī)+”健康服務(wù)未來可期
- 走出群山,長賽道“攀登者”vivo
- 三線結(jié)構(gòu)光與升降LDS激光雷達(dá) 石頭自清潔掃拖機(jī)器人G30導(dǎo)航避障新里程
- 石頭科技閃耀CES2025 首創(chuàng)仿生機(jī)械手掃拖機(jī)器人
- TCL華星亮相CES2025,印刷OLED等創(chuàng)新顯示技術(shù)全球吸睛
- 科技云報(bào)到:從大模型到云端,“AI+云計(jì)算”還能講出什么新故事?
- 承載AI的云南花卉,正在盛開
- 打造個(gè)人辦公新范式,科大訊飛召開辦公智能體產(chǎn)品升級(jí)發(fā)布會(huì)
免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。