為何專注語音識(shí)別的科大訊飛會(huì)成為AI領(lǐng)先者?

對(duì)于文字工作者而言,如何將演講者/被采訪人的語音轉(zhuǎn)化為文字是一個(gè)痛點(diǎn)、一個(gè)剛需。求助于速錄員是一個(gè)不錯(cuò)的選擇,尤其是那些專業(yè)領(lǐng)域的速錄員,比如在科技行業(yè),不懂AI或者VR等專業(yè)名詞的速錄員很容易在速記中鬧出笑話。

在今年9月份錘子手機(jī)的發(fā)布會(huì)上,錘子科技產(chǎn)品總監(jiān)朱蕭木秀了一段語音識(shí)別,這也讓科大訊飛的語音識(shí)別技術(shù)一下子增加了眾多“錘粉”。借助語音識(shí)別,原本需要一點(diǎn)點(diǎn)聆聽的語音可以轉(zhuǎn)變成快速閱讀的文字,這無疑是文字工作者的一大福利;但似乎也是速錄員這一職業(yè)的終結(jié)者。

在著名資訊公司麥肯錫最新發(fā)布的一項(xiàng)全球研究發(fā)現(xiàn),約45%的工作可以實(shí)現(xiàn)自動(dòng)化,這將影響到60%的崗位,其中三分之一的工作將被機(jī)器人替代。但與此同時(shí),麥肯錫也安慰人們,技術(shù)變革往往需要幾十年的時(shí)間才能被整個(gè)社會(huì)廣泛接納,人們還有時(shí)間去慢慢適應(yīng)。

不過,語音識(shí)別并非替代速錄員那么簡單,與人們?cè)谶^去用文字觸達(dá)虛擬世界的方式不同;未來,人們只需要通過語音就可以實(shí)現(xiàn)與虛擬世界的連接。因此,專注于語音識(shí)別的科大訊飛更有機(jī)會(huì)成為未來人工智能大爆發(fā)時(shí)代的領(lǐng)先者。

人類正在從文字時(shí)代進(jìn)入語音時(shí)代

計(jì)算機(jī)出現(xiàn)以來,人們與計(jì)算機(jī)之間的交互幾乎都是通過文字來實(shí)現(xiàn)。即便是代碼階段,某種程度上也可以看作是文字的交互方式;如今,語音正在替代文字。對(duì)此,“互聯(lián)網(wǎng)女皇”瑪麗· 米克( Mary Meeker )認(rèn)為,語音應(yīng)該是最有效的計(jì)算輸入形式。因?yàn)閷?duì)于消費(fèi)者,語音可以快速溝通、簡單方便、個(gè)性化并且無需鍵盤。

有統(tǒng)計(jì)數(shù)據(jù)顯示,機(jī)器對(duì)語音識(shí)別的正確率從2010年的約70%,提高到2016年的約90%。從這樣的速度看,語音時(shí)代可以說已經(jīng)到來,未來人們與智能終端的交互方式除了傳統(tǒng)的鍵盤文字輸入,語音將逐漸成為新的主流。

語音技術(shù)時(shí)代的開啟,所帶來的不僅僅是輸入的革命。在科大訊飛輪值總裁胡郁看來,語音技術(shù)將帶來7個(gè)層面的變革:1、輸入法,2、語音轉(zhuǎn)文字,3、翻譯,4、智能家居,5、自動(dòng)駕駛,6、機(jī)器人,7、教育。

嚴(yán)格來說,在不同的領(lǐng)域,語音技術(shù)都是基礎(chǔ)所在,是語音技術(shù)在這些領(lǐng)域的應(yīng)用所帶來的變革,每一個(gè)領(lǐng)域都不容小覷。以機(jī)器人為例,語音將一改計(jì)算機(jī)時(shí)代的鍵盤錄入,成為人機(jī)互動(dòng)的主流方式,這里所說的機(jī)器人不止是我們常見的人形機(jī)器人,很多時(shí)候,“系統(tǒng)”也可以稱之為機(jī)器人,而且不同的應(yīng)用場(chǎng)景可以誕生出不同類型的機(jī)器人,它們都能夠深入應(yīng)用到語音技術(shù)。

在不久的將來,IOT充分普及后,人們無需再通過手機(jī)這樣的智能終端與整個(gè)世界連接,只需要借助手表、紐扣等,你只需告訴他們:我想去吃飯,附近有什么好吃的?你就可以迅速獲得回復(fù),機(jī)器會(huì)告訴你附近有哪些好吃的地方,距離多遠(yuǎn),有沒有優(yōu)惠或者排隊(duì)人數(shù)多少的等信息。當(dāng)你確定去哪里時(shí),系統(tǒng)會(huì)告訴你如何到達(dá)那里,需要多少時(shí)間,并為你安排預(yù)約甚至是提前點(diǎn)菜等等。

不過,我們也大可不必?fù)?dān)心語音會(huì)完全替代文字作為主要的輸入方式,畢竟有很多的應(yīng)用場(chǎng)景里并不適合語音輸入,比如在公共場(chǎng)所,每個(gè)人都在與機(jī)器互相交流、自言自語,這樣的場(chǎng)面也是蠻怪異的。

科大訊飛打算成為怎樣的領(lǐng)先者?

嚴(yán)格來說,語音技術(shù)在未來的人工智能時(shí)代更像是一種基礎(chǔ)技術(shù),單純推動(dòng)技術(shù)的發(fā)展和應(yīng)用,最終很有可能只是為其他企業(yè)做嫁衣。如何在語音技術(shù)的基礎(chǔ)上孵化出更多的產(chǎn)品和應(yīng)用,才是像科大訊飛這樣的企業(yè)最大限度挖掘人工智能潛能的關(guān)鍵。

為此,日前科大訊飛基于“訊飛超腦”人工智能最新技術(shù)發(fā)布了一系列新品,包括萬物互聯(lián)輸入解決方案、訊飛聽見多語種翻譯、智能家居、智能服務(wù)機(jī)器人、智能車機(jī)、個(gè)性化語音合成、智慧教育等技術(shù)產(chǎn)品,更多是從科大訊飛人工智能技術(shù)在社會(huì)生活的創(chuàng)新應(yīng)用出發(fā)。

在翻譯領(lǐng)域,科大訊飛的中英互譯神器——“曉譯翻譯機(jī)”,可以快速、準(zhǔn)確地實(shí)現(xiàn)了中英口語的即時(shí)互譯,并支持漢維互譯功能,未來科大訊飛還將為之增加更多語種,實(shí)現(xiàn)不同語言之間的便捷交流。

在汽車領(lǐng)域,科大訊飛的汽車智能車載系統(tǒng)——飛魚助理,則將遠(yuǎn)場(chǎng)識(shí)別、全雙工、多輪交互、方言識(shí)別等技術(shù)應(yīng)用于汽車,可以在復(fù)雜的行車環(huán)境中輕松進(jìn)行通訊、導(dǎo)航操作,收聽了解多媒體娛樂信息,對(duì)車身進(jìn)行控制和信息查詢等服務(wù)。

在智能機(jī)器人領(lǐng)域,科大訊飛的智能客服機(jī)器人——曉曼,更是集合了科大訊飛的語音合成、語音識(shí)別、語義理解和人臉識(shí)別等多種技術(shù),結(jié)合麥克風(fēng)陣列、3D攝像頭、身份證讀卡器、取號(hào)小票機(jī)等外設(shè)應(yīng)用,以語音、觸屏、動(dòng)作等多模態(tài)的交互方式為用戶服務(wù)。

在智能家居領(lǐng)域,科大訊飛的超腦魔盒打造了一個(gè)通過語音便捷控制家居設(shè)備的智能環(huán)境;而在教育領(lǐng)域,科大訊飛通過學(xué)業(yè)數(shù)據(jù)采集和教學(xué)過程性數(shù)據(jù)分析,實(shí)現(xiàn)多維度教學(xué)發(fā)展性評(píng)價(jià)和基于知識(shí)點(diǎn)的學(xué)生個(gè)性化學(xué)習(xí)。

從以上種種可以看出,科大訊飛的野心是以語音技術(shù)這一基礎(chǔ)技術(shù)作為切入點(diǎn),由此衍生出更多的產(chǎn)品和應(yīng)用出來,在幫助人們視線智能生活的同時(shí),謀求更大的市場(chǎng)空間。這也正是科大訊飛所倡導(dǎo)的“人工智能+”,嚴(yán)格來說應(yīng)該叫“語音技術(shù)+”。

不管怎樣,科大訊飛都在一定程度上掌握了語音技術(shù)的“核心科技”,正如科大訊飛董事長劉慶峰所說,在人工智能時(shí)代,各細(xì)分領(lǐng)域的創(chuàng)業(yè)英雄更容易成功,只要你有創(chuàng)意、有品位、有感覺,能夠精準(zhǔn)滿足每一個(gè)人的個(gè)性化需求,你就再也不用擔(dān)心被別人的數(shù)據(jù)入口和資金瞬間血洗出場(chǎng)。

本文為科技新媒體“常言道”(微信公眾號(hào):changyandao1)出品,作者丁常彥。原創(chuàng)作品,歡迎轉(zhuǎn)載,轉(zhuǎn)載或引用請(qǐng)注明作者及來源。

免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。

2016-11-25
為何專注語音識(shí)別的科大訊飛會(huì)成為AI領(lǐng)先者?
語音識(shí)別并非替代速錄員那么簡單,與人們?cè)谶^去用文字觸達(dá)虛擬世界的方式不同;未來,人們只需要通過語音就可以實(shí)現(xiàn)與虛擬世界的連接。

長按掃碼 閱讀全文