語(yǔ)音行業(yè)在2000年左右,迎來(lái)了第一個(gè)產(chǎn)業(yè)高潮,起因是1997年IBM推出了一款語(yǔ)音錄入軟件ViaVoice。
當(dāng)時(shí)人們把這個(gè)軟件安裝到PC上,就可以在計(jì)算機(jī)前面朗讀報(bào)紙或者新聞內(nèi)容,或者錄入一些簡(jiǎn)單的日常用語(yǔ),識(shí)別率也還不錯(cuò)。于是工業(yè)界有了一次大規(guī)模連續(xù)語(yǔ)音識(shí)別的產(chǎn)業(yè)化應(yīng)用的熱潮。
但由于當(dāng)時(shí)PC是一個(gè)固定的環(huán)境,消費(fèi)者已經(jīng)習(xí)慣了鍵盤(pán)打字而不是對(duì)著屏幕說(shuō)話(huà),ViaVoice并沒(méi)有獲得廣泛認(rèn)可。最終IBM于2003年將這個(gè)產(chǎn)品賣(mài)了。
但語(yǔ)音識(shí)別的產(chǎn)業(yè)化應(yīng)用熱潮卻并沒(méi)有停止。4月12日,微軟公布了公司歷史上第二大金額的收購(gòu)案,目標(biāo)是語(yǔ)音識(shí)別巨頭Nuance Communications,交易價(jià)值達(dá)197億美元。
有意思的是,Nuance正是蘋(píng)果Siri語(yǔ)音分析背后的技術(shù)供應(yīng)商。
而幾乎是同一時(shí)間,在大洋彼岸百度和羅技也宣布了一場(chǎng)圍繞語(yǔ)音識(shí)別的戰(zhàn)略合作。
4月13日,百度正式發(fā)布“語(yǔ)音輸入服務(wù)”并宣布百度大腦和羅技達(dá)成合作,將領(lǐng)先的AI技術(shù)全面賦能羅技外設(shè)硬件,首款產(chǎn)品即是羅技即將發(fā)售的VOICE M380「智能鼠標(biāo)」。這款鼠標(biāo)嵌入了百度AI技術(shù),支持多國(guó)語(yǔ)言語(yǔ)音輸入、中英自由說(shuō)和智能翻譯等創(chuàng)新功能。
某種意義上,這可以看作是ViaVoice的一種精神繼承,也是對(duì)微軟收購(gòu)Nuance的價(jià)值肯定。
百度AI全面賦能羅技硬件
ViaVoice被變賣(mài)的6年后,語(yǔ)音技術(shù)產(chǎn)業(yè)應(yīng)用迎來(lái)了第二波高潮,這一波熱潮以互聯(lián)網(wǎng)需求和實(shí)現(xiàn)為基礎(chǔ)。今天我們隨處可見(jiàn)的機(jī)器對(duì)話(huà),也是在這一波高潮的基礎(chǔ)之上發(fā)展而來(lái)。
如今我們常在社交媒體上看到,一個(gè)大學(xué)生利用簡(jiǎn)單工具+一塊芯片的結(jié)構(gòu),就能設(shè)計(jì)出可以語(yǔ)音操控的DIY設(shè)備。
當(dāng)技術(shù)進(jìn)步、產(chǎn)業(yè)成熟、消費(fèi)者習(xí)慣養(yǎng)成、交互認(rèn)知足夠以及場(chǎng)景需求等等因素疊加,使得語(yǔ)音交互有了快速發(fā)展的沃土。
這些都可算作是百度AI對(duì)羅技產(chǎn)品賦能的充分條件,也是羅技迫切實(shí)現(xiàn)產(chǎn)品智能化的來(lái)由。
但落實(shí)到具體產(chǎn)品上,有兩個(gè)不能忽視的因素:
在鼠標(biāo)上加入「語(yǔ)音識(shí)別服務(wù)」模塊,對(duì)技術(shù)提供商的水平要求很高;
融合語(yǔ)音識(shí)別服務(wù)的傳統(tǒng)輸入設(shè)備,是滿(mǎn)足需求還是創(chuàng)造需求。
簡(jiǎn)單點(diǎn)說(shuō),「智能鼠標(biāo)」作為一個(gè)「新物種」,我們要重點(diǎn)關(guān)注的就兩個(gè)方面:好不好用和誰(shuí)會(huì)用。
先說(shuō)第一個(gè)因素。VOICE M380支持中、英、日三國(guó)語(yǔ)言,同時(shí)也支持中英文自由夾雜語(yǔ)音輸入,以及7種方言的混合語(yǔ)音輸入。同時(shí),VOICE M380支持中譯英、中譯日、中譯韓、中譯法、中譯西、中譯泰、英譯中、日譯中8種語(yǔ)音翻譯。
從功能上看,VOICE M380基本覆蓋了日常生活、學(xué)習(xí)、商務(wù)等場(chǎng)景的語(yǔ)音和翻譯需要。從語(yǔ)音識(shí)別服務(wù)的技術(shù)內(nèi)核看,這一次百度是將百度大腦的優(yōu)勢(shì)技術(shù)語(yǔ)音識(shí)別和機(jī)器翻譯功能拿出來(lái)優(yōu)先賦能羅技,其2019年百度推出并上線使用的流式多級(jí)的截?cái)嘧⒁饬δP蚐MLTA,已經(jīng)令中文語(yǔ)音識(shí)別率達(dá)到98.6%,且可以同時(shí)實(shí)現(xiàn)中英文混合識(shí)別、方言混合識(shí)別。
在機(jī)器翻譯方面,百度已經(jīng)支持203個(gè)語(yǔ)種的準(zhǔn)確翻譯,現(xiàn)在每天響應(yīng)超過(guò)千億字符的翻譯請(qǐng)求,相當(dāng)于2000部大英百科全書(shū)。而百度提出的語(yǔ)義單元驅(qū)動(dòng)的AI同傳模型,已經(jīng)達(dá)到了與人類(lèi)相當(dāng)?shù)姆g水平。
再說(shuō)第二個(gè)因素。實(shí)際上,「智能鼠標(biāo)」既是滿(mǎn)足需求也是創(chuàng)造需求。
一方面,「智能鼠標(biāo)」在學(xué)習(xí)、游戲、商務(wù)場(chǎng)景下,可以很好的滿(mǎn)足用戶(hù)跨語(yǔ)種的交流需要,譬如游戲、商務(wù)郵件。
另一方面,對(duì)于小孩、老人、視覺(jué)障礙人群等日常打字輸入比較不方便的群體,語(yǔ)音輸入顯然更方便,這又是「智能鼠標(biāo)」創(chuàng)造需求的一種體現(xiàn)。
而且,得益于百度AI技術(shù)的加持,VOICE M380在輸入效率上語(yǔ)音輸入每分鐘可高達(dá)400字,而多數(shù)打字員的輸入則為80-200字每分鐘。
無(wú)疑,具備語(yǔ)音識(shí)別服務(wù)的VOICE M380,可以使用戶(hù)擺脫大量敲擊鍵盤(pán)產(chǎn)生的疲勞感,輕松實(shí)現(xiàn)所說(shuō)即所得。
搞明白了好不好用和給誰(shuí)用這兩個(gè)因素,再回過(guò)頭看這一次百度AI對(duì)羅技的賦能,實(shí)際上是一次典型的定制化AI技術(shù)輸出,說(shuō)明百度AI的技術(shù)落地已經(jīng)可以實(shí)現(xiàn)模塊化運(yùn)作,更具靈活性的按需輸出。同時(shí),「智能鼠標(biāo)」這樣的新物種出現(xiàn),也是對(duì)其它硬件設(shè)備的一種啟示,萬(wàn)物皆可AI,萬(wàn)物皆可語(yǔ)音。
而且,就雙方宣布的信息來(lái)看,羅技旗下的設(shè)備還將繼續(xù)接入百度AI的技術(shù),進(jìn)而實(shí)現(xiàn)全面的智能化升級(jí)。
為什么是百度?
2019年11月28日,在百度大腦語(yǔ)音能力引擎論壇上,百度CTO王海峰博士對(duì)外公布了一組數(shù)據(jù),百度大腦語(yǔ)音能力引擎日均調(diào)用量已經(jīng)超過(guò)100億次。
而只過(guò)了不到一年時(shí)間,到2020年7月,這個(gè)數(shù)字就已超過(guò)155億次。
這155億次的語(yǔ)音能力調(diào)用量,除了百度App、百度地圖、小度音箱、百度輸入法等百度產(chǎn)品外,更多是來(lái)自被百度AI開(kāi)放平臺(tái)賦能的產(chǎn)業(yè)公司。
在百度AI開(kāi)放平臺(tái)官網(wǎng),可以在「合作伙伴」這一欄下找到多達(dá)220家大大小小的公司,這些公司無(wú)一不是利用百度AI技術(shù)實(shí)現(xiàn)產(chǎn)業(yè)改造和升級(jí)。
而與語(yǔ)音技術(shù)有關(guān)的公司,可以舉兩個(gè)比較典型的案例,一個(gè)是創(chuàng)維電視,另一個(gè)是瓴岳科技信貸。
大屏IoT的行業(yè)痛點(diǎn)在于信息檢索難和設(shè)備控制操作復(fù)雜,而如果增加語(yǔ)音交互能力,則相當(dāng)于重構(gòu)了整個(gè)AIoT設(shè)備生態(tài)的交互體驗(yàn)?;诎俣華I技術(shù),創(chuàng)維已經(jīng)在10個(gè)電視芯片型號(hào)、2500萬(wàn)臺(tái)電視上為消費(fèi)者提供語(yǔ)音交互功能。
瓴岳科技信貸將百度大腦的語(yǔ)音技術(shù)應(yīng)用在貸后領(lǐng)域,依托百度大腦呼叫中心實(shí)時(shí)語(yǔ)音識(shí)別等AI服務(wù)對(duì)用戶(hù)語(yǔ)音的準(zhǔn)確識(shí)別,瓴岳打造了降本提效的智能機(jī)器人。通過(guò)貸后智能機(jī)器人、智能語(yǔ)音質(zhì)檢的應(yīng)用,貸后人力投入降低61.47%,有效實(shí)現(xiàn)了合規(guī)和高效的運(yùn)營(yíng)體系,提高了客戶(hù)體驗(yàn)。
這次百度將百度大腦所具備優(yōu)勢(shì)的語(yǔ)音識(shí)別和實(shí)時(shí)翻譯技術(shù)拿出來(lái),全面賦能于羅技鍵盤(pán)、鼠標(biāo)產(chǎn)品,也是百度首次通過(guò)羅技鼠標(biāo),在PC端實(shí)現(xiàn)了中英文自由夾雜語(yǔ)音輸入。
而這也恰恰說(shuō)明,百度AI的技術(shù)落地具有足夠的靈活性。并且,通過(guò)這一次賦能羅技,外界也能清晰的感受到,AI所帶來(lái)的產(chǎn)業(yè)升級(jí)和改造,并不僅僅是滿(mǎn)足現(xiàn)有需求,更多的是創(chuàng)造需求,這就意味著傳統(tǒng)硬件設(shè)備在AI技術(shù)加持下,能夠產(chǎn)生新的溢價(jià)價(jià)值。
當(dāng)然,迫切想要實(shí)現(xiàn)產(chǎn)業(yè)智能化改造和升級(jí)的合作伙伴,仍要看AI技術(shù)提供商的「底色」。
單以語(yǔ)音識(shí)別服務(wù)來(lái)說(shuō),作為國(guó)內(nèi)AI領(lǐng)域的頭雁,百度的語(yǔ)音技術(shù)無(wú)論從準(zhǔn)確率還是識(shí)別速度角度,對(duì)比市面上其他的一些產(chǎn)品都是具備優(yōu)勢(shì)的,而且百度還針對(duì)羅技桌面級(jí)的場(chǎng)景進(jìn)行了單獨(dú)的優(yōu)化和適配,具備較強(qiáng)技術(shù)壁壘。
而所謂的優(yōu)勢(shì),無(wú)疑正是百度自研的鴻鵠芯片。
去年4月百度發(fā)布了自研的鴻鵠芯片,語(yǔ)音喚醒率更高,尤其高噪聲下首次喚醒率提升10%以上,語(yǔ)音語(yǔ)義識(shí)別也更準(zhǔn)確,識(shí)別錯(cuò)誤率平均降低30%,同時(shí)待機(jī)功耗更低,相比傳統(tǒng)芯片下降90%。
換句話(huà)說(shuō),今天的語(yǔ)音技術(shù)競(jìng)爭(zhēng)已經(jīng)從云端開(kāi)始向端側(cè)芯片延伸,而一顆芯片完成端側(cè)信號(hào)處理和喚醒成為一個(gè)明顯的市場(chǎng)需求。
這種AI語(yǔ)音芯片能夠顯著降低音箱的成本,并且提供更高精度的喚醒和識(shí)別能力。在汽車(chē)車(chē)載導(dǎo)航領(lǐng)域,AI語(yǔ)音芯片可以保證主芯片的負(fù)載安全,提升駕駛安全。
2020年,百度在智能音箱、車(chē)載導(dǎo)航和智能電視控制方面,落地了百度鴻鵠語(yǔ)音芯片
結(jié)尾
實(shí)際上,羅技VOICE M380鼠標(biāo)并不是市面上唯一的語(yǔ)音交互鼠標(biāo)產(chǎn)品,早在幾年前訊飛、小米、聯(lián)想等品牌也推出過(guò)類(lèi)似的產(chǎn)品。而百度與上述企業(yè)有所不同,作為語(yǔ)音技術(shù)服務(wù)提供商,百度已經(jīng)跳出了技術(shù)輸出這一階段,它所提供的服務(wù)已經(jīng)是一站式AIOT語(yǔ)音解決方案。
譬如在TCL發(fā)布的C12量子點(diǎn)Mini LED智屏上,"度家-AIOT語(yǔ)音語(yǔ)義平臺(tái)"不僅為T(mén)CL提供語(yǔ)音識(shí)別單項(xiàng)調(diào)用服務(wù),還提供語(yǔ)音語(yǔ)義全鏈路調(diào)用以及設(shè)備管理功能。
這或許是百度與其他語(yǔ)音技術(shù)服務(wù)提供商的最大區(qū)別之一,也是羅技選擇百度的理由之一。
但從科技產(chǎn)業(yè)的變革來(lái)看,語(yǔ)音交互將是未來(lái)十年甚至二十年的主要內(nèi)容。
市場(chǎng)調(diào)研機(jī)構(gòu)Strategy Analytics此前發(fā)布報(bào)告稱(chēng),到2023年,全球智能家居市場(chǎng)規(guī)模將達(dá)到1570億美元,而語(yǔ)音交互作為智能家居的底層交互系統(tǒng)之一,無(wú)疑將會(huì)得到空前的普及。
與此同時(shí),在汽車(chē)電動(dòng)化的進(jìn)程中,車(chē)載語(yǔ)音也將成為一個(gè)汽車(chē)的標(biāo)準(zhǔn)化產(chǎn)品。所以,語(yǔ)音技術(shù)的未來(lái)發(fā)展想象空間是非常大的。
而百度作為中國(guó)AI發(fā)展的標(biāo)桿、AI新型基礎(chǔ)設(shè)施,正持續(xù)對(duì)外輸出領(lǐng)先AI技術(shù),加速產(chǎn)業(yè)智能化升級(jí)。
百度與羅技在發(fā)布會(huì)上還提到,基于百度大腦技術(shù)引擎,在未來(lái)將持續(xù)推動(dòng)更多百度AI技術(shù)賦能羅技各類(lèi)優(yōu)秀硬件設(shè)備。
這也讓我們有所期待,AI技術(shù)可以全面落實(shí)在人們的衣食住行各個(gè)方面,未來(lái)用戶(hù)在每個(gè)場(chǎng)景都能享受到百度AI帶來(lái)的便利。
- 美媒聚焦比亞迪“副業(yè)”:電子代工助力蘋(píng)果,下個(gè)大計(jì)劃瞄準(zhǔn)AI機(jī)器人
- 微信零錢(qián)通新政策:銀行卡轉(zhuǎn)入資金提現(xiàn)免手續(xù)費(fèi)引熱議
- 消息稱(chēng)塔塔集團(tuán)將收購(gòu)和碩印度iPhone代工廠60%股份 并接管日常運(yùn)營(yíng)
- 蘋(píng)果揭秘自研芯片成功之道:領(lǐng)先技術(shù)與深度整合是關(guān)鍵
- 英偉達(dá)新一代Blackwell GPU面臨過(guò)熱挑戰(zhàn),交付延期引發(fā)市場(chǎng)關(guān)注
- 馬斯克能否成為 AI 部部長(zhǎng)?硅谷與白宮的聯(lián)系日益緊密
- 余承東:Mate70將在26號(hào)發(fā)布,意外泄露引發(fā)關(guān)注
- 無(wú)人機(jī)“黑科技”亮相航展:全球首臺(tái)低空重力測(cè)量系統(tǒng)引關(guān)注
- 賽力斯發(fā)布聲明:未與任何伙伴聯(lián)合開(kāi)展人形機(jī)器人合作
- 賽力斯觸及漲停,汽車(chē)整車(chē)股盤(pán)初強(qiáng)勢(shì)拉升
免責(zé)聲明:本網(wǎng)站內(nèi)容主要來(lái)自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁(yè)或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書(shū)面權(quán)利通知或不實(shí)情況說(shuō)明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開(kāi)相關(guān)鏈接。