百度牽頭成立的智能語音聯(lián)盟,或?qū)⒊蔀橹袊腁RM

語音技術作為人工智能的重點研究領域,不僅可以帶來全新的、變革式的人機交互方式,還有機會催生出人類和機器的情感交流。源于語音對人類的重要性,科技巨頭們再一次將目光投到了智能語音領域。

近日,由百度、海爾、京東、中興通訊、中國普天、北汽股份、京東方聯(lián)合發(fā)起,二十余家單位共同組成的智能語音知識產(chǎn)權產(chǎn)業(yè)聯(lián)盟正式成立。該聯(lián)盟通過組建專利池的方式,引導和促進語音技術跨行業(yè)的實施和應用,并對聯(lián)盟成員免費開放專利池專利。

理想主義者的分享

這是百度繼兩年前開放語音能力后,又一次“工程師式的理想主義”的實現(xiàn)?;谠谥悄苷Z音核心技術中的的長期積累,百度率先將首批滿足專利池標準的100多件語音技術專利放入專利池中開放許可給聯(lián)盟成員使用。

從開放語音能力,到開放技術專利,百度分享的初衷和盡頭永遠都是希望科技能真正解決人們的問題讓生活更美好。在過去的兩年中,包括聯(lián)想智能電視、小米手機、信利智能可穿戴設備、特斯拉電動汽車等廠商以及去哪兒、陌陌等APP都使用了百度語音開發(fā)技術成果。這種免費開放的合作接入為企業(yè)提供了語音問題的解決方案,極大的縮短了開發(fā)周期,也在一定程度上減少了開發(fā)成本。除此之外,對許多創(chuàng)業(yè)型的中小開發(fā)者而言,技術的開放為他們的創(chuàng)新提供了更多的可能。

同樣,事實也在不斷證明投桃總會報李,正是由于百度平臺技術的提供與核心技術的免費開放,才吸引到了更多更優(yōu)秀的開發(fā)者。對語音技術來說,一個重要依賴便是“語料”。大量開發(fā)者帶來足夠多的用戶頻繁使用語音功能所積累的語料,讓百度語音有機會被不斷訓練,進而提升了準確率、抗噪率、語義識別準確性,不斷獲得完善。同時也搭建了有效獲取用戶的生態(tài)系統(tǒng)。

在今年的百度世界大會上,百度首席科學家吳恩達就現(xiàn)場演示了百度新一代語音識別技術。測試顯示在比較嘈雜的環(huán)境下,機器識別已經(jīng)超過人類。百度語音識別率接近95%,成為目前世界上最先進的漢語語音識別技術。日前資料顯示,百度的漢語安靜環(huán)境普通話語音識別技術的識別相對錯誤率比現(xiàn)有技術降低15%以上,識別率已接近97%。而從95%-99%是量變到質(zhì)變的過程,這也許會徹底改變?nèi)伺c設備的交互方式。

語音技術的這一突破與百度開放的思維與模式是不無關系的,包括成立聯(lián)盟將專利拿出來分享,都是以一種更為開放的心態(tài)希望能夠共享語音技術成果,推動技術的進步和語音產(chǎn)業(yè)發(fā)展,服務于移動時代。這是一條樸實的道路卻有孕育創(chuàng)新與顛覆的泥土。

聯(lián)盟下的中國式顛覆

所謂顛覆式技術,就是說有一種技術可以取代原有技術,讓人類需求更好的實現(xiàn),語音識別也是如此。在2011年之前,語音識別技術主要是采用混合高斯模型。2011年深度學習技術引入語音識別領域,并推進了整個工業(yè)界的人工智能技術應用進入深度學習時代。

而隨著物聯(lián)網(wǎng)、車聯(lián)網(wǎng)的發(fā)展,將會有越來越多的設備對語音控制提出需求,因為語音識別是以一種非物理接觸式的交互方式,讓機器擁有真正的“聽覺”,使人們甩掉鍵盤。這將解放用戶的雙手,節(jié)省用戶的時間和體力,以百度新聞的語音播報為例,借助于自然語言處理技術生成新聞的摘要,在信息嚴重過載的今天,無異幫助用戶提高了信息獲取的效率。因此未來語音識別功能將向電腦芯片一樣,成為每個智能終端必備的能力。并實現(xiàn)人機交流之上智慧生活的重要切入口。

語音聯(lián)盟讓我想到了過去英國的ARM,它將技術專利開放出去,打破了技術壟斷,現(xiàn)在全球超過95%的智能手機和平板電腦都采用ARM的技術架構(gòu),讓各家企業(yè)都能享受到性能高、成本低、能耗低的芯片技術,讓老牌芯片制造商intel備受挑戰(zhàn)。

同樣,語音聯(lián)盟也許就是下一個中國式顛覆,未來通過分享語音技術專利及成果,可以在人工智能、移動互聯(lián)網(wǎng)、智能終端、智能家居、可穿戴設備等領域深入發(fā)展。比如用于聲控語音撥號系統(tǒng)、信息網(wǎng)絡查詢、醫(yī)療服務、銀行服務等,為更多產(chǎn)業(yè)上下游企業(yè)提供更多尖端技術,帶動智能語音以及相關產(chǎn)業(yè)的發(fā)展,形成新的業(yè)態(tài)與增長點。

語音聯(lián)盟通過開放式創(chuàng)新與開放式知識產(chǎn)權許可的結(jié)合,共享語音技術成果,孕育出一個連接各種智能硬件設備并且提供各式各樣服務的語音交互新平臺。甚至可以想象除了技術之外,語音識別這種富含人類情感的交流方式,未來的發(fā)展也許不僅僅是一個幫助我們解決問題的功能和應用,更是科學計算中情感與文化的承載與體現(xiàn)。

個人微信公眾號:太保亂談,對游戲感興趣的朋友可關注:toutiaoyouxi

極客網(wǎng)企業(yè)會員

免責聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網(wǎng)站對有關資料所引致的錯誤、不確或遺漏,概不負任何法律責任。任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權或存在不實內(nèi)容時,應及時向本網(wǎng)站提出書面權利通知或不實情況說明,并提供身份證明、權屬證明及詳細侵權或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關文章源頭核實,溝通刪除相關內(nèi)容或斷開相關鏈接。

2015-12-07
百度牽頭成立的智能語音聯(lián)盟,或?qū)⒊蔀橹袊腁RM
語音技術作為人工智能的重點研究領域,不僅可以帶來全新的、變革式的人機交互方式,還有機會催生出人類和機器的情感交流。源于語音對人類的重要性,科技巨頭們再一次將目光投到了智能語音領域。

長按掃碼 閱讀全文