引言:AIoT,用技術(shù)改變生活!
若說當(dāng)今時代的關(guān)鍵詞,“AIoT”當(dāng)之無愧。“AIoT”也就是“AI+IoT”,指的是人工智能技術(shù)與物聯(lián)網(wǎng)在實際應(yīng)用中的落地融合。目前,越來越多的行業(yè)及應(yīng)用將AI與IoT結(jié)合到了一起,AIoT已經(jīng)成為各大傳統(tǒng)行業(yè)智能化升級的最佳通道,也是未來物聯(lián)網(wǎng)發(fā)展的必然趨勢。
作為人工智能應(yīng)用最成熟的技術(shù)之一,智能語音技術(shù)在AIoT領(lǐng)域應(yīng)用十分廣泛。B 端的醫(yī)療、教育行業(yè);C 端的智能手機、智能家居、智能穿戴設(shè)備中智能語音技術(shù)的新賦能,都讓我們都看到了這項新技術(shù)給我們生活帶來的巨大改變。
根據(jù)中投顧問發(fā)布的《 2018-2022 年中國智能語音行業(yè)深度調(diào)研及投資前景預(yù)測報告》顯示,智能語音應(yīng)用將是人工智能發(fā)展的重點方向。
目前,國家正在加快人工智能的產(chǎn)業(yè)布局,發(fā)布多項利好政策促進人工智能產(chǎn)業(yè)發(fā)展;5G時代的來臨更是為人工智能的發(fā)展培育了一片物聯(lián)網(wǎng)沃土。我們可以預(yù)見,智能語音作為下一代人機交互的新入口,將率先在這片人工智能的沃土上生根發(fā)力,推動整個產(chǎn)業(yè)的茁壯成長。
中國企業(yè)在智能語音領(lǐng)域表現(xiàn)突出,創(chuàng)新創(chuàng)業(yè)日益活躍,還有搜狗智能語音等一批龍頭企業(yè)加速成長,在國際上獲得廣泛關(guān)注和認(rèn)可。
目前智能語音在語音拾取、語音分析和語義理解等核心技術(shù)環(huán)節(jié)取得了多項重大突破,智能語音技術(shù)已經(jīng)呈現(xiàn)一種整體的解決方案。
在聲音處理的整體解決方案中第一步也是最關(guān)鍵的一步——
如何將人的聲音傳達至機器,讓機器“聽到”、“聽清”且“聽懂”?
“聽到”和“聽清”在技術(shù)上又是如何實現(xiàn)?
相關(guān)技術(shù)上現(xiàn)在有哪些難點和突破?......
基于對人工智能行業(yè)的智能語音技術(shù)發(fā)展現(xiàn)狀的好奇,國內(nèi)多家知名科技媒體一同來到中國領(lǐng)先消費類芯片原廠炬芯科技,一起探索新時代智能語音技術(shù)將給我們的生活帶來什么改變!
炬芯技術(shù)市場專家陶永耀應(yīng)邀接受了媒體的群訪,為大家一一解開關(guān)于智能語音技術(shù)的奧秘以及AIoT行業(yè)發(fā)展的種種疑惑。
陶永耀技術(shù)市場專家
炬芯“技術(shù)勞模”,對聲音技術(shù)有著獨特的見解,深受行業(yè)人士認(rèn)可。
為幫助大家理解,陶永耀先就聲音的工作原理以及智能語音技術(shù)中的關(guān)鍵:聲音前處理技術(shù)做了簡單的科普。我們也一起來學(xué)習(xí)下吧!
聲音的工作原理
△語音處理數(shù)據(jù)流
聲音應(yīng)用的三個主要場景:
?聲音的傳輸,例如打電話,通過聲音傳輸,讓通話功能實現(xiàn);
?聲音的存儲,例如錄音、播放CD等等;
?聲音的識別,就是語音交互體驗
而聲音的前處理技術(shù)和聲音的后處理技術(shù)就是上述場景實現(xiàn)的關(guān)鍵。
聲音的后處理技術(shù),是聲音經(jīng)過存儲之后進行播放的同時處理。是對音源例如MP3等媒體解碼播放的聲音進音效增強處理。(例如虛擬重低音、環(huán)繞立體聲、高音增強、EQ等等。)
聲音的前處理技術(shù),是聲音沒有進入傳輸、沒有存儲之前的處理。聲音前處理目的,就是讓聲音的存儲、傳輸效率更高,識別率更好。(例如回聲消除、降噪、聲音活動檢測等等。)
炬芯在過去三十多年,一直在進行聲音的處理工作,例如MP3(聲音的后處理技術(shù))、錄音筆等聲音的保留、存儲(聲音的前處理),聲音的麥克風(fēng)識別,聲音的回聲消除及降噪(聲音的前處理)、后期的音效增強(聲音的后處理技術(shù))等等。
智能語音終端設(shè)備關(guān)鍵——聲音前處理技術(shù)
聲音前處理技術(shù)其實是解決機器“聽到”和“聽清”兩件事,從而達到“聽懂”的目的。
聲音的“聽到”主要依托的是麥克風(fēng)。主要形式為單個麥克風(fēng)或麥克風(fēng)陣列(多個麥克風(fēng)按照一定規(guī)則排列,在特定空間對聲音進行獲取和處理)。
而基于麥克風(fēng)的語音信號處理算法則是讓聲音“聽懂”的關(guān)鍵。麥克風(fēng)+算法,在不同的環(huán)境下排列組合,最終達到“聽到”和“聽懂”。
我們可以根據(jù)距離,將聲音的前處理分為分為遠場拾音(3到5米)和近場拾音(1米內(nèi))。
近場拾音,一般采用的是單麥克風(fēng),可在近距離、低噪聲的情況下拾取符合語音識別需求的聲音。但是一旦將智能手機放在有噪聲的較遠的距離,語音助手的識別率就會直線下降,單麥克風(fēng)的局限就凸顯了出來。
遠場拾音,由于距離、噪聲、混響等因素,遠場拾音多采用多麥克風(fēng)陣列,并且和遠場語音識別算法相匹配。
通過陶永耀對聲音工作原理及聲音前處理技術(shù)的重點講解,對聲音技術(shù)有進一步了解,眾媒體紛紛對炬芯的技術(shù)發(fā)展進一步提出疑問,我們也將相關(guān)熱門問題及回答羅列出來和大家一起分享!
Q:
炬芯在聲音前處理方面都有哪些獨家優(yōu)勢?
A:
炬芯的主要優(yōu)勢在于我們一直在做系統(tǒng)集成SoC,芯片硬件技術(shù)跟軟件技術(shù)能夠完美結(jié)合。憑借多年的經(jīng)驗,炬芯在聲音采集的精度、速度上有很好的基礎(chǔ),并且通過聲音處理算法硬件化等方式,能夠?qū)⑿酒墓暮托詢r比維持在行業(yè)領(lǐng)先位置。
Q:
炬芯在聲音前處理技術(shù)上已經(jīng)覆蓋了哪些行業(yè)及落地了哪類產(chǎn)品?
A:
我們現(xiàn)在主要的產(chǎn)品包括兒童錄音筆、故事機、藍牙音箱等等。在技術(shù)方面,主要包含了聲音的降噪、回聲消除技術(shù)、抗混響技術(shù)、在線語音識別。
同時,炬芯也在拓展一些新領(lǐng)域,例如智能家居和智能家電領(lǐng)域。在這個方向上炬芯會更多的關(guān)注離線識別技術(shù)(離線語音技術(shù)可以避免在線技術(shù)網(wǎng)絡(luò)不穩(wěn)定、聯(lián)網(wǎng)難、人的隱私被曝光等問題;并在較短反應(yīng)時間內(nèi)實現(xiàn)家電的控制。)。
最近炬芯在推廣的智能耳穿戴產(chǎn)品,就融合了離線和在線的語音識別功能。我們可以通過有限的命令詞條實現(xiàn)一些命令控制,也可以通過手機和云上識別,去實現(xiàn)一些語義理解命令。離在線結(jié)合的識別技術(shù),將是未來技術(shù)發(fā)展的一個重要方向。
Q:
在未來,聲音前處理技術(shù)還有哪些難點需要攻克?
A:
第一,如何讓機器聽懂是我們在技術(shù)上需要持續(xù)關(guān)注的問題。讓機器聽最大的難點在于機器的識別率和誤識別率,這兩個比率也是未來需要不斷地持續(xù)發(fā)展提高的。需要特別指出的是:機器的識別率和誤識別率即聽對聽錯的概率相互之間還存在互相制約平衡的關(guān)系。
第二,是在拾取聲音的環(huán)境方面。聲音的拾取除了受自己的回聲和環(huán)境混響影響,還受環(huán)境中各類的噪聲影響。各種穩(wěn)態(tài)和非穩(wěn)態(tài)的噪聲都需要我們通過聲音前處理技術(shù)進行處理。如何處理各種穩(wěn)態(tài)的噪聲和非穩(wěn)態(tài)的噪聲也將是未來需要持續(xù)關(guān)注的技術(shù)難點。
Q:
對于 AIoT 的發(fā)展趨勢和相關(guān)的行業(yè)機會怎么看?
A:
AIoT是必然的發(fā)展趨勢,而技術(shù)又是一個長期的研發(fā)和投入的過程。在技術(shù)的發(fā)展過程當(dāng)中,我們發(fā)現(xiàn)強人工智能落地是一場持久戰(zhàn),但弱人工智能,在某些場景下能夠切實解決人們的一些需求。因此,當(dāng)一些適應(yīng)場景的AI市場機會出現(xiàn)時,我們也需要把握住市場機會。
AIoT是一場持久戰(zhàn),短期、長期的技術(shù)研發(fā)及市場收益,需要我們不斷的平衡與發(fā)展。
想了解更多精彩采訪內(nèi)容,請點擊下方采訪視頻!
眾所周知,炬芯科技多年來一直為無線音頻及智能耳穿戴、智能多媒體、智慧計算及物聯(lián)網(wǎng)等產(chǎn)品領(lǐng)域提供專業(yè)芯片及完整解決方案。尤其在聲音領(lǐng)域,炬芯已經(jīng)推出了眾多音頻和智能機器人等方案,在語音交互體驗方面已經(jīng)處于行業(yè)領(lǐng)先地位,落地產(chǎn)品深受國內(nèi)外品牌商的青睞。
因為炬芯在“聲音”領(lǐng)域持續(xù)耕耘,二十多年的技術(shù)積累以及與高要求品牌商深度合作的實戰(zhàn)經(jīng)驗,讓炬芯在行業(yè)一直處于領(lǐng)先地位。
AIoT,新時代將至,炬芯將持續(xù)不斷的追求技術(shù)上的深耕發(fā)展,用更好的技術(shù)帶給人們更美好的生活體驗!
- 蜜度索驥:以跨模態(tài)檢索技術(shù)助力“企宣”向上生長
- AI超跑新秀揭秘:理想或?qū)⑸孀愣虅☆I(lǐng)域,廣電部門嚴(yán)查紅果短劇風(fēng)波
- 紅果短劇回應(yīng)被約談:5天內(nèi)暫停新劇上線,積極整改,重樹內(nèi)容標(biāo)準(zhǔn)
- 互聯(lián)網(wǎng)大廠春節(jié)福利揭秘:高薪休假與日常福利究竟誰更勝一籌?
- 亞馬遜CTO預(yù)測:2025年及未來五大科技趨勢,未來已來,你準(zhǔn)備好了嗎?
- 鴨鴨羽絨服與夢餉科技攜手打造超級品牌日,GMV同比增長300%,共贏新零售未來
- 中國客戶海外安全案件激增,2025年需應(yīng)對碎片化風(fēng)險:SOS報告揭示新挑戰(zhàn)
- 小米布局GPU集群,探索AI大模型新領(lǐng)域,科技巨頭引領(lǐng)未來趨勢
- 阿里影業(yè)入股姚安娜經(jīng)紀(jì)公司:新篇章,新機遇
- 螞蟻森林再度捐資河北種樹,共筑綠色長城
- 谷歌不打算賤賣自家明星產(chǎn)品:Chrome瀏覽器
免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。