引言:AIoT,用技術(shù)改變生活!
若說當(dāng)今時(shí)代的關(guān)鍵詞,“AIoT”當(dāng)之無愧。“AIoT”也就是“AI+IoT”,指的是人工智能技術(shù)與物聯(lián)網(wǎng)在實(shí)際應(yīng)用中的落地融合。目前,越來越多的行業(yè)及應(yīng)用將AI與IoT結(jié)合到了一起,AIoT已經(jīng)成為各大傳統(tǒng)行業(yè)智能化升級(jí)的最佳通道,也是未來物聯(lián)網(wǎng)發(fā)展的必然趨勢。
作為人工智能應(yīng)用最成熟的技術(shù)之一,智能語音技術(shù)在AIoT領(lǐng)域應(yīng)用十分廣泛。B 端的醫(yī)療、教育行業(yè);C 端的智能手機(jī)、智能家居、智能穿戴設(shè)備中智能語音技術(shù)的新賦能,都讓我們都看到了這項(xiàng)新技術(shù)給我們生活帶來的巨大改變。
根據(jù)中投顧問發(fā)布的《 2018-2022 年中國智能語音行業(yè)深度調(diào)研及投資前景預(yù)測報(bào)告》顯示,智能語音應(yīng)用將是人工智能發(fā)展的重點(diǎn)方向。
目前,國家正在加快人工智能的產(chǎn)業(yè)布局,發(fā)布多項(xiàng)利好政策促進(jìn)人工智能產(chǎn)業(yè)發(fā)展;5G時(shí)代的來臨更是為人工智能的發(fā)展培育了一片物聯(lián)網(wǎng)沃土。我們可以預(yù)見,智能語音作為下一代人機(jī)交互的新入口,將率先在這片人工智能的沃土上生根發(fā)力,推動(dòng)整個(gè)產(chǎn)業(yè)的茁壯成長。
中國企業(yè)在智能語音領(lǐng)域表現(xiàn)突出,創(chuàng)新創(chuàng)業(yè)日益活躍,還有搜狗智能語音等一批龍頭企業(yè)加速成長,在國際上獲得廣泛關(guān)注和認(rèn)可。
目前智能語音在語音拾取、語音分析和語義理解等核心技術(shù)環(huán)節(jié)取得了多項(xiàng)重大突破,智能語音技術(shù)已經(jīng)呈現(xiàn)一種整體的解決方案。
在聲音處理的整體解決方案中第一步也是最關(guān)鍵的一步——
如何將人的聲音傳達(dá)至機(jī)器,讓機(jī)器“聽到”、“聽清”且“聽懂”?
“聽到”和“聽清”在技術(shù)上又是如何實(shí)現(xiàn)?
相關(guān)技術(shù)上現(xiàn)在有哪些難點(diǎn)和突破?......
基于對(duì)人工智能行業(yè)的智能語音技術(shù)發(fā)展現(xiàn)狀的好奇,國內(nèi)多家知名科技媒體一同來到中國領(lǐng)先消費(fèi)類芯片原廠炬芯科技,一起探索新時(shí)代智能語音技術(shù)將給我們的生活帶來什么改變!
炬芯技術(shù)市場專家陶永耀應(yīng)邀接受了媒體的群訪,為大家一一解開關(guān)于智能語音技術(shù)的奧秘以及AIoT行業(yè)發(fā)展的種種疑惑。
陶永耀技術(shù)市場專家
炬芯“技術(shù)勞模”,對(duì)聲音技術(shù)有著獨(dú)特的見解,深受行業(yè)人士認(rèn)可。
為幫助大家理解,陶永耀先就聲音的工作原理以及智能語音技術(shù)中的關(guān)鍵:聲音前處理技術(shù)做了簡單的科普。我們也一起來學(xué)習(xí)下吧!
聲音的工作原理
△語音處理數(shù)據(jù)流
聲音應(yīng)用的三個(gè)主要場景:
?聲音的傳輸,例如打電話,通過聲音傳輸,讓通話功能實(shí)現(xiàn);
?聲音的存儲(chǔ),例如錄音、播放CD等等;
?聲音的識(shí)別,就是語音交互體驗(yàn)
而聲音的前處理技術(shù)和聲音的后處理技術(shù)就是上述場景實(shí)現(xiàn)的關(guān)鍵。
聲音的后處理技術(shù),是聲音經(jīng)過存儲(chǔ)之后進(jìn)行播放的同時(shí)處理。是對(duì)音源例如MP3等媒體解碼播放的聲音進(jìn)音效增強(qiáng)處理。(例如虛擬重低音、環(huán)繞立體聲、高音增強(qiáng)、EQ等等。)
聲音的前處理技術(shù),是聲音沒有進(jìn)入傳輸、沒有存儲(chǔ)之前的處理。聲音前處理目的,就是讓聲音的存儲(chǔ)、傳輸效率更高,識(shí)別率更好。(例如回聲消除、降噪、聲音活動(dòng)檢測等等。)
炬芯在過去三十多年,一直在進(jìn)行聲音的處理工作,例如MP3(聲音的后處理技術(shù))、錄音筆等聲音的保留、存儲(chǔ)(聲音的前處理),聲音的麥克風(fēng)識(shí)別,聲音的回聲消除及降噪(聲音的前處理)、后期的音效增強(qiáng)(聲音的后處理技術(shù))等等。
智能語音終端設(shè)備關(guān)鍵——聲音前處理技術(shù)
聲音前處理技術(shù)其實(shí)是解決機(jī)器“聽到”和“聽清”兩件事,從而達(dá)到“聽懂”的目的。
聲音的“聽到”主要依托的是麥克風(fēng)。主要形式為單個(gè)麥克風(fēng)或麥克風(fēng)陣列(多個(gè)麥克風(fēng)按照一定規(guī)則排列,在特定空間對(duì)聲音進(jìn)行獲取和處理)。
而基于麥克風(fēng)的語音信號(hào)處理算法則是讓聲音“聽懂”的關(guān)鍵。麥克風(fēng)+算法,在不同的環(huán)境下排列組合,最終達(dá)到“聽到”和“聽懂”。
我們可以根據(jù)距離,將聲音的前處理分為分為遠(yuǎn)場拾音(3到5米)和近場拾音(1米內(nèi))。
近場拾音,一般采用的是單麥克風(fēng),可在近距離、低噪聲的情況下拾取符合語音識(shí)別需求的聲音。但是一旦將智能手機(jī)放在有噪聲的較遠(yuǎn)的距離,語音助手的識(shí)別率就會(huì)直線下降,單麥克風(fēng)的局限就凸顯了出來。
遠(yuǎn)場拾音,由于距離、噪聲、混響等因素,遠(yuǎn)場拾音多采用多麥克風(fēng)陣列,并且和遠(yuǎn)場語音識(shí)別算法相匹配。
通過陶永耀對(duì)聲音工作原理及聲音前處理技術(shù)的重點(diǎn)講解,對(duì)聲音技術(shù)有進(jìn)一步了解,眾媒體紛紛對(duì)炬芯的技術(shù)發(fā)展進(jìn)一步提出疑問,我們也將相關(guān)熱門問題及回答羅列出來和大家一起分享!
Q:
炬芯在聲音前處理方面都有哪些獨(dú)家優(yōu)勢?
A:
炬芯的主要優(yōu)勢在于我們一直在做系統(tǒng)集成SoC,芯片硬件技術(shù)跟軟件技術(shù)能夠完美結(jié)合。憑借多年的經(jīng)驗(yàn),炬芯在聲音采集的精度、速度上有很好的基礎(chǔ),并且通過聲音處理算法硬件化等方式,能夠?qū)⑿酒墓暮托詢r(jià)比維持在行業(yè)領(lǐng)先位置。
Q:
炬芯在聲音前處理技術(shù)上已經(jīng)覆蓋了哪些行業(yè)及落地了哪類產(chǎn)品?
A:
我們現(xiàn)在主要的產(chǎn)品包括兒童錄音筆、故事機(jī)、藍(lán)牙音箱等等。在技術(shù)方面,主要包含了聲音的降噪、回聲消除技術(shù)、抗混響技術(shù)、在線語音識(shí)別。
同時(shí),炬芯也在拓展一些新領(lǐng)域,例如智能家居和智能家電領(lǐng)域。在這個(gè)方向上炬芯會(huì)更多的關(guān)注離線識(shí)別技術(shù)(離線語音技術(shù)可以避免在線技術(shù)網(wǎng)絡(luò)不穩(wěn)定、聯(lián)網(wǎng)難、人的隱私被曝光等問題;并在較短反應(yīng)時(shí)間內(nèi)實(shí)現(xiàn)家電的控制。)。
最近炬芯在推廣的智能耳穿戴產(chǎn)品,就融合了離線和在線的語音識(shí)別功能。我們可以通過有限的命令詞條實(shí)現(xiàn)一些命令控制,也可以通過手機(jī)和云上識(shí)別,去實(shí)現(xiàn)一些語義理解命令。離在線結(jié)合的識(shí)別技術(shù),將是未來技術(shù)發(fā)展的一個(gè)重要方向。
Q:
在未來,聲音前處理技術(shù)還有哪些難點(diǎn)需要攻克?
A:
第一,如何讓機(jī)器聽懂是我們在技術(shù)上需要持續(xù)關(guān)注的問題。讓機(jī)器聽最大的難點(diǎn)在于機(jī)器的識(shí)別率和誤識(shí)別率,這兩個(gè)比率也是未來需要不斷地持續(xù)發(fā)展提高的。需要特別指出的是:機(jī)器的識(shí)別率和誤識(shí)別率即聽對(duì)聽錯(cuò)的概率相互之間還存在互相制約平衡的關(guān)系。
第二,是在拾取聲音的環(huán)境方面。聲音的拾取除了受自己的回聲和環(huán)境混響影響,還受環(huán)境中各類的噪聲影響。各種穩(wěn)態(tài)和非穩(wěn)態(tài)的噪聲都需要我們通過聲音前處理技術(shù)進(jìn)行處理。如何處理各種穩(wěn)態(tài)的噪聲和非穩(wěn)態(tài)的噪聲也將是未來需要持續(xù)關(guān)注的技術(shù)難點(diǎn)。
Q:
對(duì)于 AIoT 的發(fā)展趨勢和相關(guān)的行業(yè)機(jī)會(huì)怎么看?
A:
AIoT是必然的發(fā)展趨勢,而技術(shù)又是一個(gè)長期的研發(fā)和投入的過程。在技術(shù)的發(fā)展過程當(dāng)中,我們發(fā)現(xiàn)強(qiáng)人工智能落地是一場持久戰(zhàn),但弱人工智能,在某些場景下能夠切實(shí)解決人們的一些需求。因此,當(dāng)一些適應(yīng)場景的AI市場機(jī)會(huì)出現(xiàn)時(shí),我們也需要把握住市場機(jī)會(huì)。
AIoT是一場持久戰(zhàn),短期、長期的技術(shù)研發(fā)及市場收益,需要我們不斷的平衡與發(fā)展。
想了解更多精彩采訪內(nèi)容,請點(diǎn)擊下方采訪視頻!
眾所周知,炬芯科技多年來一直為無線音頻及智能耳穿戴、智能多媒體、智慧計(jì)算及物聯(lián)網(wǎng)等產(chǎn)品領(lǐng)域提供專業(yè)芯片及完整解決方案。尤其在聲音領(lǐng)域,炬芯已經(jīng)推出了眾多音頻和智能機(jī)器人等方案,在語音交互體驗(yàn)方面已經(jīng)處于行業(yè)領(lǐng)先地位,落地產(chǎn)品深受國內(nèi)外品牌商的青睞。
因?yàn)榫嫘驹?ldquo;聲音”領(lǐng)域持續(xù)耕耘,二十多年的技術(shù)積累以及與高要求品牌商深度合作的實(shí)戰(zhàn)經(jīng)驗(yàn),讓炬芯在行業(yè)一直處于領(lǐng)先地位。
AIoT,新時(shí)代將至,炬芯將持續(xù)不斷的追求技術(shù)上的深耕發(fā)展,用更好的技術(shù)帶給人們更美好的生活體驗(yàn)!
- 蜜度索驥:以跨模態(tài)檢索技術(shù)助力“企宣”向上生長
- 比亞迪第五代DM技術(shù)問世,首搭秦L/海豹06 DM-i,開創(chuàng)油耗2時(shí)代!
- 小紅書沉帖降權(quán)怎么做,有效方法大盤點(diǎn)!
- 亞洲時(shí)刻京東送上電視好禮 以舊換新一體化服務(wù)讓低價(jià)更靠譜
- 互聯(lián)網(wǎng)營銷師和全媒體運(yùn)營師的區(qū)別?
- 聯(lián)想集團(tuán)車計(jì)算“超級(jí)大腦”概念機(jī)亮相
- 華策影視設(shè)立專項(xiàng)基金成立AIGC應(yīng)用研究院
- 三部委審批,聯(lián)合發(fā)布9個(gè)新職業(yè),“互聯(lián)網(wǎng)營銷師”上榜
- 互聯(lián)網(wǎng)營銷師的報(bào)考條件是什么?
- 互聯(lián)網(wǎng)營銷師的適合人群有哪些?
- 互聯(lián)網(wǎng)營銷師行業(yè)前景怎么樣?
免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。