GCI實況|聲智遠場語音技術(shù)打開廣電數(shù)字機頂盒智能化發(fā)展新機遇

2018年10月23日,由中廣聯(lián)合會技術(shù)委員會、美國有線電視實驗室(CableLabs)、華數(shù)集團共同發(fā)起的第二屆全球有線創(chuàng)新峰會在杭州召開,聲智科技聯(lián)合創(chuàng)始人兼首席知識官常樂受邀展示最新研發(fā)的智能機頂盒遠場語音交互解決方案。

GCI實況

目前,中國的機頂盒市場,主要有廣電運營商的傳統(tǒng)數(shù)字機頂盒、電信運營商的 IPTV 機頂盒和互聯(lián)網(wǎng)運營商的OTT TV機頂盒,以IPTV和OTT TV為典型代表的網(wǎng)絡(luò)機頂盒,憑借海量的互聯(lián)網(wǎng)內(nèi)容優(yōu)勢,并能滿足用戶個性化觀看與互動的需求,發(fā)展勢頭強勁,市場占有率不斷攀升。傳統(tǒng)數(shù)字機頂盒行業(yè)進入轉(zhuǎn)型期,以滿足終端用戶對數(shù)字電視網(wǎng)絡(luò)智能化的需求。據(jù)中國廣電與格蘭研究聯(lián)合發(fā)布的《2017年第四季度有線電視行業(yè)發(fā)展公報》數(shù)據(jù)顯示,截止2017年底,全年IPTV用戶總量達1.22億,同比增長40.88%,OTT TV用戶總量達1.1億,同比增長52.22%。

聲智科技聯(lián)合創(chuàng)始人兼首席知識官常樂表示:“移動互聯(lián)網(wǎng)和多元智能設(shè)備的日趨普及正在塑造新一代用戶的交互習(xí)慣,用戶時間呈現(xiàn)碎片化、分散化趨勢,以語音交互為入口的智能設(shè)備正吸引著越來越多的用戶。語音交互與智能化升級正帶給傳統(tǒng)機頂盒廠商歷史性的發(fā)展機遇。基于真實場景環(huán)境的聲學(xué)信號處理與人工智能算法的有機融合,才能打造符合終端用戶需求的智能機頂盒產(chǎn)品。”

GCI實況

聲智科技聯(lián)合創(chuàng)始人兼首席知識官 常樂

機頂盒通常在家居環(huán)境中的客廳使用,而客廳是家庭成員日?;咏涣髋c娛樂休閑的主要場所,噪音源較多,交互空間較大且交互角度廣,同時,不同家庭成員的用戶特點和需求不同。鑒于此,聲智科技推出了基于遠場語音交互技術(shù)的一站式智能機頂盒解決方案,可實現(xiàn)3-5米遠場交互360度無死角,有效抑制多種噪聲源,支持多人交互、多輪對話,同時,對接豐富的內(nèi)容和服務(wù)平臺,滿足用戶的個性化需求。

用“芯”驅(qū)動,“聽”其所言

聲智科技推出的國內(nèi)首款低功耗麥克風(fēng)陣列芯片SAI101C,專為以智能機頂盒為代表的智能硬件打造,最大功耗不超過0.8W且高度集成,CPU計算能力達到500MIPS,具備32x32的MAC指令能力,內(nèi)置256KB內(nèi)存和1MB閃存,完全兼容USB2.0規(guī)范。

同時,在適配低功耗、高度集成的語音芯片架構(gòu)的基礎(chǔ)之上,聲智科技擁有核心自主知識產(chǎn)權(quán)的麥克風(fēng)陣列,支持2麥、3麥、4麥、6麥,線型、環(huán)型、菱型等多種陣型,經(jīng)過量產(chǎn)驗證且成本可控,可匹配各種體積大小、形狀結(jié)構(gòu)的機頂盒產(chǎn)品,賦予機頂盒 “聽”的感知能力,為5米范圍內(nèi)任意角度的交互提供硬件基石。

GCI實況

算法智能,“知”其所想

在硬件基礎(chǔ)架構(gòu)之上,聲智科技研發(fā)了全鏈條智能語音交互開發(fā)系統(tǒng)SoundAI Voice Kit(SVK),集成聲波配網(wǎng)、波束形成、聲源測向、噪聲抑制、混響消除、回聲消除、語音喚醒、端點檢測、語音識別、聲紋識別、語義理解、語音合成、雙工通話等核心算法,并設(shè)置開放式后端內(nèi)容接口,對接任意第三方平臺。

其中,為了解決不同品牌、機型電視產(chǎn)品的喇叭、音效對智能機頂盒的信號處理的阻礙,以及因電視機回傳給機頂盒的音頻參考信號的不準(zhǔn)確性而造成的弱參考信號或者無參考信號條件下的回聲抵消(自噪聲抑制)問題,SVK OpenAEC算法,可實現(xiàn)智能機頂盒全方向的精準(zhǔn)喚醒,減少無序喚醒干擾,同時兼顧誤喚醒率。針對噪聲源(例:電視、音響)、語音源、手機在一條直線上的情形,SVK AKS垂直抗強噪算法,可在電視音量強干擾下,大幅提高機頂盒的識別精準(zhǔn)度。

SVK SSP空間感知算法,能讓機頂盒知道自己的位置,比如離電視近,或者離茶幾更近,進行音量大小的自適應(yīng),通過自主學(xué)習(xí),無需用戶主動調(diào)節(jié),就能為用戶帶來最佳的環(huán)境音量體驗;當(dāng)空間內(nèi)有多臺語音智能設(shè)備時,SVK SSA空間認知算法,可讓機頂盒具備用戶指令的判斷力,識別與自身功能相符合的指令,在正確的時機作出智能響應(yīng),為用戶帶來有序的智能交互體驗。

GCI實況

搭載聲智科技軟硬件一體化的遠場語音交互解決方案的智能機頂盒,用戶可以拋開遙控器,用簡單的語音指令解鎖海量數(shù)字電視的功能和內(nèi)容服務(wù),盡享流暢智能的語音交互帶來的品質(zhì)生活。

關(guān)于聲智科技

聲智科技是全球領(lǐng)先的聲學(xué)語音技術(shù)和語言智能服務(wù)科技創(chuàng)新公司,專注于聲學(xué)前沿技術(shù)和人工智能交互,秉持“聽你所言,知你所想”的技術(shù)理念,致力于通過不斷引領(lǐng)真實環(huán)境下的人機交互體驗,實現(xiàn)“聲音連接智能未來”的使命,“更自由的人機互聯(lián)”愿景。

聲智科技主要提供從端到云的智能語音交互技術(shù)和服務(wù)方案,以及從芯片、模組、開發(fā)板到完整產(chǎn)品的智能語音應(yīng)用方案。目前與百度、阿里、騰訊、ARM、NVIDIA、Xilinx、Cypress、Bosch、Cadence等著名企業(yè)深度合作,深耕智能家居、智能汽車、智能安防、智能金融、智能教育、智能醫(yī)療和機器人等行業(yè),服務(wù)小米、百度、阿里、華為、騰訊、聯(lián)想、錘子、創(chuàng)維、金蝶、浪潮、中國移動、奇虎360、中央人民廣播電臺等客戶,是國內(nèi)服務(wù)用戶最多、應(yīng)用場景最全和覆蓋地域最廣的遠場語音交互技術(shù)供應(yīng)商。

極客網(wǎng)企業(yè)會員

免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負任何法律責(zé)任。任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。

2018-10-23
GCI實況|聲智遠場語音技術(shù)打開廣電數(shù)字機頂盒智能化發(fā)展新機遇
2018年10月23日,由中廣聯(lián)合會技術(shù)委員會、美國有線電視實驗室(CableLabs)、華數(shù)集團共同發(fā)起的第二屆全球有線創(chuàng)新峰會在杭州召開,聲智科技聯(lián)合創(chuàng)始人

長按掃碼 閱讀全文