本刊記者 / 朱亮
馮惠軍,深圳阿凡達智控有限公司(AvatarControls)總經理 加拿大歸國博士,離線語音技術應用領軍人物。
編者按
離線智能語音技術不同于在線語音交互對云端的依賴,可以讓設備本身具備智能語音交互的能力。它的優(yōu)勢是不需要聯網、響應速度快,其行業(yè)解決方案開發(fā)是大勢所趨,可以打造出更加靈敏、穩(wěn)定與隱私安全的用戶體驗。目前已經開始在全屋智能項目中逐步落地,獲得一致好評。今天有幸采訪到離線語音解決方案的領軍者,深圳阿凡達智控總經理馮惠軍先生,一同探討離線語音如何助力更好的智能家居人機交互。
2019年的智能家居語音市場:機遇與挑戰(zhàn)并存
2019年智能家居行業(yè)發(fā)展既面臨多種挑戰(zhàn)也面臨著全新機遇。
近幾年蓬勃發(fā)展的人工智能技術、物聯網技術、傳感技術、語音識別、人臉識別技術和邊緣計算為智能家居奠定了堅實的基礎。
語音助手成為智能家居交互方式的主要手段,使用戶在家中可以直接利用語音來控制空調、電視、窗簾和燈光等家居設備,從而使用戶對智能家居設備的控制更加便捷和自然。
家庭分區(qū)管控和應用場景智能化是智能家居簡單落地的重要標志之一,對于用戶而言,花費較低成本、高使用頻率且能夠明顯改善生活便利性的產品,更容易刺激其購買需求。
人工智能、人臉識別技術將廣泛用于家庭安全監(jiān)控產品上。將有越來越多的家庭安全監(jiān)控產品實現人臉識別功能,從長遠看這將引導智能家居增值服務模式的建立。
助力傳統(tǒng)產業(yè)升級,企業(yè)跨界合作漸成常態(tài),智能家居廠商和傳統(tǒng)家居家電廠商將在產品的智能化升級方面開展更多合作,幫助傳統(tǒng)家居家電廠商進行產品的智能化、數字化轉型,傳統(tǒng)廠商可以幫助智能家居廠商擴展線下家裝市場渠道,傳統(tǒng)家裝渠道也會將在智能家居市場迎來快速發(fā)展機遇。
雖然人們對智能家居的認識越來越廣泛,產品功能越來越豐富,也越來越人性化,但同樣也面臨著一些挑戰(zhàn),比如落地難,兼容性差,施工配置得請專人,用戶體驗性不夠,價格門檻高等等。
語音交互是人類與生俱來的一種能力,是人類最方便高效的信息溝通方式。除了高效的信息溝通外,語音交互可徹底解放雙手,不需要與設備接觸即可溝通,極大提高人們在某些不方便使用雙手的場景中的應用。
隨著近兩年人工智能技術在語音識別、深度學習、高性能運算平臺和大數據領域等方面取得突破,極大的提升了語音識別準確率。在語音識別率方面,百度、阿里、科大訊飛等主流平臺識別準確率均在96%以上,穩(wěn)定的識別能力為語音技術的商業(yè)化應用提供了可能。
目前智能家居市場處于快速發(fā)展期,智能語音已成為智能家居不可或缺的部分,在燈光、空調、電視、窗簾、門窗、背景音樂等設備的語音控制均有應用。隨著技術的不斷突破,語音交互體驗方面還有望得到進一步提升。比如在設備的喚醒率、識別率、誤報率、環(huán)境降噪等方面仍然需要不斷改進,持續(xù)提升用戶使用的體驗感,讓用戶更加自然的與設備交互,增強使用的粘性,讓用戶愿意通過語音輕松控制家居設備。
阿凡達智控的離線語音套裝
馮博士深談:為何阿凡達智控發(fā)力離線語音解決方案?
近年來,隨著人們生活水平的提高和消費觀念的轉變,消費者越來越注重家居生活的品質,智能家居在生活中扮演越來越重要的角色,一些消費者也開始通過購買智能家居產品來營造溫馨的家居環(huán)境。
經過多年的發(fā)展,智能家居的概念已經深入人心,智能化已成為全球市場主流。從智能單品、智能單系統(tǒng)套裝到全屋智能的發(fā)展,人們越來越認可智能化產品帶給人們生活的便捷性、方便性。
深圳阿凡達智控成立于2015年,在過去了這三年多時間里,國內智能家居市場確實發(fā)展比較迅猛,市場的熱情一下被點燃了,馮博士表示之前一直在加拿大從事智能家居方面的研究和項目實施,智能家居在海外應該算是一種剛需,但主要的部分還是偏安防板塊,取決于國內外人們居住環(huán)境的差異。
國內智能家居行業(yè)經過十多年的發(fā)展,一直是不溫不火,”裝了不會用,還不如不裝”是很多智能家居使用者的心聲。從側面反映了智能家居飽受詬病的操作復雜性,不具有用戶的體驗性。
目前,大多智能家居系統(tǒng)設計不夠人性化,造成極大的操作難度。隨著智能音箱的興起,語音的交互成為智能家居控制的入口,確實市面上做離線解決方案的占少數,用戶的理解和認知大都還停留在無Wi-Fi不智能、無APP不智能的狀態(tài)。
阿凡達智控做離線語音通過充分的大量市場調研和客戶信息數據收集,行業(yè)的一些痛點驗證了用戶體驗才是第一位的,離線語音不依賴網絡環(huán)境,采用本地化部署,不間斷待命,用全屋語音來控制智能家居。
本地控制設備的體驗有多快、有多好,可能大家在沒有真正體驗之前感受不到。而如果從運行的原理來解釋,即它能夠省去中間連接的步驟,減少帶寬的占用,從而提升運行的速度,讓整體體驗更加無縫。同時,運行的數據均存儲在本地,避免隱私安全問題。
離線語音必將是大勢所趨,隨著物聯網行業(yè)發(fā)展,智能設備數量呈爆發(fā)性增長,大到汽車、小到智能開關,都各自擁有一個 IP 地址,新設備產生大量的數據,而有限的互聯網上行鏈路無法跟上。
行業(yè)巨頭Google也意識到了這一點,在上月Google I/O 開發(fā)者大會上其宣布即將面向所有開發(fā)者推出 Local Home SDK,旨在通過本地路徑來集成和控制智能家居設備,從而提高設備的響應速度和安全性,助力其智能家居控制的體驗得到跨越式的提升。
阿凡達智控將借助這一契機,發(fā)揮我們的離線語音技術優(yōu)勢在智能家居賽道上,進一步將本地化、離線、安全的理念傳達給每一個用戶,提升企業(yè)責任和社會價值。
阿凡達堅守的企業(yè)存在價值觀
2015年的大環(huán)境是互聯網行業(yè)異軍突起,國家大力倡導大眾創(chuàng)業(yè)、萬眾創(chuàng)新,建立阿凡達智控的初衷就是要提供一個創(chuàng)新的平臺,讓有夢想、有創(chuàng)新精神、有技術專長的人聚在一起,做點有意義的事情。阿凡達這個名字最早出自印度教,意思是化作人形的神-虛擬化身,這正好跟我們的理念非常吻合,我們的愿景就是要打造一套智能家居系統(tǒng)作為人類的化身在虛擬空間幫人類去實現人與物的互聯和交互,讓這種交互更具人性化,更具用戶體驗。
隨著人們經濟水平的提高,對生活品質會有更高的要求,智能家居會走進千家萬戶,這是必然的趨勢,阿凡達智控也將全心投入到這個行業(yè),利用自身的技術優(yōu)勢,堅持發(fā)展以人工智能AI語音為入口,不斷拓展系統(tǒng)使用場景及產品生態(tài),從智慧家庭到智慧酒店,智慧辦公,智慧養(yǎng)老,智慧教育等,產品生態(tài)也將引入各大智能家居單品的擴容,如指紋鎖、晾衣架、掃地機、空氣凈化器、各類安防傳感器等等,我們企業(yè)發(fā)展的愿景是“智慧讓生活更簡單”,語音賦能、解放雙手、張口即來,讓語音智控進入千家萬戶,真正給人們的生活帶來便利,提升生活品質和幸福感,這就是我們企業(yè)存在的價值。
深圳阿凡達智控有限公司是一家專注智能語音控制與交互技術研究、創(chuàng)意產品設計和生產銷售的創(chuàng)新型科技企業(yè),經過三年的自身技術研發(fā)和自主知識產權積累,2018年10月通過國家級高新技術企業(yè)、深圳市高新技術企業(yè)認定。
我們在遠場語音識別、語音喚醒、語音降噪和回聲消除等方面進行了長期的研發(fā)與投入,擁有自主研發(fā)的核心技術,可以為各行各業(yè)提供專業(yè)的語音控制模塊與解決方案。我們關注用戶體驗,使我們的產品努力為顧客創(chuàng)造使用價值。目前的主要產品包括:小寶精靈離線語音全屋智控系統(tǒng)及配套設備如智能燈光開關面板、動能開關面板、情景面板、智能燈帶控制器、智能通斷器、LED驅動電源、門鈴、救助按鈕等,及離線語音控制模塊配套的OEM/ODM解決方案、照明燈具智能改造離線語音模塊、自主專利設計創(chuàng)意類自由魔方系列。
小寶精靈系統(tǒng)拓展圖
離線語音與在線語音識別的差異
離線語音控制和在線語音識別各有相應的優(yōu)點與不足,而這些往往也會對產品應用有所限制。
離線語音控制的優(yōu)點是采用本地語音識別算法,不需要聯網進行語音識別來控制智能設備。離線語音方案提供了語音識別前端的聲音信號處理,AI語音算法包含了噪聲抑制、回音消除、遠場拾音和語音合成等功能,從而提高語音識別率高達95%以上;響應速度快,最短僅0.2s;遠場識別距離可達10m;不需要依托網絡語音識別,從而實現方便簡單控制家電設備。離線語音方案的缺點是采用固定命令詞方式,需要用戶理解并熟悉相應的控制命令詞,不能提供更多網絡內容服務,僅是適合一些家電設備控制,不適合使用AI內容語音交互。
在線語音識別方案很明顯的特點就是識別率高,云端內容豐富,通過連接網絡就可以把語音識別內容、在線語音解析和語音理解都在云端都處理完成,并且可提供海量內容服務,如兒童陪護和智能音箱類似的內容。他的缺點是由于需要聯網,在網絡連接不通暢的情況下,響應速度很慢或無反饋,給用戶的使用體驗不好。
直接與便捷屬性的離線語音
自主核心技術對一家科技型企業(yè)的重要性不言而喻,為什么我們要做離線語音?首先是語音擁有直接、便捷等一系列重要屬性,人類作為社交群體,生活在充滿聲音的場景當中,聲音是最直接、最快的表達和下達指令的手段之一。
其次,特殊的場景帶來不一樣的需求。第三,用戶對語音產品的接受程度非常高,相對來說語音的市場教育已經比較成熟。
最后從技術層面來說,阿凡達智控有完善的離線語音方案,我們重點在于開發(fā)一套離線語音中控系統(tǒng),使得用戶通過一個設備可以方便的控制家中常用的家居設備。這套系統(tǒng)實現了多主機多區(qū)域互聯互控,跨區(qū)域語音控制,使用可以方便的在家中實現多區(qū)域的場景控制。這也是成為我們選擇離線語音作為家庭場景重要的交互入口的主要原因。
阿凡達智控小寶精靈
在線的智能音箱重在內容,阿凡達智控小寶精靈重在實用 – 智能控制。小寶精靈是一款先進的離線語音智能家居控制系統(tǒng),其內置靈敏的智能語音識別系統(tǒng),擁有極速語音操控能力,用戶可以通過語音即可實現與室內家電的交互控制,是提升現代家庭生活品質的智能語音助手。小寶精靈有求必應,呼喚一聲:幫您開關電視、控制空調、開關房燈、打開窗簾、開關風扇、開關插座、打開小夜燈等等。
我們方案的優(yōu)勢與特點如下:
·功能強大:一臺設備即可控制家里的空調、電視機、機頂盒、投影儀、電風扇等紅外設備和各種開關、燈具、電動窗簾、插座、門鈴、求助按鈕等等;
·用戶體驗好:呼喚一聲,有求必應;連續(xù)不斷的指令發(fā)布,快速靈敏的語音識別,行云流水般的動作執(zhí)行為用戶提供了極好的使用體驗;
·方便:無需網絡,無需APP,設置簡單,解決了大多數人不會操作、不會使用,感覺非常繁瑣的種種問題,普通人都可快速使用;
·使用簡單:插電即用,進行簡單的配置即可語音控制家中的紅外遙控設備包括空調、電視機、機頂盒、投影儀、電風扇等;
·安裝容易:無需布線,無需改變家中原有的電源線路,簡單的改造即可實現語音控制家里的燈具、電動窗簾、插座等,大大降低了人工和材料成本;
·安全可靠:系統(tǒng)采用本地語音識別,不需要連接外部網絡,避免泄露個人隱私;
·識別能力強:強大的語音識別能力,真正實現了非特定人聲識別,結合自然語言語義,做到了無需特意學習,只要用漢語拼音發(fā)聲的話都能聽懂;
·性能強大:安靜環(huán)境下可實現10米超遠距離語音識別,95%超多識別準確率,0.2秒超快反應速度;
·全屋控制:實現多區(qū)域多主機智能控制,自由組合,靈活多變,實現全屋語音控制;高速、高效、防沖突私有控制協議保證系統(tǒng)的穩(wěn)定可靠。
阿凡達離線語音解決方案的核心技術
·采用高性能神經網絡并行計算AI離線語音芯片;
·本地遠場語音識別、語音喚醒、強降噪算法、回聲消除;
·安靜環(huán)境下可實現10米超遠距離語音識別,95%超多識別準確率,0.2秒超快反應速度;
·完整離線語音全屋控制方案,多區(qū)域多主機智能控制,自由組合,靈活多變。高速、高效、防沖突私有控制協議保證系統(tǒng)的穩(wěn)定可靠;
·離線在線結合:離線快速控制+在線豐富內容。我們已在布局,一年時間內將會推向市場,迎合更多客戶和市場的需求。
離線語音的智能家居痛點解決
用戶體驗差,不能給用戶帶來良好的使用體驗;安裝配置操控復雜,用戶學習成本高;缺乏合理的價格標準(價格偏高,落地難);產品完全依賴APP;通信網絡Wi-Fi,Zigbee不夠穩(wěn)定,也給它的普及帶來困難;缺乏有經驗的系統(tǒng)集成專業(yè)人員;培養(yǎng)成本高;安裝調試成本大,后續(xù)維護服務成本花費高。
“小寶精靈”喚醒詞
喚醒詞的定義有一定要求和規(guī)范,音節(jié)要求平仄起伏形成特定的波形,“小寶精靈”,讀起來朗朗上口,小寶這個名字,很親密、很貼切,容易拉近用戶與設備之間的距離,貼合家庭使用習慣,我們的出發(fā)點是要做一款有靈性、有溫度的產品。我們的愿景就是讓每個家庭都能擁有一套小寶精靈,它不僅是你的家庭一員,更是生活的智能伴侶或智能管家。我們系統(tǒng)其實是預定了三個喚醒詞:小寶精靈、精靈小寶、小寶管家,用戶可以根據自己喜好來使用。
離線語音的六大場景覆蓋
阿凡達智控的語音場景解決方案大的范疇還是屬于人工智能物聯網,致力于為用戶提供最自然、最簡單、最智能的人機交互體驗,讓“人工智能+”產品無處不在,其應用領域涵蓋智能家居、智能家電、智能照明、智能音箱、智能機器人,智能汽車等。
家居是我們繁忙工作后身體和心靈休息、放松的場所。作為家的重要組成部分,家居產品在很大程度上影響著家的舒適度和自我的歸屬感。在未來的家居生活里,家居產品的良好體驗顯得越來越重要,其中智能是人們最為期待的家居生活方式。只要是室內的生活場景都可以融入智能語音控制方案,輕松實現人與物、物與物之間的交互。未來,阿凡達智控將繼續(xù)深耕人工智能語音領域,并持續(xù)進行技術創(chuàng)新,助推人工智能語音交互技術在更多應用場景下的商業(yè)落地,有效服務國家人工智能戰(zhàn)略規(guī)劃和行業(yè)“人工智能+”升級換代。
智能家居的離線語音場景
目前阿凡達智控離線語音全屋智控系統(tǒng)已實現家電控制、智能燈光控制、智能遮陽系統(tǒng)控制、智能安防報警系統(tǒng)、智能場景控制、智能電源管理等,可支持語音控制的設備有:空調、電視機、機頂盒、投影儀、電風扇、電動窗簾、插座、門鈴、求助開關和各種各種照明燈具。照明控制必須配套使用我司開發(fā)生產的單路、雙路、三路86單火面板開關或我司方案的其它產品(如:通斷器、驅動電源、隨意貼、場景面板、插座等)。
未來將會覆蓋智能晾衣架、智能背景音樂系統(tǒng)等等,產品生態(tài)也將引入各大智能家居單品的擴容,如指紋鎖、掃地機、空氣凈化器、各類安防傳感器等等,我們企業(yè)發(fā)展的愿景是“智慧讓生活更簡單”,語音賦能、解放雙手、張口即來,讓語音智控進入千家萬戶,真正的給人們的生活帶來便利,提升生活品質和幸福感,這就是我們企業(yè)存在的價值。
海內外多樣化智能家居解決方案
自由魔方、語音聲控LED護眼臺燈是阿凡達智控2017年、2018年相繼推出的兩款智能單品,自由魔方(FreeCube)取自積木靈感家庭智慧終端,采用獨特的磁吸接腳設計方式,涵蓋日常生活常用的USB電源排插、藍牙音箱、智能七彩燈及無線充模塊,迷你小巧的一公升體積,不占空間,使用者可依自身需求,擴充硬體設備,在原有主機方塊之上,增加擴充的積木模組,有別過去單個產品接電源的使用方式,輕松擴充。
這款產品有多個版本,國標版,美標版,歐標版及通用版,最大的亮點設計在于只要有好的功能模塊都可以整合進來,比如亞馬遜Alexa的語音模塊,當時考慮成本的競爭不過亞馬遜自有的語音音箱,這塊功能被列為OEM定制需求,為后續(xù)小寶精靈離線語音模塊的整合奠定了很好的擴展基礎。智能語音護眼臺燈是我們量產的第一款離線語音類智能單品,普通臺燈植入離線語音模塊,通過簡單的指令即可聲控開關燈、亮度調節(jié)、延時關燈等功能,產品一出來取得了很好的市場反響,為我們后續(xù)的小寶精靈項目增強了信心。前面兩款產品是對阿凡達智控的產品研發(fā)、設計及產品落地能力的檢驗,我們將堅持以離線語音模塊的研發(fā)應用為核心點,以小寶精靈離線語音全屋智控系統(tǒng)為智能家居產品市場拓展為中心,自研自產服務好每一個客戶。
借力集團平臺的產業(yè)鏈優(yōu)勢資源
聚為集團成立于2005年,是香港JOYETECH Holding Limited(卓爾悅控股)獨資公司。聚為集團在中國大陸、美國及歐洲(法國、瑞士、西班牙等)個國家設有子公司以及研發(fā)中心。集團共有員工五千余人,其中博士、碩士50人以上,大專以上人員360人以上,年銷售額約30億以上。集團主要從事霧化技術及其零部件的研發(fā)、制造、銷售,以及其他電子產品的研發(fā)、銷售,為全球30多個國家提供電子煙的研發(fā)應用以及OEM、ODM加工服務。
阿凡達智控為其智能產業(yè)全資子公司,將依托集團強大的制造能力、品質管控能力,加強智能家居系統(tǒng)產品的穩(wěn)定性及供貨能力,未來阿凡達智控的語音技術將不斷開拓支持英語等其他語種,進入全球化智能家居市場布局。
AI視覺的應用邊界
說話是人類最自然的交流方式,智能視覺應用也是人工智能重要分支能夠在智能制造以及眾多智能生活領域展開應用,其中包括人臉識別、視頻/監(jiān)控分析、靜態(tài)圖片識別應用、汽車的駕駛輔助、工業(yè)視覺檢測、醫(yī)療影像診斷、圖像及視頻編輯等等。智能視覺在應用場景上逐漸突破了工業(yè)領域,其應用邊界逐步向智能生活領域拓展。
阿凡達的企業(yè)家情懷與社會責任感
阿凡達智控是聚為集團投資的全資子公司,聚為集團主營霧化技術和相關配件研發(fā)業(yè)務,年營收30個億,2015年在當時,大環(huán)境是互聯網行業(yè)異軍突起,國家大力倡導大眾創(chuàng)業(yè)萬眾創(chuàng)新,建立阿凡達智控的初衷就是要提供一個創(chuàng)新的平臺,讓有夢想、有創(chuàng)新精神、有技術專長的年輕人成為平臺的合伙人,做點有意義的事情。
阿凡達這個名字最早出自印度教,意思是化作人形的神-虛擬化身,這正好跟我們的理念非常吻合,我們的愿景就是要打造一套智能家居系統(tǒng)作為人類的化身在虛擬空間,幫人類去實現人與物的互聯和交互,讓這種交互更具人性化,更具用戶體驗。
企業(yè)并不是孤立存在的,它處在整個社會環(huán)境之中,與社會有著千絲萬縷的聯系,它不可能脫離社會獨自生存和發(fā)展,企業(yè)從社會中獲得利潤,也要承擔起相應的社會責任,這樣才能使企業(yè)永續(xù)發(fā)展,阿凡達歡迎更多的有夢想、有追求、有創(chuàng)新理念的年輕人加入阿凡達智控這個大家庭,你們都是這平臺的合作人!
阿凡達智控離線語音成功案例
保利金町灣酒店智慧公寓
我愛我家相寓智慧公寓
PPG大師漆現場體驗店
河北保定家居裝飾城
北京十里河燈飾城
湖南簾到家展示店
智慧酒店客房樣板房
河南新鄉(xiāng)智慧屋
連陽電力智控體驗線下店
深圳盲協無障礙智能改造項目
福建龍巖中學智慧教室改造項目
鄭州氧仕多大酒店智慧客房
保利金町灣酒店智慧公寓
PPG大師漆現場體驗店
北京十里河燈飾城
福建龍巖中學智慧教室
鄭州氧仕多大酒店智慧客房
河南新鄉(xiāng)智慧屋
采訪手記
近兩年,智能家居市場上的離線語音解決方案不斷被推出,目前阿凡達智控圍繞智能家居的離線語音解決方案已經非常齊全,同時落地了全國多需求多場景的示范性項目,獲得了非常高的口碑反饋。無論是離線單品還是全屋離線語音控制,隨著體驗優(yōu)化、安全關注與高性價比等多種優(yōu)勢被智能家居圈重視,離線語音一定會有更加成熟的市場應用與大規(guī)模項目落地應用。
- 蜜度索驥:以跨模態(tài)檢索技術助力“企宣”向上生長
- 2023:警惕數字化時代詐騙行為與AI戰(zhàn)爭的雙重沖擊
- OpenAI研發(fā)人形機器人,小米15Ultra月底發(fā)布,科技新動態(tài)
- 心理援助熱線即將上線,全國統(tǒng)一電話“12356”即將在明年5月1日前開通,助你走出心理困境
- Anthropic研究發(fā)現:打錯字可助攻解鎖GPT-4等AI模型秘密
- 小米新車發(fā)布:YU7亮相,小米注冊全新商標,揭秘第二款車的神秘面紗
- 一汽大眾高層變動:潘占福"下課",誰將接任黨委書記、總經理?
- 2024新能源汽車行業(yè)破繭而出:技術落地與綠色變革的雙重挑戰(zhàn)
- 中國新能源市場大熱:最高省市滲透率超7成,油車逐漸淡出視線
- 特斯拉Cybertruck漏油問題嚴重,提車3天需維修1個月,車主怒火中燒
- 360大模型:重新定義AGI,打破行業(yè)現狀
免責聲明:本網站內容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網站出現的信息,均僅供參考。本網站將盡力確保所提供信息的準確性及可靠性,但不保證有關資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網站對有關資料所引致的錯誤、不確或遺漏,概不負任何法律責任。任何單位或個人認為本網站中的網頁或鏈接內容可能涉嫌侵犯其知識產權或存在不實內容時,應及時向本網站提出書面權利通知或不實情況說明,并提供身份證明、權屬證明及詳細侵權或不實情況證明。本網站在收到上述法律文件后,將會依法盡快聯系相關文章源頭核實,溝通刪除相關內容或斷開相關鏈接。