華捷艾米沈瑄:視覺+語音,人機(jī)交互的未來

近年來,在人工智能的浪潮下,AR與VR發(fā)展迅速,并逐漸形成了完整的產(chǎn)業(yè)鏈。值此背景之下,華捷艾米軟件科技有限公司憑借3D視覺感知、自然語言交互以及AR體感等技術(shù),打破了微軟以及蘋果在AR領(lǐng)域的壟斷產(chǎn)業(yè),一躍成為全球第三家AR攝像頭研發(fā)企業(yè)。為此,OFweek人工智能網(wǎng)編輯特別采訪了華捷艾米軟件科技有限公司COO沈瑄,以華捷艾米所面臨的難點(diǎn)為引,共同探討AR體感人機(jī)交互未來的發(fā)展趨勢。以下為采訪文字實(shí)錄:

華捷艾米軟件科技有限公司在高交會(huì)的展臺(tái)

短短數(shù)年,華捷艾米便在AR體感人機(jī)交互和人工智能領(lǐng)域取得了快速發(fā)展,受到業(yè)界認(rèn)可。那么,華捷艾米在這方面做了哪些努力?您認(rèn)為主要的難點(diǎn)問題是什么?

沈瑄:現(xiàn)階段人工智能產(chǎn)業(yè)的主要的難點(diǎn)有三個(gè),一是資金,在深度學(xué)習(xí)的骨架模型方面,我們前期共投入1.5億元人民幣,包括數(shù)據(jù)采集、數(shù)據(jù)標(biāo)記和模型訓(xùn)練、以及芯片的設(shè)計(jì)流片等等;二是時(shí)間,在2000年至2010年之間,我們借助清華大學(xué)的大型計(jì)算機(jī)對模型進(jìn)行訓(xùn)練后,便將樣本導(dǎo)入其中,然后再次訓(xùn)練兩個(gè)半月,形成了基本的算法,這是第一部分。第二部分,我們需要將算法固化成芯片,芯片生產(chǎn)有一次流片和二次流片,其流片的良率較低,每一次流片跨度需要3至6個(gè)月左右,且每一次流片都需要幾千萬的投入;第三是供應(yīng)鏈的整合,由于是新興的技術(shù),那就需要我們自己來整合上下游的供應(yīng)鏈。

華捷艾米軟件科技有限公司COO沈瑄

目前,華捷艾米公司主要產(chǎn)品有哪些?其市場表現(xiàn)如何?在技術(shù)方面有哪些積累和突破?

沈瑄:我們公司的產(chǎn)品主要有三類,第一個(gè)是相關(guān)項(xiàng)目;第二是整機(jī)產(chǎn)品,我們將OTT盒子和攝像頭做成了一體,主要應(yīng)用于教育或者學(xué)習(xí)領(lǐng)域;其三,小型化手機(jī)模組,AR攝像頭應(yīng)用于手機(jī)領(lǐng)域的市場是應(yīng)用于TV市場的十倍。由于手機(jī)集成化很高,如果想添加體感技術(shù)這一功能,則相對較難。相比之下,AR體感技術(shù)嵌入TV則比較簡單,嵌入良率高達(dá)98%,所以短期之內(nèi),我們先推出嵌入TV的產(chǎn)品,將其做好之后,逐步向手機(jī)領(lǐng)域拓展。

華捷艾米公司目前和國內(nèi)一些廠商合作情況如何?對于未來發(fā)展有何具體規(guī)劃?

沈瑄:目前,我們正在和華為以及小米等國內(nèi)手機(jī)廠商溝通。與此同時(shí),我們體感技術(shù)的參數(shù),如分辨率、幀率以及使用的距離等都和目前最先進(jìn)的技術(shù)接近,而未來我們將會(huì)重點(diǎn)提升產(chǎn)品的產(chǎn)能與良率。對于未來我們有短期規(guī)劃和詳細(xì)規(guī)劃兩部分,短期規(guī)劃為:加大在3D-AR與AI技術(shù)方面的研發(fā)資金投入,拓展其在手機(jī)、智能安防、機(jī)器人、醫(yī)療康復(fù)等領(lǐng)域的應(yīng)用,并在各領(lǐng)域成立相關(guān)的技術(shù)方案公司。詳細(xì)規(guī)劃如下:2018年成立AI研究院,專注視覺、聽覺、交互等人工智能感知技術(shù)的基礎(chǔ)研究;推出全球首款全能感知通用芯片;2019年嵌入式模組研發(fā)商業(yè)化完成,智能感知算法的全部硬件化IC,嵌入式平板/手機(jī)方案國際領(lǐng)先,推出針對各行業(yè)的智能感知解決方案;2020年成為國內(nèi)第一人工智能感知方案供應(yīng)商。

華捷艾米軟件科技有限公司AR攝像頭

面臨技術(shù)難點(diǎn),華捷艾米是如何突破的?未來的挑戰(zhàn)與應(yīng)對措施如何?

沈瑄:在一些技術(shù)難點(diǎn)方面,我們也是通過與清華、中科院、武漢大學(xué)以及華東理工等高校合作方式共同解決。至于未來的挑戰(zhàn)主要有兩個(gè)方面,其一,在目前AI的風(fēng)口下,規(guī)模過小以及高端人才不足乃是我們公司的短板。當(dāng)然,我們現(xiàn)在也通過融資方式去籌集更多的資金,以擴(kuò)大企業(yè)規(guī)模,同時(shí),我們也會(huì)去招募更高級的優(yōu)秀人才;其二,公司在游戲進(jìn)入手機(jī)行業(yè)方面的良率較低,所以我們在融資的時(shí)候會(huì)稍微注重考慮上游一些,通過產(chǎn)業(yè)鏈上的產(chǎn)業(yè)基金提供的資源,使我們的產(chǎn)能能夠大幅度提升。

目前,人工智能已經(jīng)成為全球關(guān)注的焦點(diǎn)方向,您認(rèn)為人工智能帶來的顛覆效應(yīng)主要表現(xiàn)在哪些方面?目前國內(nèi)現(xiàn)狀如何?未來在哪些領(lǐng)域更具前景?

沈瑄:從目前的發(fā)展情況來看,人工智能帶來的顛覆性主要體現(xiàn)在面部識(shí)別這一方面。在人工智能交互方面,以科大訊飛合作為例,我們通過手勢、人臉識(shí)別或者語音形成一種新的人機(jī)交互方式。事實(shí)上,現(xiàn)在的人機(jī)交互已經(jīng)跨越了多次數(shù)字浪潮,而數(shù)字浪潮至今則經(jīng)歷了四個(gè)階段,第一階段則是DOS操作界面,純文本的形式;第二階段,基于Windows的出現(xiàn),其鼠標(biāo)、鍵盤以及瀏覽器窗口形成了一種交互方式;第三階段,以手機(jī)、移動(dòng)端、觸摸屏為導(dǎo)向,包括近年來的語音+觸摸屏交互方式等;第四階段,則以VR模式為主,通過人臉識(shí)別或者語音的形式形成新的交互方式。而未來人機(jī)之間則將通過視覺+語音交互方式,如同人與人之間交流般,回歸最樸質(zhì)自然溝通方式。

未來應(yīng)用領(lǐng)域則比較廣泛,畢竟在應(yīng)用領(lǐng)域方面它需要一點(diǎn)點(diǎn)滲透,而在目前,由于機(jī)器視覺是比較基礎(chǔ)的基礎(chǔ),它可以應(yīng)用的場景很多,比如電視、游戲健身、教育培訓(xùn)、機(jī)器人、醫(yī)療康復(fù)、智能安防以及IOT物聯(lián)網(wǎng)等領(lǐng)域。

作為機(jī)器視覺技術(shù)的領(lǐng)軍者,華捷艾米在未來的發(fā)展方向是什么?是否有進(jìn)軍海外市場的打算?

沈瑄:目前,我們的主要發(fā)展TV或者OTT盒子業(yè)務(wù),明年我們會(huì)發(fā)力嵌入式設(shè)備。應(yīng)用場景也會(huì)逐漸向游戲、健身以及幼兒教育方面發(fā)展,以此提升用戶體驗(yàn)感與接受度。

在海外市場,目前我們主推幼兒教育。另外,在國內(nèi)我們將會(huì)有更大的市場空間,因?yàn)楦恿私庹麄€(gè)產(chǎn)業(yè)鏈。如目前很多電視劇生產(chǎn)商都在中國,這也為我們提供了一個(gè)很好的運(yùn)營渠道,而這些運(yùn)營渠道在海外則無法實(shí)現(xiàn)。隨著國家相關(guān)政策的不斷實(shí)施,我們也會(huì)借此機(jī)會(huì)逐步向國外市場發(fā)展。

(免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進(jìn)一步核實(shí),并對任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。
任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。 )

贊助商
2017-11-22
華捷艾米沈瑄:視覺+語音,人機(jī)交互的未來
近年來,在人工智能的浪潮下,AR與VR發(fā)展迅速,并逐漸形成了完整的產(chǎn)業(yè)鏈。

長按掃碼 閱讀全文