Al碰上智能圖形,無縫銜接虛擬世界

文/周曉奇

編輯/單一

“19.36噸干魷魚在京東拍賣上拍,最終以178.12萬成交。人生兩大悲哀:活得不如咸魚,身價(jià)不如魷魚?!?/p>

在今年京東雙十一全球好物節(jié)期間,六款形象可愛的卡通虛擬主播,用詼諧的語言精確地播報(bào)著各個(gè)銷售數(shù)據(jù),并且還能夠與其進(jìn)行實(shí)時(shí)互動(dòng),獲知想要了解的數(shù)據(jù)。

京東早已不是首次使用虛擬主播,此前還與該技術(shù)背后提供方杭州相芯科技有限公司(以下簡稱相芯科技),合作展現(xiàn)了真人形象虛擬主播京小帥和京小蕾。

據(jù)京東人工智能高級產(chǎn)品經(jīng)理許俊愷表示,相芯科技一直是京東的AI解決方案的合作伙伴,此次基于京東銷售數(shù)據(jù)的內(nèi)容升級,用卡通虛擬主播播報(bào)京東銷售數(shù)據(jù)很好地體現(xiàn)了京東的科技創(chuàng)新范兒。

全球VR/AR市場規(guī)模,圖片來源于東吳證券報(bào)告

5G潮的來臨,VR/AR或許將迎來快速發(fā)展,根據(jù)中國信通院數(shù)據(jù),2018年全球虛擬現(xiàn)實(shí)市場規(guī)模將超過700億元人民幣,同比增長126%。

各方利好下,相關(guān)技術(shù)也在逐步滲透到消費(fèi)端。傳統(tǒng)圖形學(xué)的手段主要是利用數(shù)學(xué)工具對現(xiàn)實(shí)世界進(jìn)行建模,是Physical Based Approach。主要解決了專業(yè)用戶如何生成圖形給人看的問題,也就是PGC內(nèi)容。

而近年來圖形學(xué)的發(fā)展越來越多地往普通用戶如何可以方便地生成圖形內(nèi)容發(fā)展,計(jì)算機(jī)圖形學(xué)結(jié)合了計(jì)算機(jī)視覺、機(jī)器學(xué)習(xí)、人機(jī)交互等領(lǐng)域的知識(shí),來實(shí)現(xiàn)自動(dòng)化的內(nèi)容生成和更自然的交互,形成了智能圖形學(xué)的概念。

新一代的圖形學(xué)越來越多的利用數(shù)據(jù),更多地傾向于Data Driven Approach,促生了自動(dòng)化的內(nèi)容生成和自然的交互手段,由于對UGC內(nèi)容生產(chǎn)的促進(jìn),其應(yīng)用場景也擴(kuò)展到短視頻、直播、及更多的應(yīng)用場景中。

2016年成立的相芯科技,正是在智能圖形技術(shù)領(lǐng)域的創(chuàng)新者,公司專注AI+計(jì)算機(jī)圖形學(xué)方向,目前產(chǎn)品主要有視頻AR特效、虛擬形象自動(dòng)生成、AI虛擬主播、AI虛擬助手等。

相芯科技部分3D卡通虛擬主播

如今,成立近四年的相芯科技,已服務(wù)近500家B端客戶,其中包括百度、微軟小冰、傳音、浙江電視臺(tái)等,相關(guān)技術(shù)也廣泛應(yīng)用在智能手機(jī)、直播、短視頻、在線教育、新零售等眾多行業(yè)。

由于擁有強(qiáng)勁的技術(shù)實(shí)力與廣闊的市場前景,相芯科技在成立一年后就實(shí)現(xiàn)盈利,目前已連續(xù)三年盈利。但走到這一步,并不是一件容易的事。

突破瓶頸,走向消費(fèi)級

打開攝像頭,選擇河豚形象,一個(gè)活靈活現(xiàn)的animoji(3D動(dòng)畫表情)出現(xiàn)在了屏幕端,伴隨著真人張嘴的動(dòng)作,屏幕中的animoji吐出了一連串的氣泡,好像身處水中一般。

在陌生人社交APP Soul的功能中,Avatar(虛擬3D形象)實(shí)時(shí)表情捕捉成為年輕群體中頗受歡迎的功能。虛擬形象不僅能夠還原真人表情,增加社交趣味性,也能夠在與陌生人交流中保護(hù)自身安全。

相芯科技的虛擬形象驅(qū)動(dòng)

看似簡單的應(yīng)用,真正實(shí)現(xiàn)起來卻并不容易。Avatar其實(shí)并不新鮮,已經(jīng)在影視、動(dòng)漫、游戲等領(lǐng)域得到了應(yīng)用,但這項(xiàng)技術(shù)此前從未真正走進(jìn)消費(fèi)級領(lǐng)域。究其原因,在于Avatar的普及存在技術(shù)瓶頸與成本方面的難題。

據(jù)相芯科技向鋅財(cái)經(jīng)介紹,Avatar技術(shù)在消費(fèi)級設(shè)備上實(shí)現(xiàn)的難度主要體現(xiàn)在Avatar生成、Avatar驅(qū)動(dòng)互動(dòng)。

此前在Avatar生成上,構(gòu)建一個(gè)可實(shí)現(xiàn)表情等全部動(dòng)態(tài)效果的真人3D模型,不僅耗時(shí)久,而且價(jià)格高昂,這直接導(dǎo)致Avatar難以實(shí)現(xiàn)在消費(fèi)級領(lǐng)域進(jìn)行大規(guī)模應(yīng)用。

為此,相芯科技打造出了全球首創(chuàng)的虛擬形象自動(dòng)生成技術(shù) (Photo to Avatar,簡稱PTA),原本成本高、耗時(shí)長的Avatar生成,通過此技術(shù)只需要給到一張照片,即可以秒級的速度全自動(dòng)生成一個(gè)全動(dòng)態(tài)Avatar,用戶只需要一臺(tái)智能手機(jī)就能實(shí)現(xiàn),極大地降低了Avatar生成的硬件成本。

與此同時(shí),在Avatar驅(qū)動(dòng)方面,相芯科技突破性地使用了智能手機(jī)上的普通攝像頭,無需使用深度攝像頭,即可進(jìn)行精準(zhǔn)的面部表情捕捉,讓Avatar的表情始終隨著用戶表情進(jìn)行即時(shí)變化。這大幅度降低了用戶的創(chuàng)作難度,用戶體驗(yàn)也更真實(shí)。

當(dāng)下,相芯科技的核心技術(shù)人員來自浙江大學(xué)、微軟亞洲研究院、蘋果等公司,在計(jì)算機(jī)圖形、計(jì)算機(jī)視覺、VR/AR等技術(shù)領(lǐng)域擁有20多年的研發(fā)經(jīng)驗(yàn)。

經(jīng)過不斷努力,目前相芯科技已經(jīng)完全Avatar生成、互動(dòng)和渲染技術(shù)的全面布局,可支持包含面部、舌頭、眼球在內(nèi)的56個(gè)表情系數(shù)的融合。

在細(xì)節(jié)上,相芯科技也沒有含糊,添加了帶物理動(dòng)效的animoji,用戶在實(shí)時(shí)驅(qū)動(dòng)時(shí),可發(fā)現(xiàn)在耳朵、毛發(fā)等地方,會(huì)遵循物理力學(xué)自然擺動(dòng),效果更為真實(shí)生動(dòng)。

與市面上類似產(chǎn)品相比,相芯科技的animoji表情靈活豐富,維度比類似產(chǎn)品更多。

一直以來,讓創(chuàng)作更簡單,交互更自然,體驗(yàn)更真實(shí),也成為相芯科技不斷努力的目標(biāo)。

從交互到“交流”

“浙江省在全國的排名情況?”在今年京東雙十一全球好物節(jié)上,工作人員直接向京東3D虛擬主播京小帥詢問道。

隨即,京小帥脖頸微傾,眼神閃爍,帶著職業(yè)主持人的微笑播報(bào)道:2019年京東全球好物節(jié),浙江省消費(fèi)增長強(qiáng)勁。從下單量看,該省排名前五的城市是:杭州市、溫州市、臺(tái)州市……

整個(gè)播報(bào)過程語速流暢,沒有一絲卡頓,與真人主播看不出任何差別,京東人工智能和相芯科技聯(lián)合打造的AI虛擬主播,成為AI落地從交互到交流成為重要展現(xiàn)方式。

相芯科技與京東人工智能打造的AI虛擬主播京小帥

在移動(dòng)互聯(lián)網(wǎng)時(shí)代,智能手機(jī)通過其更加自然的交互和靈活的應(yīng)用方式,不僅承載了部分基于PC的傳統(tǒng)互聯(lián)網(wǎng)應(yīng)用,同時(shí)衍生出了更為豐富的移動(dòng)互聯(lián)網(wǎng)生態(tài)。而隨著5G、云計(jì)算等技術(shù)的發(fā)展,勢必會(huì)提升用戶體驗(yàn),實(shí)現(xiàn)人與機(jī)器的無縫交流。

巨頭們也在紛紛通過布局智能音箱行業(yè),切入未來的萬物互聯(lián)生態(tài)中,然而此前大多數(shù)產(chǎn)品仍然停留在語音交互階段,用戶可能需要進(jìn)行多輪對話才能獲知想要的信息,這無疑降低了獲取信息的效率。

有屏化正在成為智能音箱升級迭代的重要標(biāo)志。據(jù)市場研究機(jī)構(gòu)Canalys披露的統(tǒng)計(jì)數(shù)據(jù)顯示,有屏智能音箱在2019年第三季度的同比增長高達(dá)500%,占到智能音箱總銷量的22%。

智能音箱有屏化的迭代,讓擁有個(gè)性化形象,并且能夠和用戶面對面互動(dòng)的可視化AI虛擬智能助手,成為其標(biāo)配。

相芯科技的AI虛擬助手解決方案,也早已進(jìn)行全方位的布局,自主研發(fā)的語音動(dòng)畫合成技術(shù)(STA),將人工智能與計(jì)算機(jī)圖形學(xué)相結(jié)合。

當(dāng)計(jì)算機(jī)獲取語音或者文本中的內(nèi)容信息后,STA即可通過計(jì)算機(jī)圖形學(xué)合成技術(shù)對虛擬形象的面部進(jìn)行驅(qū)動(dòng)并融合,實(shí)現(xiàn)極具逼真感的表情還原。

相芯科技自主研發(fā)的STA技術(shù)

與此同時(shí),相芯科技的STA技術(shù)還可與市面上主流的語音識(shí)別(ASR)、自然語言處理(NLP)、語音合成(TTS)兼容結(jié)合,既可為擁有語音技術(shù)的客戶帶來可視化的虛擬形象升級,還可為沒有語音技術(shù)的客戶帶來完備的AI虛擬助手解決方案。

目前根據(jù)不同需求,相芯科技還可定制專屬形象,包括3D卡通、3D動(dòng)物、3D數(shù)字人、2.5D仿真人、深度學(xué)習(xí)仿真人等類型,并可適用于醫(yī)療、金融、教育、零售等各種應(yīng)用場景。

從單純的人機(jī)交互,到實(shí)現(xiàn)可交流的人機(jī)互動(dòng),技術(shù)的突破正在帶來不同的體驗(yàn),而掌握這些技術(shù)的玩家,才能真正在今后立足生根,成長為新一代的巨頭。

多維度的應(yīng)用場景

“浙江啟動(dòng)防臺(tái)風(fēng)Ⅱ級應(yīng)急響應(yīng)、杭州蕭山國際機(jī)場目前有20個(gè)航班取消、臺(tái)風(fēng)利奇馬距離溫嶺市東南方向225公里……”AI主播“小范兒”時(shí)刻播報(bào)著超強(qiáng)臺(tái)風(fēng)利奇馬的最新消息。

今年8月,利奇馬登陸江浙沿海地區(qū),為應(yīng)對這一超強(qiáng)臺(tái)風(fēng),錢江臺(tái)&錢江視頻緊急啟用了AI主播“小范兒”,24小時(shí)不間斷地為民眾播報(bào)利奇馬的最新動(dòng)態(tài)。

相芯科技與錢江頻道聯(lián)合打造的AI虛擬主播小范兒

AI虛擬主播并不新奇,但此次由錢江頻道與相芯科技聯(lián)合打造的AI主播,在突發(fā)性事件中出色完成播報(bào)任務(wù),標(biāo)志著AI虛擬主播在實(shí)際落地中的新突破。

相芯科技的落地場景遠(yuǎn)不止傳媒領(lǐng)域,在游戲、社交、電商、教育等領(lǐng)域,都可完美匹配。

在視頻AR特效的應(yīng)用中,美妝功能頗受女性歡迎,相芯科技基于209個(gè)人臉關(guān)鍵點(diǎn),支持粉底、腮紅、口紅、眼線等10個(gè)美妝維度,在不需要重新制作美妝素材的情況下,即可幫客戶輕松打造個(gè)性化妝容。

而在單個(gè)美妝維度上,比如口紅色號(hào)較多,女性需要挑選適合自己的色號(hào),這時(shí)只要提前預(yù)置多種色號(hào)的口紅道具,在客戶端加載切換,即可實(shí)現(xiàn)口紅實(shí)時(shí)試色的功能,既能提升客戶挑選效率,還能實(shí)時(shí)看到上妝效果。

與此同時(shí),在線上社交領(lǐng)域,相芯科技也能給出完美的解決方案,運(yùn)用虛擬形象自動(dòng)生成技術(shù),用戶可定制屬于自己的卡通形象,與對方實(shí)時(shí)交流,既不用擔(dān)心泄露隱私,雙方也能形成良好的互動(dòng)。

用戶在使用過程中,只需要上傳一張自拍照片,通過相芯科技的虛擬形象自動(dòng)生成技術(shù)(PTA),即可生成個(gè)性化3D卡通形象,并且高度匹配個(gè)人特征,這增強(qiáng)了用戶在交互上的自然度。

細(xì)節(jié)上,相芯科技會(huì)提取用戶面部特征,如臉型、五官、發(fā)型、皮膚、胡子等,通過將信息風(fēng)格化,生成具有本人特征的形象,實(shí)現(xiàn)千人千面的效果。

在這背后的技術(shù)應(yīng)用上,相芯科技使用端對端神經(jīng)網(wǎng)絡(luò)生成個(gè)性化形象,其中神經(jīng)網(wǎng)絡(luò)分為肖像網(wǎng)絡(luò)與風(fēng)格化網(wǎng)絡(luò)兩部分。肖像網(wǎng)絡(luò)負(fù)責(zé)全面分析用戶上傳照片,提取人臉特征,完成3D人臉的重建,風(fēng)格化網(wǎng)絡(luò)則將重建的人臉模型卡通化。

相芯科技的虛擬形象自動(dòng)生成技術(shù)(PTA),實(shí)現(xiàn)千人千面

與此同時(shí),相芯科技開發(fā)了一系列的虛擬形象互動(dòng)的應(yīng)用場景,并提供客戶端的SDK用于進(jìn)一步地虛擬形象個(gè)性化定制和互動(dòng),這也讓其可以輕松接入到各種VR/AR的應(yīng)用中。

值得注意的是,2018年,相芯科技還與浙江大學(xué),合作成立了“浙江大學(xué)-相芯科技智能圖形計(jì)算聯(lián)合實(shí)驗(yàn)室”,這為其加強(qiáng)了在技術(shù)方面的探索與突破,智能圖形技術(shù)的創(chuàng)新發(fā)展,也將得到進(jìn)一步的深入研究。

當(dāng)下,相芯科技積累起的技術(shù)護(hù)城河,打開了消費(fèi)級應(yīng)用的市場,搭建起了全方位、多維度的服務(wù)體系,而今后萬物互聯(lián)時(shí)代來臨,將給相芯科技帶來更大的增長空間,以及更有利的開拓條件。

極客網(wǎng)企業(yè)會(huì)員

免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進(jìn)一步核實(shí),并對任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。

2019-12-27
Al碰上智能圖形,無縫銜接虛擬世界
文/周曉奇編輯/單一“19.36噸干魷魚在京東拍賣上拍,最終以178.12萬成交。人生兩大悲哀:活得不如咸魚,身價(jià)不如魷魚?!痹诮衲昃〇|雙十一全球好物節(jié)期間,六款形象可愛的卡通虛擬主播,用詼諧的語言精確地播報(bào)著各個(gè)銷售數(shù)據(jù),并且還能夠與其進(jìn)行實(shí)時(shí)互動(dòng),獲知想要了解的數(shù)據(jù)。

長按掃碼 閱讀全文