讓AI觸手可及 曠視5款AI技術(shù)亮相“Qualcomm人工智能開放日”

4月19日,Qualcomm以“讓AI觸手可及”為主題,在深圳舉辦一年一度的“Qualcomm人工智能開放日”,分享了自身在AI領(lǐng)域10余年的基礎(chǔ)科技研發(fā)成果,以及推動AI在不同行業(yè)落地和普及的最新進展。

作為Qualcomm AI生態(tài)系統(tǒng)的重要合作伙伴,曠視受邀出席本次“Qualcomm人工智能開放日”,并借此機會展示了5款基于Qualcomm人工智能引擎的AI技術(shù),分別是超畫質(zhì)(Super IQ)、希區(qū)柯克變焦、AI實時視頻虛化、基于ToF技術(shù)的人臉識別和支付、3D實時人體姿態(tài)追蹤。這些AI技術(shù),一方面為人們帶來更高效、更智能且具備感知能力的極致體驗,另一方面,也表明曠視正在通過AI算法賦能以手機為核心的個人設(shè)備大腦場景,來構(gòu)建驅(qū)動百億臺智能設(shè)備的物聯(lián)網(wǎng)生態(tài)系統(tǒng),并走出堅實的一步。

計算機視覺應用的好壞

已成為手機評價標準的重要指標

從2017年開始,越來越多的手機廠商意識到,人工智能技術(shù)給智能手機行業(yè)帶來新的價值,于是紛紛開始推出“AI+手機”。2018年,主流手機廠商更是在各自的旗艦機型中全面引入AI技術(shù),芯片廠商也紛紛提升產(chǎn)品AI處理的性能,這些都正在成為市場的主流。

Qualcomm是AI技術(shù)和芯片解決方案的佼佼者和領(lǐng)航者。目前,Qualcomm支持完整的從云到端的AI解決方案。在終端側(cè),驍龍移動平臺已為超過10億部智能手機提供領(lǐng)先的AI加速。以Qualcomm于去年年底推出驍龍855移動平臺為例,它集成第四代多核Qualcomm 人工智能引擎,其中包括全新設(shè)計的、專門面向AI處理而設(shè)計的硬件核心——Hexagon張量加速器(HTA)。

就在本月,Qualcomm又宣布了面向高端和中端市場的全新驍龍7系和6系全新平臺。驍龍730和730G移動平臺集成了多項過去僅在驍龍8系支持的技術(shù),實現(xiàn)了全新體驗升級,這其中就包括第四代多核人工智能引擎,它提升了拍攝、游戲、語音和安全的終端側(cè)直觀交互的處理速度,AI算力是前代平臺驍龍710的2倍。

Qualcomm驍龍665、驍龍730和730G移動平臺

得益于AI芯片技術(shù)的不斷發(fā)展,計算機視覺也已成為手機終端不可或缺的技術(shù)。視覺技術(shù)應用的好壞,已經(jīng)成為評判一款手機產(chǎn)品重要的指標之一。在2017年《IDC Consumerscape 360°》調(diào)研中,51%的用戶會將拍照作為購買手機的七大選擇因素之一,這也表明視覺應用正在成為提升用戶體驗,影響用戶購買行為的重要指標。

業(yè)內(nèi)人士分析認為,在當前深入推進的數(shù)字化建設(shè)進程中,AI 與 IoT 的結(jié)合成為行業(yè)升級新的探索方向。而在 AIoT 下的萬物互聯(lián)世界,打造應用于不同場景的智能物聯(lián)終端,也成為實現(xiàn)數(shù)字化的首舉。作為中國領(lǐng)先的人工智能企業(yè),曠視致力于圍繞核心的人工智能框架與深度學習算法連接更多 IoT 設(shè)備,與行業(yè)生態(tài)合作伙伴一起打造軟硬結(jié)合的數(shù)字化產(chǎn)品及解決方案,為客戶提供閉環(huán)的商業(yè)價值,成為行業(yè)智能物聯(lián)方案專家。在這過程中,以手機為核心的個人設(shè)備大腦場景來構(gòu)建驅(qū)動百億臺智能設(shè)備的物聯(lián)網(wǎng)生態(tài)系統(tǒng),則成為至關(guān)重要的一步。

曠視作為作為Qualcomm AI生態(tài)系統(tǒng)的重要合作伙伴,現(xiàn)也正在將自身成熟的數(shù)字化解決方案結(jié)合Qualcomm人工智能引擎和移動平臺,推動數(shù)字化時代下的智能物聯(lián)終端創(chuàng)新。

曠視超畫質(zhì)、希區(qū)柯克變焦、AI實時視頻虛化

成為“Qualcomm人工智能開放日”的焦點

此次在“Qualcomm人工智能開放日”上亮相的曠視超畫質(zhì)(Super IQ)、希區(qū)柯克變焦(DollyZoom)、AI實時視頻虛化等技術(shù),也從側(cè)面印證著上述觀點,成為當天開放日的焦點,引發(fā)不少觀眾關(guān)注。

業(yè)內(nèi)人士認為,人工智能對于智能手機的價值,是能夠提前預測用戶需求,主動給出相應指引或回應,實現(xiàn)從Smart到Intelligent。未來手機將成為用戶聯(lián)網(wǎng)和交互的中心,并演變?yōu)閭€人設(shè)備大腦。因而用戶對智能手機的選擇,也正在從過去的配置優(yōu)先逐步向體驗優(yōu)先轉(zhuǎn)變。在改善用戶體驗中,人工智能及算法將發(fā)揮重要作用。

具體來看,曠視超畫質(zhì)技術(shù)基于Qualcomm最新一代旗艦驍龍855移動平臺,通過對原始圖像進行處理,能夠更好地降低圖片噪點、保留畫面細節(jié),優(yōu)化拍攝和影像處理的時間,顯著提升用戶在夜晚和低光照環(huán)境下的拍攝體驗,突破手機在夜景和弱光環(huán)境下拍攝的局限,引領(lǐng)AI+手機夜景拍攝的新潮流。

用戶在“Qualcomm人工智能開放日”上體驗曠視超畫質(zhì)技術(shù)

利用復合多幀降噪和HDR技術(shù),曠視超畫質(zhì)技術(shù)能夠提升動態(tài)范圍,有效提高手機夜間拍照的成功幾率,并讓相機具備優(yōu)秀的抗鬼影能力。該技術(shù)還能夠把整個拍照曝光時間控制在300毫秒左右,算法處理時間則控制在1秒左右,讓用戶能幾乎在按下快門的同時,看到自己所拍攝的超美夜景照,實現(xiàn)所見即所得。同時,通過不同的曝光策略和曝光組合,曠視超畫質(zhì)技術(shù)能夠有效提升動態(tài)范圍,取得較好的高光壓制效果。

此次全新亮相的希區(qū)柯克變焦,原本是一種專業(yè)的電影制作技術(shù)。這種效果是通過變焦鏡頭來調(diào)整視角,同時相機朝著或遠離拍攝對象推拉(移動),從而使拍攝對象在整個幀中保持相同的大小。在它的經(jīng)典形式中,當鏡頭放大時,相機角度會從一個物件上拉開,反之亦然。因此,在縮放過程中,會有一個連續(xù)的透視失真,最明顯的特征是背景看起來會相對于主題改變大小,營造出一種科幻、炫酷的鏡頭感。

通過人工智能人臉檢測、特征檢測、視頻穩(wěn)定等技術(shù)的結(jié)合,基于驍龍855移動平臺的強大性能和算力,曠視首次創(chuàng)新性的在手機上實現(xiàn)了這一功能,通過智能一鍵單擊,能夠產(chǎn)生在滑軌上推動攝像機的大片式拍攝效果,使人像的大小和位置保持不變,同時背景不斷變化。在當前短視頻內(nèi)容為王的時代,曠視希區(qū)柯克變焦可以讓用戶輕松炫酷的短視頻作品,刷爆朋友圈。

AI實時視頻虛化技術(shù),也是曠視首次基于驍龍855移動平臺,在手機上利用AI算法模擬的深度圖像來模擬光學失焦的算法。該技術(shù)分別使用VideoBokeh(視頻虛化算法)與Segmentation(人像分割算法)算法,利用單攝輸入,結(jié)合虛化算法,配合對RGB圖像的理解,使用深度學習算法,可以準確地將前后景物進行區(qū)別,從而模擬出光學虛焦的現(xiàn)象。

曠視3D實時人體姿態(tài)追蹤算法

將成為下一代AI+手機發(fā)展方向

3D視覺逐漸成為計算機視覺領(lǐng)域的另一大發(fā)展趨勢,并確立起核心應用的地位。

從2018年開始,3D攝像頭被越來越多的主流手機廠商所采用,由硬件結(jié)合人工智能算法的軟硬件結(jié)合已成為必然趨勢,新的3D視覺時代已經(jīng)開啟。隨著光學器件的不斷進步,算法與解決方案層不斷優(yōu)化,3D深度視覺的精度和實用性也因此得到大幅提升。在此背景下,3D應用也將為用戶帶來顛覆性的人機交互體驗。曠視基于ToF技術(shù)的人臉識別和支付和3D實時人體姿態(tài)追蹤算法,則是其中的佼佼者和典型代表。

先看基于ToF技術(shù)的人臉識別與支付算法。據(jù)曠視相關(guān)工作人員介紹,基于該算法,曠視聯(lián)合 vivo 打造了世界首款基于ToF前置的FaceID。在 3D 支付產(chǎn)品的開發(fā)中,vivo 手機基于驍龍845移動平臺,在曠視三個核心算法模型結(jié)構(gòu)加持下,可實現(xiàn) 0.1秒內(nèi)極速識別,0.03秒重建和達百萬分之一的支付精度,包括多尺度多特征的注意力檢測模型,可自適應網(wǎng)絡(luò)、多模型融合的識別方案,以及基于業(yè)界開創(chuàng)性的移動卷積神經(jīng)網(wǎng)絡(luò) ShuffleNet 定制開發(fā)的活體檢測模型。有了這項技術(shù),vivo 用戶將可以用人臉替代指紋、密碼或 PIN 碼作為移動支付的主要驗證方式。目前,基于ToF技術(shù)的人臉識別與支付算法,也已成為更多高端AI+手機的必然選擇。

3D實時人體姿態(tài)追蹤算法則代表了下一代AI+手機的發(fā)展方向。該算法多用于體感游戲、3D試衣等對三維空間動作要求高的場景,難點在于3D骨骼點比2D骨骼點多一個深度維度的信息。曠視相關(guān)負責人表示,3D實時人體姿態(tài)追蹤算法基于驍龍730移動平臺結(jié)合曠視深度算法一起來實現(xiàn),并且對攝像頭的硬件要求較低,普通2D攝像頭即可,可以在手機上達到30FPS的圖像,并完全同步模特的動作,在未來擁有巨大的想象和應用空間。

曠視3D實時人體姿態(tài)追蹤算法在“Qualcomm人工智能開放日”上亮相

本次曠視在“Qualcomm人工智能開放日”上展示的AI技術(shù),只是曠視眾多產(chǎn)品和技術(shù)中的冰山一角。

當前,曠視正在積極推進人工智能及物聯(lián)網(wǎng)技術(shù)與實體經(jīng)濟的加速融合,實現(xiàn)前沿科技規(guī)?;纳虡I(yè)落地。在這過程中,以手機為核心的個人設(shè)備大腦場景則是其中的重點,曠視以此為支撐,通過算法為移動終端賦能,并持續(xù)聚焦客戶價值與產(chǎn)品價值。在垂直行業(yè),曠視希望牽頭與眾多生態(tài)合作伙伴一起,打造真正降本增效、軟硬結(jié)合的行業(yè)數(shù)字化解決方案,實現(xiàn)客戶價值;同時曠視專注自身核心技術(shù)基因,不斷創(chuàng)新突破,打造極具競爭力的底層核心技術(shù)與核心產(chǎn)品,實現(xiàn)產(chǎn)品價值。截止目前,在個人設(shè)備大腦場景,曠視的智能終端解決方案已覆蓋70%以上的安卓手機市場,曠視開發(fā)的刷臉解鎖、刷臉支付、3D建模、AI人像光效、超畫質(zhì)等創(chuàng)新應用和方案,正在讓 3 億多臺手機變得更聰明。

(免責聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關(guān)資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負任何法律責任。
任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。 )

贊助商
2019-04-28
讓AI觸手可及 曠視5款AI技術(shù)亮相“Qualcomm人工智能開放日”
4月19日,Qualcomm以“讓AI觸手可及”為主題,在深圳舉辦一年一度的“Qualcomm人工智能開放日”,分享了自身在AI領(lǐng)域10余年的基礎(chǔ)科技研發(fā)成果,以及推動AI在不同行業(yè)落地和普及的最新進

長按掃碼 閱讀全文