AI+3D,一項(xiàng)具有革命性改變的感知技術(shù),正在慢慢向工業(yè)生產(chǎn)、硬件制造,以及人們?nèi)粘I顫B入。
3D感知硬件能夠提供距離、深度等數(shù)據(jù)信息,但這并不是單純的數(shù)據(jù),而是基于這些數(shù)據(jù),通過不同的表達(dá)和理解方式,實(shí)現(xiàn)不同的應(yīng)用。比如對(duì)三維場景進(jìn)行數(shù)字化建模,或者繪制三維地圖,從而讓機(jī)器能夠?qū)崟r(shí)感知自己在所處空間中的位置,以便在運(yùn)動(dòng)時(shí)及時(shí)避開障礙物等。
這需要根據(jù)深度信息生成深度圖像,并與RGB圖像,甚至是紅外圖像進(jìn)行融合并完成大量計(jì)算。
而商湯科技向筆者表示,通過硬件感知信息生成的深度圖像,往往存在因硬件性能限制而產(chǎn)生瑕的疵。例如在細(xì)小或復(fù)雜交錯(cuò)的物體之間,出現(xiàn)深度信息估計(jì)錯(cuò)誤等問題。此外,精準(zhǔn)度、魯棒性、實(shí)時(shí)性、效率等都是決定實(shí)際應(yīng)用效果的關(guān)鍵。這些問題和應(yīng)用效果都需要依靠額外的算法進(jìn)行實(shí)時(shí)處理予以彌補(bǔ)和增強(qiáng)。
據(jù)悉,AI可通過對(duì)大量實(shí)際數(shù)據(jù)進(jìn)行學(xué)習(xí),自行總結(jié)其中的規(guī)律和特征。這種方法可以在短時(shí)間內(nèi),完成傳統(tǒng)算法需要多年才能突破的問題,有效彌補(bǔ)硬件能力的不足。
3D硬件小型化,是3D視覺技術(shù)應(yīng)用場景拓展和創(chuàng)新的硬件基礎(chǔ),而AI技術(shù)則是真正的動(dòng)力引擎,兩者密不可分。在商湯科技看來,AI+3D視覺技術(shù)拐點(diǎn)已至。
什么是AI+3D?
初次接觸,可能很多人,對(duì)于AI+3D這項(xiàng)技術(shù)有些陌生。但實(shí)際上,了解之后便會(huì)發(fā)現(xiàn),就如前文所說“AI+3D是一項(xiàng)最新的感知技術(shù)”。3D屬于成像技術(shù),是靠人兩眼的視覺差產(chǎn)生的?;跀z像頭獲取的圖像信息,視覺技術(shù)可以搭配AI技術(shù)解決各種實(shí)際應(yīng)用問題。
這些深度圖像信息則可以豐富AI圖像視覺技術(shù),如同人眼一樣對(duì)場景深度進(jìn)行感知。商湯科技向筆者稱:“對(duì)于AI來說,能像人類一樣獲得深度信息后的感知能力,是他們研究這項(xiàng)課題的想法。行業(yè)早些年研究結(jié)構(gòu)光、ToF、雙攝等基于硬件設(shè)備技術(shù)都是為了帶來深度信息,搭配AI對(duì)3D圖像的感知能力,豐富不同領(lǐng)域的應(yīng)用”。
同時(shí),光鑒科技首席執(zhí)行官朱力認(rèn)為:“3D視覺技術(shù)的意義,是打開了更加廣闊的AI應(yīng)用空間。無論是輔助駕駛,還是各種虛擬現(xiàn)實(shí)、增強(qiáng)現(xiàn)實(shí)技術(shù)的應(yīng)用,這些前沿概念的落地都建立在信息交互基礎(chǔ)上。對(duì)正處于發(fā)展中的AI產(chǎn)業(yè)來說,3D視覺將幫助機(jī)器更好地“看”世界”。
據(jù)筆者了解,隨著硬件設(shè)備的小型化,AI+3D技術(shù)及其成熟的解決方案,可在手機(jī)應(yīng)用、人臉識(shí)別、AR/VR領(lǐng)域、汽車、工業(yè)等具有相關(guān)性領(lǐng)域進(jìn)行研發(fā)和場景落地。
例如:通用3D重建技術(shù),從毛絨玩具、紙箱、書包、鞋子到雕塑,用戶只需拿手機(jī)沿著物體360度環(huán)繞掃描,就能將其掃描成數(shù)字化的模型。生成的模型文件可直接用于3D打印、3D/AR相冊(cè)預(yù)覽,也可應(yīng)用于生成短視頻直播的內(nèi)容并設(shè)置動(dòng)畫,也可植入到AR養(yǎng)寵等游戲、電商的商品展示或預(yù)覽等場景中。
除此,在汽車領(lǐng)域,AI+3D技術(shù)能夠?qū)崿F(xiàn)更加精準(zhǔn)的人、車、物識(shí)別和距離感知,從而有力推動(dòng)自動(dòng)駕駛發(fā)展。在工業(yè)領(lǐng)域,AI+3D將進(jìn)一步優(yōu)化工業(yè)生產(chǎn)流程,可為機(jī)械臂賦予3D感知能力,通過高精準(zhǔn)的SLAM、物體重建和測量等技術(shù),判斷立體物體所處的位置,以及相應(yīng)尺寸、形狀和質(zhì)量等信息,提升工業(yè)生產(chǎn)智能化能力。
目前,商湯科技已在人臉識(shí)別、汽車、工業(yè)、電商、手機(jī)等領(lǐng)域進(jìn)行了深入研究。
AI+3D能否成為AI業(yè)又一“強(qiáng)心劑”
人工智能作為第四次工業(yè)革命的產(chǎn)物之一,給社會(huì)、工業(yè)、人帶來的是一場人機(jī)交互變革。與此同時(shí)在該產(chǎn)業(yè)也誕生了許多新興企業(yè),如:商湯科技、寒武紀(jì)、曠視科技、云從科技、同盾科技等估值達(dá)到或超過10億美元的AI企業(yè)。
按照產(chǎn)業(yè)鏈,從底層硬件到上層的應(yīng)用,整個(gè)AI+3D產(chǎn)業(yè)鏈可以分為四類廠商,在國內(nèi)外均有企業(yè)在進(jìn)行相應(yīng)的開發(fā):一、3D感知硬件設(shè)備的相關(guān)供應(yīng)商,包括鏡頭、攝像頭模組、圖像傳感器,以及紅外光源等器件;二、基于3D感知的AI技術(shù)/算法提供商;三、手機(jī)廠商,將AI+3D軟硬件技術(shù)進(jìn)行整合;四、應(yīng)用開發(fā)商,開發(fā)基于AI+3D技術(shù)的應(yīng)用。
很多AI企業(yè)則屬于第二類:基于3D感知的AI技術(shù)/算法提供商。
而本次AI+3D技術(shù)的應(yīng)用和產(chǎn)業(yè)鏈延伸更是將AI行業(yè)發(fā)展推向高潮。國外調(diào)研機(jī)構(gòu)QYResearch曾預(yù)測,全球3D技術(shù)市場規(guī)模2012年為796億美元,至2022年將達(dá)到3892億美元,年復(fù)合增長率為17.20%。
商湯科技認(rèn)為,“ToF在智能手機(jī)上的加速應(yīng)用,有助于3D視覺技術(shù)的廣泛普及化,會(huì)成為接下來10年中非常重要的科技趨勢。業(yè)內(nèi)統(tǒng)計(jì),2019年TOF新機(jī)出貨約0.5億臺(tái),預(yù)估2020年將達(dá)到1.5億臺(tái)”。
在筆者看來,AI+3D技術(shù)所產(chǎn)生的價(jià)值則是對(duì)以往機(jī)器2D視覺認(rèn)知的更新迭代或替代,可以讓機(jī)器通過視覺三維影像,更加智能化,對(duì)所處世界有一個(gè)較為全面且深刻的信息感知與理解。從人機(jī)交互、互動(dòng)娛樂、內(nèi)容創(chuàng)作、身份驗(yàn)證、拍照、電商等層面激發(fā)大量的創(chuàng)新應(yīng)用場景。改變傳統(tǒng)商業(yè)運(yùn)作模式。
不過,目前除了商湯科技外,谷歌、微軟、曠視科技在AI+3D技術(shù)方面也有研究。據(jù)曠視科技云事業(yè)部高級(jí)副總裁吳文昊介紹稱,“該技術(shù)已在手機(jī)領(lǐng)域有多種案例出來,但包含算法和模組的整體解決方案仍是缺位,公司正在嘗試一種從上往下的整合方案,從3D應(yīng)用層往下依次至AI算法、解決方案,最后到攝像、傳感等硬件設(shè)備制造上”。
另有行業(yè)人士認(rèn)為:“AI技術(shù)可以讓3D打印實(shí)現(xiàn)以機(jī)器制造機(jī)器人,這也是新一輪制造業(yè)革命的助推劑”。
作者:珍珍
(免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。
任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。 )