6月21日,由騰訊云主辦、為期兩天的2017“云+未來”峰會在深圳順利開幕。在AI大數(shù)據(jù)專場會議中,騰訊優(yōu)圖杰出科學家賈佳亞發(fā)表了主題為“計算機視覺前沿與應用”的演講,探討和分享了計算機視覺領域的發(fā)展前景。這是繼他在本次主峰會分享“視覺AI技術以及社會價值”后,又一次與眾多行業(yè)大咖深度交流。
騰訊優(yōu)圖實驗室杰出科學家 賈佳亞
賈佳亞認為,新的視覺體驗、識別和視覺內容計算是當下研究不可分割的三大方向。優(yōu)圖實驗室在專注最前沿技術研發(fā)的同時,也將把技術的能力擴展到各個領域,讓行業(yè)和客戶接觸和共享更有趣的技術應用。
以下為賈佳亞教授演講的主要內容:
什么是計算機視覺?計算機視覺的研究目標是使計算機程序能夠解讀和理解圖片,不僅是理解圖片的顏色,而且是更高層地理解圖片的語義及特征。人類大腦有約50%的視覺皮層,大腦分配給視覺處理的部分超過其他任何功能。計算機視覺是(AI領域中)最重要的研究方向之一,代表著信息的多樣性和能夠獲到的可用信息。但正所謂知易行難,計算機視覺看上去很容易,但實現(xiàn)起來卻非常困難。
計算機視覺主要包括三個打開方式,分別為:語義理解、識別、檢測;不受想象力約束的神奇效果(即新視覺體驗);固有需求的圖像視頻計算。
我們如何理解計算機視覺?在本屆峰會上,賈佳亞結合實際案例介紹了計算機視覺的三個打開方式。
第一個打開方式:語義理解、識別、檢測
國際圖像識別領域里最出名的比賽由斯坦福大學教授發(fā)起,名叫IMAGENET。它徹底推翻原來的競賽規(guī)則,整個數(shù)據(jù)庫里包含超過14000萬張圖像,同時有超過2萬多種類別。比賽中計算機通過100多萬張圖像訓練來理解每張圖像屬于1000個類別中的某一個,這是一個龐大的匹配過程和檢測過程。目前,通過深度學習不斷提高識別的準確率,可以實現(xiàn)96%以上的圖像識別正確率,遠遠高過人眼識別率。
(圖像)檢測已經逐漸成為計算機視覺研究領域的核心內容和重要應用方向。譬如,大家想象智能家居中的冰箱。當打開冰箱時,計算機可以通過算法對它進行檢測,然后告知人們冰箱里的物品種類有多少庫存。甚至如果庫存不夠,還會提醒人們去電商平臺購買回來。這些有趣的應用,日后將通過檢測可以實現(xiàn)。
而在最新研究方向上,通過分析到更加細顆粒度的圖像識別,AI可以來推動智能駕駛、輔助駕駛、大規(guī)模城市建設的發(fā)展。尤其是在智能駕駛或者輔助駕駛環(huán)境中,顆粒度越精細越好,計算機視覺日后將在自動駕駛等新興產業(yè)中得到應用。
第二個打開方式:新視覺效果
如今的AI技術已可自動產生非常有趣的效果,比如能夠將自然場景變成鉛筆畫、水彩畫、油畫,甚至是各種抽象畫法,且已可控。以往,企業(yè)可能需要讓設計師、藝術家花較長的時間設計類似的場景。但現(xiàn)在只要接入這項技術的API或SDK,一秒鐘就能得到同樣,甚至更好的設計效果。
另一個例子,在工作中,當遇到需要畫餅狀圖的場景時,會發(fā)現(xiàn)原本在PPT里呈現(xiàn)得很好看的圖片,打印出來后卻缺失了部分顏色細節(jié)。但是,通過算法可在29毫秒內實現(xiàn)圖片效果的優(yōu)化,以黑白的方式還原不同色彩的細節(jié)呈現(xiàn)。而這正是計算機視覺有趣的地方——永遠可以產生大眾想象不到的新效果。
第三個打開方式:固有需求的圖像視頻計算
當你跟領導站在臺上拍了一張照片,或者你領獎時和朋友照了一張合影,結果照片較為模糊。這時候處境變得十分尷尬,因為你不可能再回到原來的場地再拍攝。此時,通過一個高級計算過程后便可將該圖做去模糊處理,讓重要的信息可以重構出來。
另外,關于強迫透視,可以讓拍攝的圖像或背景虛化,或前景凸顯,甚至進行模糊區(qū)域的切換,把聚焦點放在別的地方。目前,一些廠商已使用這項技術來實現(xiàn)圖片后期單反效果的增強。
隨著計算機視覺的不斷發(fā)展,新的內容會不斷出現(xiàn),計算機視覺應用也會成為生活的基本元素。所以在未來,需要人們擔心的并不是視覺AI無法實現(xiàn)什么,而是計算機視覺將變得無所不能。
- 小米召回SU7標準版車型,春運低價票來襲,12306客服回應,你怎么看?
- 智譜管理層變動引關注:兩名高管離職,公司未來走向成謎
- 特斯拉召回超120萬輛汽車:安全隱患不容忽視
- 小米召回SU7標準版車型:OTA升級解決,這次為何小米首度召回?
- Anthropic推出全新API:AI信息驗證之戰(zhàn)再掀波瀾
- 未來解碼:英偉達引領機器人技術產業(yè)融合,智造新篇章
- 網易云下架SM娛樂版權歌曲:數(shù)百萬用戶將受影響,版權之爭再起波瀾
- 百川智能全新模型Baichuan-M1:顛覆醫(yī)療循證模式,三大推理能力引領全場景深度思考
- 武漢阿里巴巴總部即將亮相,共繪數(shù)字產業(yè)新藍圖
- iPhone 16在禁令后苦盡甘來:蘋果即將與印尼達成協(xié)議,解禁在望
免責聲明:本網站內容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網站出現(xiàn)的信息,均僅供參考。本網站將盡力確保所提供信息的準確性及可靠性,但不保證有關資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網站對有關資料所引致的錯誤、不確或遺漏,概不負任何法律責任。任何單位或個人認為本網站中的網頁或鏈接內容可能涉嫌侵犯其知識產權或存在不實內容時,應及時向本網站提出書面權利通知或不實情況說明,并提供身份證明、權屬證明及詳細侵權或不實情況證明。本網站在收到上述法律文件后,將會依法盡快聯(lián)系相關文章源頭核實,溝通刪除相關內容或斷開相關鏈接。