干貨!一文讀懂AI計算機視覺技術,“視覺五虎將”值得關注

作為人工智能的關鍵領域之一的計算機視覺近期再次成為了熱點,那么你真的了解什么是計算機視覺嗎?

一、什么是計算機視覺?

計算機視覺,英文Computer Vision,簡稱CV。計算機視覺是一門研究如何使機器“看”的科學,更進一步的說,就是指用攝影機和電腦代替人眼對目標進行識別、跟蹤和測量等。

二、計算機視覺和機器視覺有何區(qū)別?

事實上,二者經常會被混淆,甚至有些“專家”也沒分清。

簡單的說,二者最大的區(qū)別,在于技術要求的側重點不一樣,甚至差別很大。 計算機視覺(CV),主要是對質的分析,比如分類識別,這是一個杯子那是一條狗。或者做身份確認,比如人臉識別,車牌識別。或者做行為分析,比如人員入侵,徘徊,遺留物,人群聚集等。

機器視覺(MV),主要側重對量的分析,比如通過視覺去測量一個零件的直徑,一般來說,對準確度要求很高。

三、計算機視覺主要任務是什么?

計算機視覺的主要任務就是通過對采集的圖片或視頻進行處理以獲得相應場景的信息。計算機視覺任務的主要類型有以下幾種:

1、物體檢測

物體檢測是視覺感知的第一步,也是計算機視覺的一個重要分支。物體檢測的目標,就是用框去標出物體的位置,并給出物體的類別。

物體檢測和圖像分類不一樣,檢測側重于物體的搜索,而且物體檢測的目標必須要有固定的形狀和輪廓。圖像分類可以是任意的目標,這個目標可能是物體,也可能是一些屬性或者場景。

2、物體識別(狹義)

計算機視覺的經典問題便是判定一組圖像數據中是否包含某個特定的物體,圖像特征或運動狀態(tài)。這一問題通??梢酝ㄟ^機器自動解決,但是到目前為止,還沒有某個單一的方法能夠廣泛的對各種情況進行判定:在任意環(huán)境中識別任意物體。

現(xiàn)有技術能夠也只能夠很好地解決特定目標的識別,比如簡單幾何圖形識別、人臉識別、印刷或手寫文件識別,或者車輛識別。而且這些識別需要在特定的環(huán)境中,具有指定的光照,背景和目標姿態(tài)要求。

3、圖像分類

一張圖像中是否包含某種物體,對圖像進行特征描述是物體分類的主要研究內容。一般說來,物體分類算法通過手工特征或者特征學習方法對整個圖像進行全局描述,然后使用分類器判斷是否存在某類物體。

圖像分類問題就是給輸入圖像分配標簽的任務,這是計算機視覺的核心問題之一。這個過程往往與機器學習和深度學習不可分割。

4、物體定位

如果說圖像識別解決的是what,那么,物體定位解決的則是where的問題。利用計算視覺技術找到圖像中某一目標物體在圖像中的位置,即定位。

目標物體的定位對于計算機視覺在安防、自動駕駛等領域的應用有著至關重要的意義。

5、圖像分割

在圖像處理過程中,有時會需要對圖像進行分割來提取有價值的用于后繼處理的部分,例如篩選特征點,或者分割一或多幅圖片中含有特定目標的部分等。

圖像分割指的是將數字圖像細分為多個圖像子區(qū)域(像素的集合,也被稱作超像素)的過程。圖像分割的目的是簡化或改變圖像的表示形式,使得圖像更容易理解和分析。更精確地說,圖像分割是對圖像中的每個像素加標簽的一個過程,這一過程使得具有相同標簽的像素具有某種共同視覺特性。

“圖像語意分割”是一個像素級別的物體識別,即每個像素點都要判斷它的類別。它和檢測的區(qū)別是,物體檢測是一個物體級別的,他只需要一個框,去框住物體的位置,而通常分割是比檢測要更難的問題。

計算機視覺是通過創(chuàng)建人工模型來模擬本由人類執(zhí)行的視覺任務。其本質是模擬人類的感知與觀察的一個過程。這個過程不止識別,而是包含了一系列的過程,并且最終是可以在人工系統(tǒng)中被理解和實現(xiàn)的。

四、“視覺五虎將”都是誰

目前在計算機視覺領域已經涌現(xiàn)出商湯科技、曠視科技、深蘭科技、依圖科技、云從科技等一批技術領先的獨角獸公司,行業(yè)稱為“視覺五虎將”,我們對這些公司作個簡單介紹。

商湯科技:

公開資料顯示,商湯科技成立于2014年11月,是中國一家計算機視覺和深度學習原創(chuàng)技術的創(chuàng)新型科技公司,也是一家知名獨角獸企業(yè),致力于引領人工智能核心“深度學習”的技術突破,構建人工智能、大數據分析行業(yè)解決方案。

目前,商湯科技已與眾多知名戰(zhàn)略合作伙伴和大客戶建立合作,賦能AI于多個行業(yè),迅速落地包括人臉識別、圖像識別、視頻分析、無人駕駛、醫(yī)療影像識別等各類應用技術。此外,商湯科技以人工智能技術服務于各大安防監(jiān)控公司、銀行金融機構、手機廠商、機器人廠商、多家移動APP廠商以及政府公安等客戶。

深蘭科技:

深蘭科技,2014年由歸國博士團隊創(chuàng)建,在全球擁有近百位全職博士和博士后學術帶頭人,幾百位名校碩士研發(fā)人員,創(chuàng)造性地發(fā)明了數十項原創(chuàng)算法和原創(chuàng)技術,團隊曾多次獲得多項世界大賽和國內大賽的第一名。致力于人工智能基礎研究和應用開發(fā)。團隊利用自主知識產權的深度學習架構、機器視覺、生物智能識別等人工智能算法、無媒介支付等核心技術,在自動駕駛及整車制造、智能機器人、生物智能、AI芯片、智能零售、智慧城市、智慧安防、教育軍工等領域都有深入布局,居行業(yè)領導地位。

目前,在歐洲、美國、澳洲等多地設立區(qū)域總部和分支研發(fā)機構,國際銷售網絡覆蓋全球17個國家。擁有包括英特爾在內的6家世界級人工智能企業(yè)建立了人工智能、AIoT智聯(lián)網、人機交互、AI芯片等相關的領域的聯(lián)合實驗室,共同構筑了全球性的研發(fā)科研體系,2017年利用機器視覺等技術研發(fā)了市場公認的超越Amazon go的takego人工智能無人店技術,2018年發(fā)布了全球第一款自動駕駛功能性商用車。

曠視科技:

曠視科技成立于2011年10月,以深度學習和物聯(lián)傳感技術為核心,立足于自有原創(chuàng)深度學習算法引擎Brain++,深耕金融安全,城市安防,手機AR,商業(yè)物聯(lián),工業(yè)機器人五大核心行業(yè)。發(fā)展至今,曠視已在北京、西雅圖、南京設立獨立研究院,并在十余個核心城市設立分部。

曠視的核心人臉識別技術Face++曾被美國著名科技評論雜志《麻省理工科技評論》評定為2017全球十大前沿科技,同時公司入榜全球最聰明公司并位列第11名。在中國科技部火炬中心“獨角獸”榜單中,曠視排在人工智能類首位。

依圖科技:

成立于2012年,公司核心業(yè)務包括智能安防平臺、智慧健康醫(yī)療、城市數據大腦、智能硬件設備等。目前,依圖的技術早已經服務全國20余省安防,為海關總署及中國邊檢等提供人像比對系統(tǒng),并在招商銀行、浦發(fā)銀行,遺跡互聯(lián)網金融等多個業(yè)務場景中廣泛應用,車輛識別產品亦被公安系統(tǒng)廣泛采用,依圖也是目前國內唯一擁有10億級人像庫比對能力的公司,搭建了全球最大的人像系統(tǒng),覆蓋超過15億人像。

云從科技

成立于2015年4月,是一家從中科院重慶研究院孵化的專注于計算機視覺與人工智能的高科技企業(yè)。是計算機視覺頭部企業(yè)中的國家隊,承建了國家發(fā)改委的基礎項目重大工程——“人工智能基礎資源公共服務平臺”與產業(yè)化項目重大工程“人臉識別系統(tǒng)產業(yè)化應用平臺”。與公安部、四大銀行、證通、民航總局建立聯(lián)合實驗室,推動人工智能產品標準的建立,成為唯一同時制定國標、部標、行標的人工智能企業(yè)。國家發(fā)改委公布的《2017年“互聯(lián)網+”重大工程擬支持項目名單》中包含四個AI公司,云從科技是其中唯一一家創(chuàng)業(yè)公司。

(免責聲明:本網站內容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網站出現(xiàn)的信息,均僅供參考。本網站將盡力確保所提供信息的準確性及可靠性,但不保證有關資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網站對有關資料所引致的錯誤、不確或遺漏,概不負任何法律責任。
任何單位或個人認為本網站中的網頁或鏈接內容可能涉嫌侵犯其知識產權或存在不實內容時,應及時向本網站提出書面權利通知或不實情況說明,并提供身份證明、權屬證明及詳細侵權或不實情況證明。本網站在收到上述法律文件后,將會依法盡快聯(lián)系相關文章源頭核實,溝通刪除相關內容或斷開相關鏈接。 )

贊助商
2018-09-12
干貨!一文讀懂AI計算機視覺技術,“視覺五虎將”值得關注
作為人工智能的關鍵領域之一的計算機視覺近期再次成為了熱點,那么你真的了解什么是計算機視覺嗎?一、什么是計算機視覺?計算機視覺,英文Computer Vision,簡稱CV。

長按掃碼 閱讀全文