“我所見過的事物,你們人類絕對無法置信。”
30多年前,電影《銀翼殺手》的AI復制人羅伊意味深長的說出這句經典臺詞,影響了一代人。
30多年過去了,《銀翼殺手》中所暢想的AI應用,比如智能汽車、高清視頻通話、智能家居、面部識別等等技術,一個個正在成為現(xiàn)實。我們終于看到了人工智能的諸多落地應用,AI人羅伊所見過的事物,在我們這個時代“因為相信,所以看見”。
時至今日,AI與各行各業(yè)的結合深入肌理,已經從以往的錦上添花變成了如今的“標配品”。中國所有的大型企業(yè),不管是傳統(tǒng)巨頭還是科技企業(yè),都已經開始應用AI降本增效,高效運轉。
那么,AI所驅動的各類應用和服務,為什么能夠高效的落地應用?在我看來就是因為有一些我們消費者無法感知的“幕后英雄”,輸出各自的能力,賦能產業(yè)升級,進而加速服務落地。
很多朋友都知道,最近1個月以來,我密集的做了大量AI商業(yè)化情況的選題。目前大家的目光都聚焦在算法或算力上,但對AI三要素的“數(shù)據(jù)”卻還不甚了解。所以當我提出想要了解人工智能背后的故事時,有人推薦我去找云測數(shù)據(jù)聊聊,因為目前國內大部分人工智能企業(yè)都選擇了云測數(shù)據(jù)來提供AI數(shù)據(jù)服務,包括熱門的智能駕駛、金融、智慧城市等領域。
于是乎,2019年12月的第一個周一,我從亦莊出發(fā)趕赴酒仙橋,拜訪Testin云測,和云測數(shù)據(jù)總經理賈宇航暢聊一下午,深刻的感受到數(shù)據(jù)標注這件“幕后工作”,對AI產業(yè)化落地的重要性,可以說數(shù)據(jù)是否精準決定了AI商業(yè)化落地應用的最終效果,甚至說沒有好的數(shù)據(jù),人工智能就沒有未來。
今天,我就結合我對行業(yè)的一些理解觀察,以及當天溝通探討的一些感悟,聊聊我對AI數(shù)據(jù)服務的一些新的看法。
AI產業(yè)背后的“同行者”:為什么是云測數(shù)據(jù)?
Testin云測旗下的業(yè)務品牌“云測數(shù)據(jù)”專攻于為AI提供定制化數(shù)據(jù)服務,雖然看起來是一項比較新的業(yè)務,但秉承Testin云測9年以來在企業(yè)服務領域的深耕與實踐,云測數(shù)據(jù)無論是技術能力的先進性、流程化管理能力、還是對AI企業(yè)數(shù)據(jù)需求的洞察,都表現(xiàn)出來足夠的專業(yè)性。甚至在中國科學院《互聯(lián)網(wǎng)周刊》舉行的《2019新型企業(yè)論壇》上,也把2019最佳人工智能服務平臺,頒給了云測數(shù)據(jù)的“AI數(shù)據(jù)標注”服務平臺。
云測數(shù)據(jù)是做什么的?通俗的來講,云測數(shù)據(jù)是AI產業(yè)背后的“同行者”,所做的都是難度大且重要、又最隱秘的工作,它承擔著AI產業(yè)落地“最后一公里”最重要的環(huán)節(jié)——為人工智能提供“數(shù)據(jù)養(yǎng)料”。簡單來說,如果沒有云測數(shù)據(jù)這種提供AI數(shù)據(jù)標注的公司,AI企業(yè)要想精準、高效的落地各類面向消費者的業(yè)務,都是空談。
由此,我們可以探討一個話題“數(shù)據(jù)賦能AI?那么誰來賦能數(shù)據(jù)”解答這個問題,我們需要先回顧下人工智能三個要素,分別是“數(shù)據(jù)、算法、算力”。在這其中,“數(shù)據(jù)”作為基礎中的基礎,至關重要。如同人類成長需要不斷進食一樣,AI的進化也需要數(shù)據(jù)的不斷喂養(yǎng),精準的數(shù)據(jù)如同優(yōu)質的食物,是AI健康正確發(fā)展的先決基礎。
那么,數(shù)據(jù)為什么那么重要?再打個比方,就像金庸小說《天龍八部》的聚賢莊大戰(zhàn)一樣,喬峰和少林高僧用的都是基礎的太祖長拳(同樣的算法),施展的內力也差不多(算力差不多),但實戰(zhàn)后喬峰以明顯的優(yōu)勢戰(zhàn)勝少林高僧,就是因為喬峰擁有海量的戰(zhàn)斗經驗(各種維度的數(shù)據(jù)),能給針對性的進行招式的化解。
很多人會感興趣一個話題“國內做AI數(shù)據(jù)標注和采集服務的企業(yè)其實有不少,有眾包模式的服務平臺也有綜合的AI服務提供商,同時還有輸出標準數(shù)據(jù)產品的創(chuàng)業(yè)型公司等等。那么云測數(shù)據(jù)相比這些企業(yè),有哪些區(qū)別以及優(yōu)勢呢?”
在我看來,云測數(shù)據(jù)除了繼承了公司的技術能力、流程化管理能力、獨立第三方行業(yè)角色外等歷史積累之外,它更是國內為數(shù)不多的把數(shù)據(jù)標注和采集做成規(guī)模產業(yè)的品牌。舉個簡單的例子,為了節(jié)約成本,許多平臺會通過服務分包的方式,將承接的各類項目分發(fā)給平臺的注冊用戶,這些提供數(shù)據(jù)的參與者并非全職員工。而云測數(shù)據(jù),自主打造了還原AI真實場景的“場景實驗室”,和自建的數(shù)據(jù)標注基地,打造了一支全職且專業(yè)的定制化采集和高質量的標注隊伍(已達千人左右規(guī)模),幫助人工智能企業(yè)獲取更多優(yōu)質的特定場景數(shù)據(jù),持續(xù)為AI訓練、優(yōu)化提供安全可靠、精準高質的數(shù)據(jù)服務。
打破零和博弈 數(shù)據(jù)標注安全和高質成首位
AI數(shù)據(jù)服務這兩年在國內蓬勃發(fā)展。然而當AI和數(shù)據(jù)同時出現(xiàn),總會引發(fā)業(yè)界關于數(shù)據(jù)隱私和個人信息安全的擔憂。比如近期央視報道,通過轉轉平臺可以10元錢購買5000張“人臉”照片,這條報道引發(fā)了廣泛熱議。
似乎AI數(shù)據(jù)和用戶隱私保護之間是一種零和博弈的關系,既想要便捷高質的應用數(shù)據(jù),要想保護好數(shù)據(jù),似乎不可能。
那么,數(shù)據(jù)標注如何兼顧安全和便捷,又能精準的應用,我們應該確立一個原則,那就是“發(fā)展和矛盾”問題的一般原則:即我們不能因為近年頻繁的數(shù)據(jù)安全問題而因噎廢食,放棄了對數(shù)據(jù)的應用,走向封閉;我們也不能因為單純的看到數(shù)據(jù)應用帶來的前景,而無節(jié)制的對數(shù)據(jù)進行濫用,帶來數(shù)據(jù)危機。
云測數(shù)據(jù)一直強調:“如果沒有好的數(shù)據(jù),人工智能沒有未來”。而這里的數(shù)據(jù)特指那些質量高、安全性強的AI數(shù)據(jù)。
前文提到,云測數(shù)據(jù)自建的標注基地和專職團隊,除了保證標注數(shù)據(jù)的質量和效率,更極大地提高了數(shù)據(jù)的隱私安全性。實際上以APP測試起家的Testin云測本來就擁有一整套的安全防護和信息保護的機制,并且已經應用在數(shù)據(jù)標注生產的各環(huán)節(jié)。
從防火墻的設置,以及內部信息系統(tǒng)的管護(比如操作人員進入基地大門需要指紋刷卡,且基地中也分安全等級、全方位攝像監(jiān)控、數(shù)據(jù)交付后清毀數(shù)據(jù)不留底等)乃至標準化的流程作業(yè)體系,構建DPOR安全標準等。
如此,云測數(shù)據(jù)通過項目質量風險評估、過程質量控制、質量審核、質量驗收等流程,得以輸出高質量的數(shù)據(jù)作業(yè),保障了服務精準、安全、及時的送到給客戶。至于用戶端的隱私防護,云測數(shù)據(jù)也以“不作惡”作為前置底線,和所有提供數(shù)據(jù)采集的用戶都簽訂了授權協(xié)議,明確了數(shù)據(jù)采集和使用的范疇。
Testin云測CMO張鵬飛也強調“不難看出,這一套從安全到隱私的防護體系下來,無疑會加重運營成本。但從我們行業(yè)大局發(fā)展來看,只有以這種負責的態(tài)度來執(zhí)行工作,我們的行業(yè)才能‘良幣驅除劣幣’,真正有競爭力的企業(yè)才能長久的生存下來”。
AI數(shù)據(jù)標注的三大趨勢:專業(yè)化、場景化、規(guī)模化
數(shù)據(jù)標注是AI服務體系中最重要的版塊,現(xiàn)在行業(yè)呈現(xiàn)出了欣欣向榮的發(fā)展態(tài)勢。然而,縱觀整個產業(yè)互聯(lián)網(wǎng)發(fā)展態(tài)勢,行業(yè)的大爆發(fā)也才剛剛開始,仍然有很多需要完善的地方,有很多新的機會層出不窮。
那么,AI數(shù)據(jù)標注的未來趨勢何在?在我看來主要是三個方面,分別是專業(yè)化、場景化、規(guī)?;?。
我們先來聊專業(yè)化。之所以要探討這個維度,是因為據(jù)我觀察,AI數(shù)據(jù)標注服務行業(yè),雖然名為“AI”,但所開展的數(shù)據(jù)標注和采集是一個人力活,而非腦力活,如同富士康,比拼的還是流程化管理能力和“人海戰(zhàn)術”。透過智聯(lián)招聘這種平臺,我們也能看到,AI采集和標注的相關從業(yè)人員薪資待遇也不高,并非一個高技術的工種。
關于這種現(xiàn)狀,云測數(shù)據(jù)賈宇航在和我探討時,堅信數(shù)據(jù)標注專業(yè)化的趨勢在加強,行業(yè)需要更有經驗的人。以數(shù)據(jù)標注為例,之前的2D標注,現(xiàn)在升級到了現(xiàn)在的3D多維標注,數(shù)據(jù)標注門檻越來越高,對人才的要求也越來越高。對技術的行業(yè)壁壘更在逐步提高。行業(yè)需求升級,必然倒逼供給升級,這是再簡單不過的道理。
然后來探討場景化。今天業(yè)界基本上已經達成一個共識:人工智能是用來應用的,不是像早前一樣炫技的。人工智能的應用離不開場景,缺乏場景的服務是無法應用的。
不管是云測數(shù)據(jù)也好,還是其他企業(yè)也好,都必須立足場景、立足客戶需求,滿足客戶在不同場景下的需求,才能真正意義上取得未來的先機,讓AI由技術服務,變成可以量化、可以最終應用到具體消費環(huán)節(jié)的產品。所以,我們看到云測數(shù)據(jù)重點發(fā)力的智能駕駛、智能家居、智慧城市、智慧金融等領域,都是貼合我們消費和產業(yè)實際需求的。
最后來談談規(guī)?;?。前不久中共中央國務院下發(fā)了《推進貿易高質量發(fā)展的指導意見》,特別提到構建開放、協(xié)同、高效的共性技術研發(fā)平臺,強化制造業(yè)創(chuàng)新對貿易的支撐作用。推動互聯(lián)網(wǎng)、物聯(lián)網(wǎng)、大數(shù)據(jù)、人工智能、區(qū)塊鏈與貿易有機融合,加快培育新動能。
這個文件的下發(fā),振奮熱心,人工智能等技術與高質量貿易的結合,比如帶動全新的產業(yè)機會,挖掘更多的產業(yè)潛力,會鼓舞更多行業(yè)的企業(yè)來應用人工智能,提升效率,優(yōu)化動能。那么,這些需求的出現(xiàn),就會進一步加速人工智能以及相關產業(yè)的規(guī)模化發(fā)展,進而促進單位成本降低,提高服務效能。這對于我們相關產業(yè)鏈上的服務企業(yè)來說,無疑是重大利好。
免責聲明:本網(wǎng)站內容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網(wǎng)站對有關資料所引致的錯誤、不確或遺漏,概不負任何法律責任。任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內容可能涉嫌侵犯其知識產權或存在不實內容時,應及時向本網(wǎng)站提出書面權利通知或不實情況說明,并提供身份證明、權屬證明及詳細侵權或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關文章源頭核實,溝通刪除相關內容或斷開相關鏈接。