沒有好的數(shù)據(jù),AI就沒有未來,已經(jīng)成為行業(yè)共識(shí)。人工智能行業(yè)與數(shù)據(jù)標(biāo)注行業(yè)實(shí)際上是一個(gè)水漲船高的關(guān)系,人工智能行業(yè)越發(fā)達(dá),數(shù)據(jù)標(biāo)注行業(yè)的商業(yè)機(jī)會(huì)越大,這個(gè)道理是如此明顯,未來AI數(shù)據(jù)行業(yè)不可估量。
12月8日,由國(guó)家發(fā)改委國(guó)際合作中心、中關(guān)村管委會(huì)和大興區(qū)政府指導(dǎo)的2019T-EDGE全球創(chuàng)新大會(huì)在北京召開。在當(dāng)天最重磅的“2019EDGE Awards全球創(chuàng)新評(píng)選”上,共有九家企業(yè)獲得“2019年度科技企業(yè)”獎(jiǎng),其中大部分是像華為、順豐、戴森等這樣在C端具有知名度的行業(yè)巨頭公司,然而其中卻有一家深耕企業(yè)服務(wù)的公司—Testin云測(cè),值得我們好好聊一聊。
在科技行業(yè)內(nèi),Testin云測(cè)早已是大家的“老熟人”。2011年創(chuàng)立之時(shí),Testin云測(cè)正趕上手機(jī)行業(yè)從功能機(jī)向智能手機(jī)轉(zhuǎn)型的關(guān)鍵時(shí)期,App開發(fā)是行業(yè)最大風(fēng)口,Testin云測(cè)應(yīng)時(shí)而生,開創(chuàng)了測(cè)試行業(yè)向云測(cè)試行業(yè)的轉(zhuǎn)變,由此積累起大量客戶、建立了行業(yè)品牌地位,成為垂直領(lǐng)域的獨(dú)角獸。
然而這次Testin云測(cè)獲獎(jiǎng),卻應(yīng)該不是因?yàn)樗臏y(cè)試業(yè)務(wù),而是近兩年異軍突起的AI數(shù)據(jù)標(biāo)注業(yè)務(wù)。
事實(shí)上,EDGE Awards此項(xiàng)年度科技企業(yè)獎(jiǎng)?lì)C獎(jiǎng)標(biāo)準(zhǔn)是“2019年不斷創(chuàng)新并突破自己,在科技領(lǐng)域擁有核心競(jìng)爭(zhēng)能力,為社會(huì)做出杰出貢獻(xiàn)的企業(yè)”,像華為獲獎(jiǎng),是因?yàn)樗鼘?duì)外發(fā)布了自研操作系統(tǒng)鴻蒙OS,獵豹移動(dòng)是因?yàn)槠湓谥悄芊?wù)機(jī)器人方向布局。而Testin云測(cè)也是如此,當(dāng)年App興起時(shí),Tesitn云測(cè)以云測(cè)試搶占風(fēng)口,獲得了成功,現(xiàn)在人工智能時(shí)代大潮襲來,Testin云測(cè)又以人工智能三要素之一的數(shù)據(jù)為抓手,成立AI數(shù)據(jù)標(biāo)注業(yè)務(wù)品牌——云測(cè)數(shù)據(jù),再次成為行業(yè)Top1。
眾所周知,人工智能三要素是數(shù)據(jù)、算力和算法,其中數(shù)據(jù)居于首位,歷經(jīng)多個(gè)發(fā)展階段后,數(shù)據(jù)正在人工智能進(jìn)化中發(fā)揮著越來越重要的作用,目前人工智能算法的訓(xùn)練主要依靠大量數(shù)據(jù)來完成,而未來定制化、場(chǎng)景化的數(shù)據(jù)也將成為為人工智能商業(yè)化落地的關(guān)鍵,然而隨著AI企業(yè)對(duì)獲得特定場(chǎng)景數(shù)據(jù)的需求越來越大,單靠自身收集既不效率也不積極,這就使得專業(yè)的AI數(shù)據(jù)服務(wù)提供商云測(cè)數(shù)據(jù)應(yīng)運(yùn)而生。
從這個(gè)角度而言,如果說數(shù)據(jù)對(duì)于算法就像汽油之于發(fā)動(dòng)機(jī),那么Testin云測(cè)這樣的企業(yè)就扮演了一個(gè)AI領(lǐng)域“兩桶油”的角色,為中國(guó)人工智能產(chǎn)業(yè)提供高質(zhì)數(shù)據(jù)燃料。
就像中石化和中石油一樣,它們不但負(fù)責(zé)原油的開采,更負(fù)責(zé)油品的冶煉,云測(cè)數(shù)據(jù)通過自建數(shù)據(jù)場(chǎng)景實(shí)驗(yàn)室和數(shù)據(jù)標(biāo)注基地為智能駕駛、智能家居、智慧城市、智慧金融、新零售等領(lǐng)域提供定制化的數(shù)據(jù)標(biāo)注、數(shù)據(jù)采集服務(wù),全方位支持文本、語音、圖像、視頻等各類型數(shù)據(jù)的處理,成功幫助AI企業(yè)或AI部門構(gòu)建數(shù)據(jù)核心壁壘,為中國(guó)的AI產(chǎn)業(yè)持續(xù)提供動(dòng)力,這才應(yīng)該是Testin云測(cè)獲得“2019年度科技企業(yè)”的最重要原因。
沒有好的數(shù)據(jù),AI就沒有未來
在云測(cè)數(shù)據(jù)做大之前,數(shù)據(jù)標(biāo)注一直被行業(yè)里視為一個(gè)隱藏在人工智能領(lǐng)域里的勞動(dòng)密集型產(chǎn)業(yè)。
何謂數(shù)據(jù)標(biāo)注?簡(jiǎn)單說就是對(duì)各種類型的數(shù)據(jù)包括文本、圖片、語音、視頻等完成分類、標(biāo)框、注釋、標(biāo)記并打上說明其某種屬性的標(biāo)簽。人工智能需要海量數(shù)據(jù),但海量數(shù)據(jù)并不等同于可以供機(jī)器學(xué)習(xí)的訓(xùn)練數(shù)據(jù),符合質(zhì)量的訓(xùn)練數(shù)據(jù)需要經(jīng)過數(shù)據(jù)標(biāo)注。
數(shù)據(jù)標(biāo)注成為一種產(chǎn)業(yè)始于2005年,當(dāng)時(shí)以亞馬遜的Mturk為代表的一種新的數(shù)據(jù)采集服務(wù)——眾包模式開始出現(xiàn),其被大量的硅谷公司采用于訓(xùn)練AI算法,這種眾包模式后來也流傳到國(guó)內(nèi)。
數(shù)據(jù)標(biāo)注的眾包模式從一開始就是一個(gè)勞動(dòng)密集型產(chǎn)業(yè),因?yàn)樗旧鲜强咳斯韺?shí)現(xiàn),也就是由數(shù)據(jù)標(biāo)注員完成,其技術(shù)門檻實(shí)際上很低,這使得中國(guó)河北、河南、山東、山西等地區(qū)出現(xiàn)了很多數(shù)據(jù)標(biāo)注小作坊,數(shù)據(jù)標(biāo)注產(chǎn)業(yè)甚至為這些地區(qū)的小城鎮(zhèn)和農(nóng)村提供了大量就業(yè)機(jī)會(huì)。
大量勞動(dòng)密集型的數(shù)據(jù)標(biāo)注工廠在AI產(chǎn)業(yè)爆發(fā)初期,為中國(guó)人工智能企業(yè)的崛起做出了巨大的貢獻(xiàn)。然而,就像兒童成長(zhǎng)不同階段需要不同的營(yíng)養(yǎng)攝入一樣,隨著人工智能產(chǎn)業(yè)的發(fā)展與進(jìn)化,AI企業(yè)在落地過程中發(fā)現(xiàn),所需要的數(shù)據(jù)維度和復(fù)雜度正變得越來越高,數(shù)據(jù)服務(wù)的眾包模式以及通用數(shù)據(jù)集已經(jīng)難以滿足AI企業(yè)的數(shù)據(jù)需求。這個(gè)時(shí)候,定制化的數(shù)據(jù)服務(wù)模式就出現(xiàn)了。
就像云測(cè)數(shù)據(jù)總經(jīng)理所說:如果以前的數(shù)據(jù)標(biāo)注是為AI企業(yè)提供飼料,那么現(xiàn)在云測(cè)數(shù)據(jù)的業(yè)務(wù)目標(biāo)是要充當(dāng)嬰兒的奶粉,運(yùn)動(dòng)員的優(yōu)質(zhì)蛋白,以幫助AI企業(yè)加速產(chǎn)業(yè)化進(jìn)程。
于是,云測(cè)數(shù)據(jù)開始在華東、華北、華南等地建設(shè)數(shù)據(jù)交付中心和數(shù)據(jù)采集基地,致力于為 AI 企業(yè)提供全流程一體化的高精、高質(zhì)數(shù)據(jù)服務(wù)解決方案,至今,已經(jīng)為國(guó)內(nèi)外數(shù)百家企業(yè)提供了AI數(shù)據(jù)服務(wù)。
需要值得一提的是,云測(cè)數(shù)據(jù)進(jìn)軍數(shù)據(jù)標(biāo)注領(lǐng)域并非一拍腦袋的決策,而是有幾大原因在背后推動(dòng)。
首先,數(shù)據(jù)標(biāo)注服務(wù)也是從屬于數(shù)據(jù)服務(wù)這一大市場(chǎng)之下,而云測(cè)數(shù)據(jù)具有這方面的資源稟賦優(yōu)勢(shì),或者說叫基因。過去九年間,作為市場(chǎng)上重要的獨(dú)立第三方的企業(yè)服務(wù)平臺(tái), Testin云測(cè)已經(jīng)在行業(yè)積累了廣泛的品牌影響力、技術(shù)實(shí)力及流程化管理能力,旗下AI數(shù)據(jù)服務(wù)品牌云測(cè)數(shù)據(jù)并不是裸身登場(chǎng),而是挾勢(shì)而來。
其次是這個(gè)市場(chǎng)足夠大。數(shù)據(jù)標(biāo)注服務(wù)既屬于數(shù)據(jù)服務(wù)市場(chǎng),又屬于人工智能市場(chǎng)。根據(jù)預(yù)估,明年中國(guó)人工智能核心產(chǎn)業(yè)規(guī)模將超過1500億元,帶動(dòng)相關(guān)產(chǎn)業(yè)規(guī)模超過1萬億元,如果放諸全世界則更大。
按照相關(guān)人士的估算,一個(gè)500萬的AI項(xiàng)目會(huì)有10%的資金用于數(shù)據(jù)的采集和標(biāo)記。由此可以推算出,到了2020年,數(shù)據(jù)標(biāo)注行業(yè)的市場(chǎng)規(guī)模將能夠達(dá)到150億。
最后,就是現(xiàn)有數(shù)據(jù)標(biāo)注行業(yè)的良莠不齊,為云測(cè)數(shù)據(jù)這樣的參與者提供了通過差異化競(jìng)爭(zhēng)勝出的機(jī)會(huì)。
前文已經(jīng)講到,隨著AI技術(shù)的發(fā)展,AI技術(shù)公司對(duì)數(shù)據(jù)的要求也越來越高。這種高要求體現(xiàn)在兩個(gè)方面,一是對(duì)數(shù)據(jù)質(zhì)量本身要求越來越高,這包括數(shù)據(jù)的精準(zhǔn)性、獨(dú)立性和安全性。因?yàn)樗惴ǖ木扰c數(shù)據(jù)的質(zhì)量有著直接關(guān)系,數(shù)據(jù)的數(shù)量和質(zhì)量會(huì)成為產(chǎn)品落地的瓶頸。
二是對(duì)數(shù)據(jù)的定制化和場(chǎng)景化要求也越來越高。中國(guó)現(xiàn)在有上千家AI公司,它們都是生存在不同的商業(yè)場(chǎng)景之下,且人工智能正在積極擁抱各行各業(yè),相對(duì)應(yīng)的算法模型就需要更多還原真實(shí)場(chǎng)景的數(shù)據(jù)需求,小數(shù)據(jù)的搜集和標(biāo)注已經(jīng)成為人工智能產(chǎn)業(yè)化落地的桎梏。
當(dāng)現(xiàn)有數(shù)據(jù)標(biāo)注服務(wù)的眾包模式以及通用數(shù)據(jù)集難以滿足所有數(shù)據(jù)的需求時(shí),云測(cè)數(shù)據(jù)在數(shù)據(jù)標(biāo)注領(lǐng)域的差異化競(jìng)爭(zhēng)機(jī)會(huì)就來了。
簡(jiǎn)而言之, “沒有好的數(shù)據(jù),AI就沒有未來”,云測(cè)數(shù)據(jù)在數(shù)據(jù)標(biāo)注領(lǐng)域的商業(yè)機(jī)會(huì),歸根到底還是因?yàn)锳I企業(yè)對(duì)“好的數(shù)據(jù)”需求越來越強(qiáng)烈,它們需要有一家提供“好數(shù)據(jù)”的龍頭企業(yè)出現(xiàn)。
高質(zhì)、精準(zhǔn)、安全:為數(shù)據(jù)正身
在對(duì)市場(chǎng)機(jī)會(huì)考慮清楚之后,Testin云測(cè)正式推出了其AI數(shù)據(jù)服務(wù)品牌——云測(cè)數(shù)據(jù)。
幾年時(shí)間,云測(cè)數(shù)據(jù)已經(jīng)成長(zhǎng)為市場(chǎng)頭部品牌,直到這次2019年底為Testin云測(cè)在EDGE Awards全球創(chuàng)新評(píng)選上拿下“2019年度科技企業(yè)”。
云測(cè)數(shù)據(jù)是怎么做到的?所謂大道至簡(jiǎn),其實(shí)說來并不復(fù)雜,核心就是針對(duì)人工智能產(chǎn)業(yè)落地呼喚“更好數(shù)據(jù)”的最新需求變化有的放矢,重建和升級(jí)了原有的數(shù)據(jù)標(biāo)注產(chǎn)業(yè)模式。
首先,通過在人員、軟硬件設(shè)施等方面的大投入提高了行業(yè)的進(jìn)入門檻。為了產(chǎn)出更高質(zhì)量的數(shù)據(jù),云測(cè)數(shù)據(jù)在華東、華北、華南等地都建設(shè)了數(shù)據(jù)交付中心和數(shù)據(jù)采集基地,并實(shí)現(xiàn)了一整套標(biāo)準(zhǔn)化作業(yè)流轉(zhuǎn)。在數(shù)據(jù)采集基地,其標(biāo)注和質(zhì)檢人員、項(xiàng)目經(jīng)理每天面對(duì)面溝通,確保每個(gè)人能夠理解,并掌握標(biāo)注有關(guān)技術(shù),技能和經(jīng)驗(yàn)?zāi)軌虻玫匠掷m(xù)的提升。
目前,云測(cè)數(shù)據(jù)已經(jīng)擁有近千人的數(shù)據(jù)標(biāo)注團(tuán)隊(duì),在規(guī)模以及質(zhì)量上都處在行業(yè)前列。正式上崗前,他們都要經(jīng)過行業(yè)知識(shí)、平臺(tái)工具使用、基地規(guī)范制度等內(nèi)容的團(tuán)隊(duì)培訓(xùn)流程。
其次,重建了數(shù)據(jù)標(biāo)注行業(yè)的安全生產(chǎn)流程,也就是要保證絕對(duì)的數(shù)據(jù)安全。這里數(shù)據(jù)安全的意思不單是指數(shù)據(jù)不被污染,更是指不被泄露,不侵犯用戶隱私。因?yàn)閷?duì)AI企業(yè)來說,數(shù)據(jù)就是其核心壁壘的一部分,AI企業(yè)將數(shù)據(jù)標(biāo)注服務(wù)交給誰,就意味著誰的高度信任。這就使得數(shù)據(jù)安全成為一種內(nèi)在競(jìng)爭(zhēng)優(yōu)勢(shì)。
誰更安全誰就更容易爭(zhēng)得客戶。云測(cè)數(shù)據(jù)基于此除了所有數(shù)據(jù)采集的用戶都簽訂數(shù)據(jù)授權(quán)協(xié)議,保證AI企業(yè)用于訓(xùn)練的數(shù)據(jù)合法合規(guī)之外,云測(cè)數(shù)據(jù)內(nèi)部還設(shè)定了數(shù)據(jù)隔離、質(zhì)量保障等一系列保護(hù)數(shù)據(jù)安全的流程,以在確保企業(yè)數(shù)據(jù)安全的情況下,持續(xù)為數(shù)據(jù)采集和數(shù)據(jù)標(biāo)注構(gòu)建和優(yōu)化自己的方案。
第三,主打場(chǎng)景定制化AI數(shù)據(jù)服務(wù),實(shí)現(xiàn)廣泛業(yè)務(wù)領(lǐng)域覆蓋。針對(duì)AI企業(yè)對(duì)場(chǎng)景化數(shù)據(jù)的巨大需求,從創(chuàng)立開始,云測(cè)數(shù)據(jù)就把為客戶提供定制化場(chǎng)景數(shù)據(jù)采集和標(biāo)注服務(wù)作為業(yè)務(wù)重點(diǎn),到今天為止,云測(cè)數(shù)據(jù)已經(jīng)覆蓋了智能駕駛、智慧城市、智能家居、智慧金融、零售等幾乎所有AI市場(chǎng)的重要領(lǐng)域。通過場(chǎng)景實(shí)驗(yàn)室的建立,實(shí)現(xiàn)場(chǎng)景定制化AI數(shù)據(jù)服務(wù)以幫助企業(yè)完善產(chǎn)品發(fā)布之前需要的訓(xùn)練數(shù)據(jù)。
就像Testin云測(cè)CMO張鵬飛強(qiáng)調(diào)的那樣“從整體看來,AI數(shù)據(jù)行業(yè)關(guān)于安全、隱私等方面并沒有統(tǒng)一的標(biāo)準(zhǔn)和強(qiáng)調(diào)重視。但從我們長(zhǎng)遠(yuǎn)角度出發(fā),一直在隱私和安全防護(hù)角度下大力氣服務(wù)行業(yè)、樹立數(shù)據(jù)質(zhì)量標(biāo)桿,只有以這種負(fù)責(zé)的態(tài)度來服務(wù)客戶,我們的行業(yè)才能‘良幣驅(qū)除劣幣’,真正讓人工智能成為新一輪技術(shù)革命,改變整個(gè)社會(huì)和人類進(jìn)程”。
不可阻擋的大勢(shì)所趨
事實(shí)上,所有的這一切,只為了一個(gè)目的:向AI企業(yè)提供更高質(zhì)、更精準(zhǔn)、更安全的數(shù)據(jù)。
對(duì)于習(xí)慣成長(zhǎng)于數(shù)據(jù)采集粗放式經(jīng)營(yíng)時(shí)期的企業(yè)來說,云測(cè)數(shù)據(jù)就像一個(gè)特立獨(dú)行者,因?yàn)樗某霈F(xiàn)推高了行業(yè)整體質(zhì)量水平線,壓縮了水平線之下企業(yè)的生存空間。
但這卻是不可阻擋的大勢(shì)所趨,這樣的行業(yè)顛覆,不是云測(cè)數(shù)據(jù)來做,也必定會(huì)有其他企業(yè)來做,因?yàn)榭蛻粜枨缶蛿[在那里。
回顧數(shù)據(jù)服務(wù)行業(yè)的發(fā)展歷程,會(huì)發(fā)現(xiàn)實(shí)際上經(jīng)過了三個(gè)階段,最初是實(shí)驗(yàn)室階段或步行階段,這一階段AI企業(yè)對(duì)數(shù)據(jù)的要求還比較初級(jí),甚至很多數(shù)據(jù)幾乎連標(biāo)注都不用就可以被拿來用;第二個(gè)階段是所謂勞動(dòng)密集型階段或馬車階段,眾包成為主要模式;今天則已經(jīng)進(jìn)入第三個(gè)階段,也就是數(shù)據(jù)服務(wù)的場(chǎng)景化和精細(xì)化時(shí)代,人工智能從馬車速度前行,到起飛前夜,從吃飼料到要喝航空汽油,這就使得云測(cè)數(shù)據(jù)這樣的高端數(shù)據(jù)供應(yīng)商成為市場(chǎng)剛需。
沒有好的數(shù)據(jù),AI就沒有未來,已經(jīng)成為行業(yè)共識(shí)。人工智能行業(yè)與數(shù)據(jù)標(biāo)注行業(yè)實(shí)際上是一個(gè)水漲船高的關(guān)系,人工智能行業(yè)越發(fā)達(dá),數(shù)據(jù)標(biāo)注行業(yè)的商業(yè)機(jī)會(huì)越大,這個(gè)道理是如此明顯,未來AI數(shù)據(jù)行業(yè)不可估量。
但這對(duì)云測(cè)數(shù)據(jù)來說也并不是壞事,因?yàn)檫@個(gè)市場(chǎng)太大了,云測(cè)數(shù)據(jù)可以成為頭部玩家,更重要的是,因?yàn)閿?shù)據(jù)這一關(guān)鍵詞,使得數(shù)據(jù)標(biāo)注行業(yè)不只面對(duì)市場(chǎng)和商業(yè)化,同時(shí)意味著社會(huì)價(jià)值,還承擔(dān)著社會(huì)責(zé)任,只有更多企業(yè)一起用力,才能更快的凈化行業(yè)亂象,建立起行業(yè)規(guī)范,整個(gè)行業(yè)才能做大做強(qiáng)。
- 蜜度索驥:以跨模態(tài)檢索技術(shù)助力“企宣”向上生長(zhǎng)
- 為什么年輕人不愛換手機(jī)了
- 柔宇科技未履行金額近億元被曝已6個(gè)月發(fā)不出工資
- 柔宇科技被曝已6個(gè)月發(fā)不出工資 公司回應(yīng)欠薪有補(bǔ)償方案
- 第六座“綠動(dòng)未來”環(huán)保公益圖書館落地貴州山區(qū)小學(xué)
- 窺見“新紀(jì)元”,2021元宇宙產(chǎn)業(yè)發(fā)展高峰論壇“廣州啟幕”
- 以人為本,景悅科技解讀智慧城市發(fā)展新理念
- 紐迪瑞科技/NDT賦能黑鯊4 Pro游戲手機(jī)打造全新一代屏幕壓感
- 清潔家電新老玩家市場(chǎng)定位清晰,攜手共進(jìn),核心技術(shù)決定未來
- 新思科技與芯耀輝在IP產(chǎn)品領(lǐng)域達(dá)成戰(zhàn)略合作伙伴關(guān)系
- 芯耀輝加速全球化部署,任命原Intel高管出任全球總裁
免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。