當(dāng)AI數(shù)據(jù)服務(wù)走進(jìn)中場戰(zhàn)事

毫無疑問,數(shù)據(jù)量的飆升是AI產(chǎn)業(yè)爆發(fā)的原因之一。很快我們可以發(fā)現(xiàn),將數(shù)據(jù)采集、整理、清洗、標(biāo)注再輸送給AI企業(yè)用作模型訓(xùn)練,已經(jīng)成為了一條運(yùn)行流暢的產(chǎn)業(yè)鏈。

很長一段時(shí)間以來,數(shù)據(jù)服務(wù)都處于一種粗放原始的狀態(tài)之中,甚至出現(xiàn)了一種“數(shù)據(jù)農(nóng)場”的說法:數(shù)據(jù)服務(wù)從業(yè)者們從各種公開數(shù)據(jù)集或移動(dòng)互聯(lián)網(wǎng)產(chǎn)品中獲取數(shù)據(jù),以幾乎零門檻的形式聘請(qǐng)大量廉價(jià)勞動(dòng)力進(jìn)行簡單的清洗標(biāo)注工作,例如勾選出一張照片中哪里是天空哪里是大地。最后再將這些粗糙處理過的數(shù)據(jù)一股腦地投入神經(jīng)網(wǎng)絡(luò)的黑箱之中。

但現(xiàn)如今,我們已經(jīng)看到這一現(xiàn)狀正在發(fā)生變化,AI企業(yè)對(duì)于數(shù)據(jù)的應(yīng)用需求逐漸開始分化,以往一味粗放的處理模式已經(jīng)不能滿足他們的需求,也因此攪動(dòng)了AI數(shù)據(jù)服務(wù)市場,潮水從奔騰到平靜,讓泥沙沉淀,清流上涌。云測旗下的AI數(shù)據(jù)服務(wù)品牌“云測數(shù)據(jù)”的出現(xiàn),就是一個(gè)典型案例。

這一次,我們采訪了云測數(shù)據(jù)的總經(jīng)理賈宇航,聽他來談?wù)?,他眼中的?shù)據(jù)服務(wù)中場戰(zhàn)事。

風(fēng)起云涌的數(shù)據(jù)服務(wù)戰(zhàn)場

如果說數(shù)據(jù)是AI的養(yǎng)料,那么養(yǎng)料的營養(yǎng)含量,自然也決定了AI的強(qiáng)壯程度。算法模型的精準(zhǔn)與否、對(duì)不同環(huán)境的適應(yīng)性究竟如何等等能力,幾乎都來自于原始數(shù)據(jù)的累積。

最先發(fā)生變化的,是AI產(chǎn)業(yè)。清華大學(xué)發(fā)布的《2018年中國人工智能發(fā)展報(bào)告》顯示,去年中國人工智能產(chǎn)業(yè)市場規(guī)模達(dá)到237億元,同比增長67%。據(jù)預(yù)計(jì)2019年一年中,中國人工智能行業(yè)的增長率高達(dá)75%。

產(chǎn)業(yè)規(guī)模的爆發(fā)式增長,意味著競爭將進(jìn)一步嚴(yán)峻。面對(duì)這種競爭,AI企業(yè)對(duì)于數(shù)據(jù)的需求必然發(fā)生變化。

比如,企業(yè)正在渴望更精細(xì)和定制化的數(shù)據(jù)。

現(xiàn)實(shí)場景的環(huán)境永遠(yuǎn)比實(shí)驗(yàn)室中的構(gòu)想更加復(fù)雜,想要提供更落地、更具差異化優(yōu)勢的模型,僅僅依靠基于移動(dòng)互聯(lián)網(wǎng)數(shù)據(jù),或者基于眾包用戶數(shù)據(jù)采集的數(shù)據(jù)顯然是不足夠的。只有通過定制化數(shù)據(jù)采集不斷打入細(xì)節(jié)、打入人無我有的場景,才能不斷提升技術(shù)價(jià)值,在洪流中立足。

又比如,企業(yè)正在渴望獲取更加專業(yè)和垂直的數(shù)據(jù)。

隨著AI技術(shù)深入到各個(gè)細(xì)分領(lǐng)域,很多數(shù)據(jù)標(biāo)注工作要交由專業(yè)人士去做。像是對(duì)于醫(yī)療影像數(shù)據(jù)的標(biāo)注,又比如在工業(yè)生產(chǎn)線上對(duì)于各種材料的認(rèn)識(shí)。這些都不再像以往那樣,召集一群普通人就能完成,相反需要的是行業(yè)內(nèi)專業(yè)工作人員進(jìn)行相關(guān)處理。如何滿足這些要求,是數(shù)據(jù)服務(wù)企業(yè)和AI企業(yè)都在思考的問題。

以及企業(yè)日益提高的數(shù)據(jù)安全要求。

除了提出數(shù)據(jù)隱私等常規(guī)數(shù)據(jù)安全要求以外,有些企業(yè)為了突破已有模型的局限,開始配套研制自己的硬件,走向多模態(tài)融合的方式;或是像上文所說的,專門采集一些定制化的專業(yè)數(shù)據(jù)。這時(shí)這些數(shù)據(jù)就會(huì)成為企業(yè)構(gòu)建自身核心壁壘的發(fā)展方向。如此以來,數(shù)據(jù)安全問題就成了重中之重。

另一方面,對(duì)于AI數(shù)據(jù)服務(wù)企業(yè)來說也是如此。

AI數(shù)據(jù)服務(wù)企業(yè)意識(shí)到,越來越多的AI企業(yè)對(duì)數(shù)據(jù)準(zhǔn)確性、安全性和標(biāo)注效率提出了更多要求,并且AI企業(yè)開始傾向于與大公司合作,對(duì)數(shù)據(jù)服務(wù)企業(yè)進(jìn)行盡職調(diào)查、設(shè)立供應(yīng)商列表等等。這一切都意味著,數(shù)據(jù)服務(wù)企業(yè)必須加強(qiáng)技術(shù)能力、促進(jìn)管理正規(guī)化才能應(yīng)對(duì)全新的需求。

中場戰(zhàn)事的號(hào)角已經(jīng)吹響,這場戰(zhàn)爭決定著AI數(shù)據(jù)服務(wù)企業(yè)的生死存亡,也是它們力爭上游的重要機(jī)會(huì)。

云測數(shù)據(jù)的應(yīng)戰(zhàn)邏輯

云測數(shù)據(jù)正是在中場戰(zhàn)事中漸入佳境的數(shù)據(jù)企業(yè)代表。

移動(dòng)互聯(lián)網(wǎng)時(shí)代開始,云測從手機(jī)APP測試作為切入點(diǎn)進(jìn)入企業(yè)服務(wù)領(lǐng)域,為移動(dòng)互聯(lián)應(yīng)用在現(xiàn)實(shí)場景中的使用保駕護(hù)航;人工智能時(shí)代,云測旗下AI數(shù)據(jù)服務(wù)品牌-“云測數(shù)據(jù)”,正在幫助各大企業(yè)獲取貼近真實(shí)場景的精確數(shù)據(jù),助力AI在現(xiàn)實(shí)場景中的場景化落地。

對(duì)于AI企業(yè)來說,自建數(shù)據(jù)處理團(tuán)隊(duì)雖能滿足需求,但資金成本和技術(shù)門檻都相對(duì)較高。而數(shù)據(jù)行業(yè)中常見的眾包模式,例如亞馬遜眾包平臺(tái)“Amazon Mechanical Turk”,它可以在平臺(tái)上完成海量的數(shù)據(jù),但面對(duì)定制化場景的數(shù)據(jù),卻是有心無力。

而云測數(shù)據(jù),正是瞄準(zhǔn)了定制化數(shù)據(jù)市場,打磨了一套屬于自己的應(yīng)戰(zhàn)邏輯:

第一, 通過產(chǎn)業(yè)鏈延伸滿足企業(yè)豐富的業(yè)務(wù)需求。

云測數(shù)據(jù)發(fā)現(xiàn),當(dāng)AI企業(yè)對(duì)于算法落地性要求越來越高時(shí),就更需要貼近真實(shí)場景的數(shù)據(jù)來滿足需求。賈宇航提到,對(duì)于現(xiàn)階段的安防或者金融所需要的人臉識(shí)別安全等級(jí),互聯(lián)網(wǎng)中積累的數(shù)據(jù)和眾包采集的數(shù)據(jù)不足以支撐其需求,多維且精細(xì)化的數(shù)據(jù),如各種光照條件下各個(gè)角度的人臉數(shù)據(jù),才是其良藥。面對(duì)這類情況,就需要數(shù)據(jù)企業(yè)延伸產(chǎn)業(yè)鏈,承擔(dān)起定制化數(shù)據(jù)采集工作。除了安防領(lǐng)域和金融領(lǐng)域,云測數(shù)據(jù)還會(huì)涉及諸如輔助駕駛場景中的駕駛員表情、新零售場景中的人物服裝穿搭、智慧生活中的音箱喚醒詞、智能工業(yè)中的質(zhì)檢巡檢等等場景,覆蓋了現(xiàn)階段絕大部分的落地場景。

第二, 注重人員培養(yǎng),提升標(biāo)注精準(zhǔn)程度。

意識(shí)到定制化數(shù)據(jù)對(duì)于AI企業(yè)的重要性后,云測數(shù)據(jù)開始注重對(duì)于從業(yè)人員素質(zhì)的培養(yǎng)和提高,不僅自建數(shù)據(jù)基地,對(duì)標(biāo)注員進(jìn)行標(biāo)注技巧的教學(xué)培訓(xùn),也在各個(gè)涉足行業(yè)進(jìn)行專業(yè)知識(shí)積累,以確保標(biāo)注人員對(duì)所從事標(biāo)注任務(wù)的理解。如涉及交規(guī)和行車經(jīng)驗(yàn)的自動(dòng)駕駛數(shù)據(jù)標(biāo)注,云測數(shù)據(jù)就找來了由駕齡豐富的標(biāo)注管理人員進(jìn)行對(duì)員工提供定期講解,而其他行業(yè),也逐漸開始需要“老司機(jī)“的介入,去提升數(shù)據(jù)精度。

第三, 死守安全底線。

最后最重要的,還有安全。首先云測數(shù)據(jù)的核心價(jià)值觀是讓企業(yè)擁有數(shù)據(jù),構(gòu)建企業(yè)的核心競爭壁壘,為此數(shù)據(jù)的安全性是一項(xiàng)核心指標(biāo)。為了保證人們的數(shù)據(jù)隱私安全,云測數(shù)據(jù)不僅在硬件和操作系統(tǒng)上采取了加密措施,封死USB接口、采用內(nèi)網(wǎng)瀏覽器端操作標(biāo)注數(shù)據(jù)、保證所有參與工作的員工只能操作數(shù)據(jù),不能獲取數(shù)據(jù),且每次標(biāo)注任務(wù)交付數(shù)據(jù)結(jié)果后,都會(huì)銷毀數(shù)據(jù)。不僅保護(hù)數(shù)據(jù)隱私,也保證了AI企業(yè)的利益。

中場戰(zhàn)事改變了什么:AI數(shù)據(jù)服務(wù)產(chǎn)業(yè)的下一幕

賈宇航告訴我們,云測數(shù)據(jù)的發(fā)展目標(biāo),就是在更多細(xì)分領(lǐng)域中,做到領(lǐng)域知識(shí)積累更深厚,數(shù)據(jù)更精準(zhǔn),數(shù)據(jù)更安全。擁有了這三項(xiàng)應(yīng)戰(zhàn)能力,云測數(shù)據(jù)就可以在數(shù)據(jù)服務(wù)賽道中精準(zhǔn)的抓住變革中的機(jī)會(huì)。解決AI企業(yè)想要依靠獨(dú)有專業(yè)數(shù)據(jù)提升技術(shù)能力,又無力建立數(shù)據(jù)團(tuán)隊(duì)的問題。

我們同樣關(guān)心的,是中場戰(zhàn)事之后,數(shù)據(jù)服務(wù)產(chǎn)業(yè)會(huì)出現(xiàn)怎樣的走向?

在接受采訪時(shí),賈宇航向我們提到了一個(gè)有趣的事實(shí):目前他們服務(wù)的甲方,除了一些科技巨頭以外,還有不少傳統(tǒng)企業(yè)。

這一事實(shí)側(cè)面反映出,參與AI的企業(yè)越來越多,類型也越來越豐富。其中會(huì)有對(duì)技術(shù)一無所知的小型傳統(tǒng)企業(yè),會(huì)有扎根于農(nóng)業(yè)、化工等等某一極其細(xì)分行業(yè)的企業(yè),同時(shí)也會(huì)有依賴豐富的數(shù)據(jù)累積對(duì)AI技術(shù)精益求精的科技巨頭。他們對(duì)于數(shù)據(jù)類型的需求也會(huì)越來越細(xì)化、專業(yè)和垂直。在這種趨勢之下,數(shù)據(jù)與算法之間的產(chǎn)業(yè)分工會(huì)逐漸走向明晰?;蛟S數(shù)據(jù)企業(yè)需要“把手伸得更長”,才能更好的為他們提供服務(wù)。

相信在中場戰(zhàn)事這一轉(zhuǎn)折點(diǎn)之后,數(shù)據(jù)服務(wù)行業(yè)會(huì)從單純的拼勞動(dòng)力,演變成拼技術(shù)、拼專業(yè)、拼垂直。

對(duì)于數(shù)據(jù)服務(wù)產(chǎn)業(yè)來說,這也是一個(gè)不斷洗牌的過程。產(chǎn)業(yè)發(fā)展行程過半,真正的競爭才剛剛來臨。數(shù)據(jù)服務(wù)產(chǎn)業(yè)作為AI的“源頭”,在歷經(jīng)優(yōu)勝劣汰之后,也給予AI發(fā)展更強(qiáng)大的動(dòng)力。

免責(zé)聲明:此文內(nèi)容為第三方自媒體作者發(fā)布的觀察或評(píng)論性文章,所有文字和圖片版權(quán)歸作者所有,且僅代表作者個(gè)人觀點(diǎn),與極客網(wǎng)無關(guān)。文章僅供讀者參考,并請(qǐng)自行核實(shí)相關(guān)內(nèi)容。投訴郵箱:editor@fromgeek.com。

免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。

2019-08-21
當(dāng)AI數(shù)據(jù)服務(wù)走進(jìn)中場戰(zhàn)事
很長一段時(shí)間以來,數(shù)據(jù)服務(wù)都處于一種粗放原始的狀態(tài)之中,甚至出現(xiàn)了一種“數(shù)據(jù)農(nóng)場”的說法:數(shù)據(jù)服務(wù)從業(yè)者們從各種公開數(shù)據(jù)集或移動(dòng)互聯(lián)網(wǎng)產(chǎn)品中獲取數(shù)據(jù),以幾乎零門檻的形式聘請(qǐng)大量廉價(jià)勞動(dòng)力進(jìn)行簡單的清洗

長按掃碼 閱讀全文