沒(méi)有“好的”數(shù)據(jù),AI就沒(méi)有未來(lái)?聽(tīng)聽(tīng)云測(cè)數(shù)據(jù)怎么說(shuō)

沒(méi)有“好的”數(shù)據(jù),AI就沒(méi)有未來(lái)?聽(tīng)聽(tīng)云測(cè)數(shù)據(jù)怎么說(shuō)

算力、模型和數(shù)據(jù)構(gòu)成了人工智能的三要素,過(guò)去,我們過(guò)多的把目光聚焦于算力和模型上,殊不知,隨著人工智能的深入,好的算法和模型已不再是稀有物種,反而那些被標(biāo)注好的優(yōu)質(zhì)數(shù)據(jù)成為時(shí)下最為稀缺的“黑金”。

“公司的壁壘不再是算法,而是數(shù)據(jù)。讓算法利用足夠的數(shù)據(jù),使得產(chǎn)品運(yùn)行起來(lái)。”人工智能和機(jī)器學(xué)習(xí)領(lǐng)域國(guó)際的權(quán)威學(xué)者吳恩達(dá)在發(fā)表以“AI is the new electricity”為主題的演講時(shí),就重點(diǎn)強(qiáng)調(diào)了數(shù)據(jù)的重要性。無(wú)獨(dú)有偶,李開(kāi)復(fù)在清華大學(xué)“清華學(xué)堂計(jì)算機(jī)科學(xué)實(shí)驗(yàn)班”題為《人工智能的黃金時(shí)代》的演講中也講到了此類觀點(diǎn),“如果你有壟斷性的大數(shù)據(jù),你就會(huì)有很大的優(yōu)勢(shì)。”

以上種種,都表明著一件事,即AI的崛起離不開(kāi)“好的”數(shù)據(jù)作為地基,這也是云測(cè)數(shù)據(jù)成立的初衷所在。

溯源云測(cè)數(shù)據(jù)的AI數(shù)據(jù)服務(wù)之路

“自2011年切入企服市場(chǎng)以來(lái),Testin云測(cè)不斷致力于助力產(chǎn)業(yè)智能化,除了測(cè)試業(yè)務(wù)我們已經(jīng)成為專業(yè)領(lǐng)域的壟斷品牌,專注于AI數(shù)據(jù)服務(wù)的云測(cè)數(shù)據(jù)也成為數(shù)據(jù)領(lǐng)域的標(biāo)桿品牌。目前我們整個(gè)數(shù)據(jù)服務(wù)團(tuán)隊(duì)規(guī)模已超過(guò)1000人,通過(guò)標(biāo)審分離的流程化作業(yè)模式和數(shù)據(jù)安全機(jī)制,更好的保證數(shù)據(jù)的高質(zhì)量產(chǎn)出和數(shù)據(jù)隱私性,從而更好地為人工智能落地提供定制化‘數(shù)據(jù)養(yǎng)料’。”在接受鈦媒體專訪時(shí),云測(cè)數(shù)據(jù)總經(jīng)理賈宇航如是說(shuō)。

AI數(shù)據(jù)服務(wù)作為一個(gè)非標(biāo)領(lǐng)域,往往需要根據(jù)不同行業(yè)領(lǐng)域、不同的需求進(jìn)行特定化的場(chǎng)景定制,而數(shù)據(jù)標(biāo)注的過(guò)程,規(guī)范化、標(biāo)準(zhǔn)化以及可機(jī)讀性又不可或缺,這就意味著云測(cè)數(shù)據(jù)所從事的領(lǐng)域,并沒(méi)有捷徑可以走。

早期的數(shù)據(jù)標(biāo)注服務(wù)門(mén)檻并不高,幾個(gè)人、幾臺(tái)電腦便可展開(kāi)操作,導(dǎo)致了行業(yè)魚(yú)龍混雜、同質(zhì)化競(jìng)爭(zhēng)等現(xiàn)象,而這時(shí)的人工智能也處在初期發(fā)展階段。但當(dāng)人工智能駛?cè)肷钏畢^(qū),“應(yīng)用人智能”聲勢(shì)逐漸火熱,相對(duì)應(yīng)的算法對(duì)數(shù)據(jù)的精準(zhǔn)程度和質(zhì)量要求也水漲船高,就要求著作為AI數(shù)據(jù)服務(wù)的提供者,要為人工智能提供定制化的、還原應(yīng)用場(chǎng)景的優(yōu)質(zhì)數(shù)據(jù)。

針對(duì)于此,賈宇航告訴鈦媒體,“以人臉關(guān)鍵點(diǎn)識(shí)別為例,早先的相關(guān)數(shù)據(jù)標(biāo)注往往用一句話便可描述完它的任務(wù)需求,到了現(xiàn)在,已經(jīng)發(fā)展到幾百個(gè)關(guān)鍵點(diǎn)。通常數(shù)量級(jí)的人臉數(shù)據(jù)標(biāo)注任務(wù),有時(shí)候4張A4紙都未必能寫(xiě)完這些需求,而人臉的數(shù)據(jù)標(biāo)注只是眾多領(lǐng)域的任務(wù)需求之一。”

龐大數(shù)據(jù)標(biāo)注任務(wù)量級(jí)之下,是當(dāng)下業(yè)內(nèi)需求端對(duì)精準(zhǔn)和高質(zhì)數(shù)據(jù)的普遍共識(shí)。

這就要求著數(shù)據(jù)服務(wù)要在數(shù)據(jù)標(biāo)注和采集上下足功夫,而小團(tuán)隊(duì)的能力范圍則顯得捉襟見(jiàn)肘?;貧w到數(shù)據(jù)標(biāo)注面向多領(lǐng)域這件事的本質(zhì)時(shí),你又會(huì)發(fā)現(xiàn),光靠人多或者說(shuō)采用“眾包”模式往往只能解決量的需求,數(shù)據(jù)標(biāo)注人員是否能統(tǒng)一化協(xié)同管理以及是否具備相關(guān)領(lǐng)域知識(shí),才是決定某項(xiàng)數(shù)據(jù)任務(wù)完成質(zhì)量的好壞。

同時(shí),這也是云測(cè)數(shù)據(jù)當(dāng)下正專注的事情。正如醫(yī)生可以標(biāo)注得好ct診療片,而云測(cè)數(shù)據(jù)團(tuán)隊(duì)在進(jìn)行自動(dòng)駕駛車(chē)外環(huán)境數(shù)據(jù)標(biāo)注時(shí)發(fā)現(xiàn),那些能夠快速、精準(zhǔn)進(jìn)行數(shù)據(jù)標(biāo)注的人員往往擁有駕駛經(jīng)驗(yàn)。

云測(cè)數(shù)據(jù)快速成長(zhǎng)的秘訣是什么?

至此,我們還需要思考一個(gè)問(wèn)題,為什么云測(cè)數(shù)據(jù)能做到且做好AI數(shù)據(jù)服務(wù)?

通過(guò)觀察Testin云測(cè)的發(fā)展歷史,我們便能找到答案。

自2011年Testin云測(cè)成立到現(xiàn)在,已經(jīng)為全球超過(guò)百萬(wàn)的企業(yè)及開(kāi)發(fā)者提供服務(wù),積累了豐富且完善的技術(shù)能力和流程化管理能力。而云測(cè)數(shù)據(jù)AI數(shù)據(jù)服務(wù)正式開(kāi)展于2017年,換句換說(shuō),Testin云測(cè)的數(shù)據(jù)業(yè)務(wù)線從一出生便擁有7年企業(yè)服務(wù)所積攢的經(jīng)驗(yàn),并繼承了行業(yè)獨(dú)立第三方的角色,天然的“以客戶為中心”的企服基因是云測(cè)數(shù)據(jù)區(qū)別于同行的最大護(hù)城河,而客戶最為關(guān)鍵的訴求則是“降本增效”。

“與企業(yè)服務(wù)在美國(guó)環(huán)境更側(cè)重標(biāo)準(zhǔn)不同的是,中國(guó)更重服務(wù),通過(guò)這么多年的觀察我們發(fā)現(xiàn),是否能切實(shí)滿足用戶的真實(shí)需求,其實(shí)是一個(gè)非常重要的點(diǎn),并不是說(shuō)企業(yè)一定要做出一個(gè)平臺(tái)或者一個(gè)工具,更多是從企業(yè)或行業(yè)需求出發(fā),構(gòu)建對(duì)應(yīng)的服務(wù)模式。”賈宇航對(duì)鈦媒體補(bǔ)充到。

以新零售門(mén)店巡檢為例,通常來(lái)說(shuō),每個(gè)門(mén)店每月都要巡檢一次,門(mén)店巡檢模式是讓一個(gè)人拿著調(diào)研表去盤(pán)點(diǎn),隨著人工成本的增加,而門(mén)店數(shù)越來(lái)越多現(xiàn)實(shí)情況,已經(jīng)讓這成為一筆不小的開(kāi)銷(xiāo)。通過(guò)引入AI數(shù)據(jù)服務(wù),現(xiàn)在工作人員可以拿一個(gè)手機(jī)APP直接巡檢,物品的數(shù)量、sku的數(shù)量以及對(duì)應(yīng)的sq數(shù)量,都能一目了然。

“從不同客戶反饋得知,通過(guò)我們?cè)茰y(cè)數(shù)據(jù)的數(shù)據(jù)標(biāo)注服務(wù)而落地AI產(chǎn)品的企業(yè),可為企業(yè)減少大概1/3的人工成本。”賈宇航如是說(shuō)。

門(mén)店巡檢只是案例之一,就目前來(lái)說(shuō),云測(cè)數(shù)據(jù)主要關(guān)注智能駕駛、智慧城市、智慧金融和智能家居幾大方向,這也是當(dāng)下市場(chǎng)需求最大的幾個(gè)領(lǐng)域。面對(duì)不同的數(shù)據(jù)領(lǐng)域,云測(cè)數(shù)據(jù)通過(guò)流水化作業(yè),將各個(gè)環(huán)節(jié)打造成不同模塊,并配合自己的流程管理工具,優(yōu)化人員管理、數(shù)據(jù)采集、數(shù)據(jù)清洗和數(shù)據(jù)標(biāo)注的各個(gè)環(huán)節(jié)流程,確保內(nèi)部的持續(xù)高效能運(yùn)轉(zhuǎn),最終保證AI數(shù)據(jù)高質(zhì)產(chǎn)出。

根據(jù)IDC調(diào)查顯示,目前中國(guó)大數(shù)據(jù)發(fā)展處于應(yīng)用落地階段,整個(gè)市場(chǎng)預(yù)計(jì)未來(lái)五年將保持持續(xù)增長(zhǎng)的趨勢(shì),年復(fù)合增長(zhǎng)率將達(dá)到17.3%。而得益于人工智能、5G、區(qū)塊鏈、邊緣計(jì)算的發(fā)展,未來(lái)多方技術(shù)融合,數(shù)據(jù)增長(zhǎng)必然呈現(xiàn)井噴態(tài)勢(shì),數(shù)據(jù)采集和標(biāo)準(zhǔn)業(yè)務(wù)作為其伴生體,必然有較大的增長(zhǎng)空間。

得益于對(duì)AI趨勢(shì)的判斷,Testin云測(cè)認(rèn)為,“人工智能正在逐漸往應(yīng)用人工智能”方向發(fā)展,因而云測(cè)數(shù)據(jù)在成立之初,就確定了定制化“精準(zhǔn)高質(zhì)、獨(dú)立安全”業(yè)務(wù)方針。本著這張“王牌”,云測(cè)數(shù)據(jù)部門(mén)迅速擴(kuò)充,在以往企業(yè)服務(wù)經(jīng)驗(yàn)的完美嫁接之下,最終讓云測(cè)數(shù)據(jù)成為AI數(shù)據(jù)服務(wù)領(lǐng)域的頭部企業(yè)。”

“云測(cè)數(shù)據(jù)業(yè)務(wù)規(guī)模量每年都在以倍數(shù)的規(guī)模增長(zhǎng),這也與我們所處賽道的市場(chǎng)深度息息相關(guān),在我看來(lái),整個(gè)市場(chǎng)仍然呈現(xiàn)非線性的幾何增長(zhǎng)態(tài)勢(shì),還有很多機(jī)會(huì)蘊(yùn)含其中,有待挖掘。”談及云測(cè)數(shù)據(jù)業(yè)務(wù)線發(fā)展?fàn)顟B(tài)時(shí),賈宇航如是說(shuō)。

“安全”是AI數(shù)據(jù)服務(wù)提供商繞不開(kāi)的命題

機(jī)會(huì)之下,企業(yè)端在提供優(yōu)質(zhì)數(shù)據(jù)的同時(shí),也要注意數(shù)據(jù)服務(wù)過(guò)程中的規(guī)范和安全。

在這方面,云測(cè)數(shù)據(jù)通過(guò)自建數(shù)據(jù)采集實(shí)驗(yàn)室和自建數(shù)據(jù)標(biāo)注基地的方式,規(guī)范管理專職數(shù)據(jù)服務(wù)團(tuán)隊(duì)。這種措施除了保證標(biāo)注數(shù)據(jù)的質(zhì)量和效率,也最大限度地保證了數(shù)據(jù)產(chǎn)出的安全隱私性。

賈宇航對(duì)鈦媒體強(qiáng)調(diào)到,云測(cè)數(shù)據(jù)自伊始便將數(shù)據(jù)安全放在首位,集中表現(xiàn)在以下幾個(gè)方面:

第一,不濫用數(shù)據(jù),數(shù)據(jù)交付后清毀數(shù)據(jù)不留底,絕不二次使用;第二,不侵犯隱私,與所有數(shù)據(jù)采集的用戶都簽訂數(shù)據(jù)授權(quán)協(xié)議,確保AI企業(yè)用于訓(xùn)練的數(shù)據(jù)合法合規(guī);第三,建立相關(guān)的數(shù)據(jù)保障機(jī)制,如從防火墻的設(shè)置、內(nèi)部信息系統(tǒng)的管護(hù)、乃至標(biāo)準(zhǔn)化的流程作業(yè)體系等。

正如Testin云測(cè)CMO張鵬飛多次強(qiáng)調(diào):“即便說(shuō)云測(cè)數(shù)據(jù)從安全到隱私防護(hù)這套體系會(huì)加重運(yùn)營(yíng)成本,但從我們行業(yè)大局發(fā)展來(lái)看,只有以這種負(fù)責(zé)的態(tài)度來(lái)執(zhí)行工作,我們的行業(yè)才能‘良幣驅(qū)除劣幣’。”

極客網(wǎng)企業(yè)會(huì)員

免責(zé)聲明:本網(wǎng)站內(nèi)容主要來(lái)自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁(yè)或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書(shū)面權(quán)利通知或不實(shí)情況說(shuō)明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開(kāi)相關(guān)鏈接。

2019-12-13
沒(méi)有“好的”數(shù)據(jù),AI就沒(méi)有未來(lái)?聽(tīng)聽(tīng)云測(cè)數(shù)據(jù)怎么說(shuō)
算力、模型和數(shù)據(jù)構(gòu)成了人工智能的三要素,過(guò)去,我們過(guò)多的把目光聚焦于算力和模型上,殊不知,隨著人工智能的深入,好的算法和模型已不再是稀有物種,反而那些被標(biāo)注好的

長(zhǎng)按掃碼 閱讀全文