AI被認為是最有可能的新工業(yè)革命引爆點,各國都在此方向積極投入?yún)⑴c競爭,中國當前的競爭位置還很不錯,當在兩強之一。AI發(fā)展需有三個要件,即算力、算法和數(shù)據(jù),這其中算力屬于基礎(chǔ)設(shè)施能力,算法可算是基于基礎(chǔ)設(shè)施之上運作的工作方法,而數(shù)據(jù)則相當于用來指導(dǎo)算法運作的依據(jù)。從一個可以完整運作的AI應(yīng)用來看,沒有算力則算法和數(shù)據(jù)跑不起來,沒有算法則數(shù)據(jù)沒有執(zhí)行通道,沒有數(shù)據(jù)則算力和算法就成了擺設(shè),而目前人工智能發(fā)展的階段恰逢算力和算法充足,AI數(shù)據(jù)十分缺乏,毫不夸張的說如果沒有高質(zhì)量的數(shù)據(jù),人工智能將沒有未來。
有數(shù)據(jù)人工智能才能跑起來,但數(shù)據(jù)的質(zhì)量高低,對AI是否好用起到?jīng)Q定性作用。當前AI發(fā)展對于數(shù)據(jù)的需求非常大,但對于AI來說數(shù)據(jù)量并非等于數(shù)據(jù)質(zhì)量,只有高質(zhì)量的數(shù)據(jù)才能對算法起到?jīng)Q定性作用,進而產(chǎn)生生產(chǎn)力,而質(zhì)量一般的海量數(shù)據(jù)對AI不但無利反而有害。大數(shù)據(jù)行業(yè)之前有對大數(shù)據(jù)去噪的作業(yè)流程,而到了AI時代,隨著AI公司對高質(zhì)量數(shù)據(jù)的需求不斷加大,數(shù)據(jù)標注開始形成一個行業(yè),在AI發(fā)展中擔當越來越重要的作用。云測數(shù)據(jù),正是這個行業(yè)中的頭部企業(yè)。
像百度、阿里巴巴這樣擁有海量數(shù)據(jù)的企業(yè),更需要將數(shù)據(jù)進行清洗、標注,把海量數(shù)據(jù)加工成有價值的數(shù)據(jù)。更不用說人工智能產(chǎn)業(yè)落地前夕,AI需要更多還原特定場景的數(shù)據(jù)。這對于輕資產(chǎn)的AI公司來說用人力去做成本太過高昂,因此AI公司多將此類工作外包。由此而產(chǎn)生了一個以數(shù)據(jù)標注為核心的AI數(shù)據(jù)服務(wù)市場。根據(jù)艾瑞報告,2018年AI基礎(chǔ)數(shù)據(jù)服務(wù)市場的規(guī)模約為25.86億元,并預(yù)測到2025年這個市場的規(guī)模約為113億元。這是個高速增長的市場,有多家企業(yè)涉足其中,為AI行業(yè)的發(fā)展提供最不可或缺的服務(wù)。
數(shù)據(jù)標注行業(yè)從性質(zhì)上看偏勞動密集型,因為主要工作過程都牽涉到人力。舉一個例子,谷歌大腦當年曾成功從視頻中認出了一只貓,為此所付出的算力代價則是16000臺電腦學(xué)習(xí)了1000萬張圖片。在當前的算力情況沒有突破性進展的情況下,這個案例是無法落地應(yīng)用的,因為僅僅認出一只貓就要機器學(xué)習(xí)這么久,要是認一間屋子里床上的一只貓呢?從應(yīng)用角度來說算力成本太高,難以推行。將這個案例投入應(yīng)用的唯一辦法,就是采集和標注大量貓圖片訓(xùn)練算法,以提升效率。這只是數(shù)據(jù)標注行業(yè)的某個單一工作場景,還有更多更復(fù)雜的數(shù)據(jù)需求。
當一輛自動駕駛的車行駛在路上時,有可能遇到的情況有哪些?由于智能駕駛領(lǐng)域的的特殊性,其算法模型要求能處理任何常規(guī)情況和突發(fā)情況,條件是要在數(shù)據(jù)上盡可能對其加以滿足。前后左右來車,這是最常見的簡單場景,目前自動駕駛發(fā)展的階段可以作相應(yīng)處置以避開,但如果車前方飛來一只鳥,或走來一個撐雨傘的人,這就屬于非常見的復(fù)雜場景了,任何互聯(lián)網(wǎng)公司也沒有此類數(shù)據(jù),只能靠云測數(shù)據(jù)等這些數(shù)據(jù)服務(wù)公司進行特定場景的數(shù)據(jù)搭建采集。自動駕駛的車要保證安全,就需要后臺的AI數(shù)據(jù)盡可能將任何在公路上可能遇到的情況容納進去,有些情況發(fā)生概率接近零,但只要不是零,自動駕駛的車的算法模型就需要這些數(shù)據(jù)。一個例子是,特斯拉曾有輛車在自動駕駛狀態(tài)下車毀人亡,原因是自動駕駛系統(tǒng)沒有辨別出前方白色車輛和天空的區(qū)別,導(dǎo)致自動剎車沒有及時制動,一頭沖了過去。
隨著AI應(yīng)用落地越來越廣,相應(yīng)的高質(zhì)、精準、安全數(shù)據(jù)的需求量也在直線上升。創(chuàng)建于2011年的Testin云測從應(yīng)用測試業(yè)務(wù)出發(fā),在服務(wù)了超過一百萬家企業(yè)之后,經(jīng)過行業(yè)前瞻判斷,抓住機會順應(yīng)市場趨勢進入了AI數(shù)據(jù)服務(wù)領(lǐng)域,成立數(shù)據(jù)標注業(yè)務(wù)品牌云測數(shù)據(jù)。通過自建數(shù)據(jù)場景實驗室和數(shù)據(jù)標注基地,為智能駕駛、智能家居、智慧城市、智慧金融、零售等領(lǐng)域提供定制化的數(shù)據(jù)采集、數(shù)據(jù)標注服務(wù),全方位支持文本、語音、圖像、視頻等各類型數(shù)據(jù)的處理。在很短的時間內(nèi),云測數(shù)據(jù)已成為國內(nèi)AI數(shù)據(jù)標注服務(wù)市場的第一名,目前市場上主要的AI企業(yè)均是其客戶。
云測數(shù)據(jù)可以說是隨著一個應(yīng)用人工智能市場的成長而崛起的,其目前的市場地位除了順應(yīng)趨勢站上風(fēng)口之外,還有長期耕耘To B市場的流程化管理和人員協(xié)作經(jīng)驗的繼承,而云測數(shù)據(jù)在開拓新業(yè)務(wù)時有章有法,是一個更為重要的原因。一個新生市場在初期時往往是野蠻生長期,監(jiān)管缺失,市場認識不足,都會導(dǎo)致這個市場內(nèi)亂象橫生。企業(yè)為了盡可能拿到市場紅利,往往會只盯住增長而放任其他方面不管,甚至采用一些非常規(guī)手段來保證盡快增長,但云測數(shù)據(jù)在AI數(shù)據(jù)標注服務(wù)這一行的征戰(zhàn),顯然沒有走這條看似常規(guī)的路。
需求定制是云測數(shù)據(jù)商業(yè)模式的核心,無論是數(shù)據(jù)標注還是數(shù)據(jù)采集,云測數(shù)據(jù)都發(fā)展出一套科學(xué)的生產(chǎn)與管理流程。云測數(shù)據(jù)在華東、華南、華北等地自建的數(shù)據(jù)交付中心和數(shù)據(jù)采集基地,在提升了數(shù)據(jù)生產(chǎn)作業(yè)流程環(huán)境、保證數(shù)據(jù)交付效率的同時,對于數(shù)據(jù)的最終質(zhì)量保證有著很大的提升作用。如果為了節(jié)省成本可以采用小作坊式的數(shù)據(jù)標注作業(yè)場所,生產(chǎn)環(huán)境惡劣,員工素質(zhì)不高,雖然可以省點錢,卻終究無法提供最好的服務(wù)。云測數(shù)據(jù)是將AI數(shù)據(jù)服務(wù)當成一個長遠的事業(yè)來做的,而非用來賺快錢,這個主導(dǎo)思想自然會對最終結(jié)果產(chǎn)生正面影響。
其實云測數(shù)據(jù)更為吸引客戶的,是在數(shù)據(jù)安全方面所下的功夫。行業(yè)發(fā)展初期很少有公司會重視這件事,但云測數(shù)據(jù)卻對其高度重視。云測數(shù)據(jù)在場景數(shù)據(jù)采集之前都會與被采用戶簽署數(shù)據(jù)授權(quán)協(xié)議,確保AI企業(yè)用于訓(xùn)練的數(shù)據(jù)合法合規(guī);在作業(yè)流程中采用數(shù)據(jù)隔離機制,所有的數(shù)據(jù)都是被封閉在標注平臺中的,員工可以在平臺之上作業(yè)但卻無法真正接觸到這些數(shù)據(jù),以保證數(shù)據(jù)的安全性;還有一點是不濫用數(shù)據(jù),數(shù)據(jù)交付后清毀數(shù)據(jù)不留底,絕不二次使用;從安全防范到作業(yè)流程,再到數(shù)據(jù)審核與質(zhì)量保障,每個環(huán)節(jié)云測數(shù)據(jù)都建立起了一套完善的機制與管理規(guī)定,用制度來守護數(shù)據(jù)的安全性和隱私性。
Testin云測CMO張鵬飛也強調(diào)“從整體看來,AI數(shù)據(jù)行業(yè)關(guān)于安全、隱私等方面并沒有統(tǒng)一的標準和強調(diào)重視。但我們從長遠角度出發(fā),一直在隱私和安全防護角度下大力氣服務(wù)行業(yè)、樹立數(shù)據(jù)質(zhì)量標桿,只有以這種負責的態(tài)度來服務(wù)客戶,我們的行業(yè)才能‘良幣驅(qū)除劣幣’,真正讓人工智能成為新一輪技術(shù)革命,改變整個社會和人類進程”。
事實上,這些看似繁瑣的安全和質(zhì)量機制,恰恰是客戶所看重的,即便客戶需求中也許不會展示那么詳細,但云測數(shù)據(jù)通過科學(xué)流程主動將客戶顧慮排除,客戶的內(nèi)心一定是認可的。因為誰也不愿意自己重要的數(shù)據(jù)被泄露外傳,也不想自己的數(shù)據(jù)經(jīng)過一番加工之后質(zhì)量達不到要求。人工智能公司與AI數(shù)據(jù)服務(wù)公司之間,最重要的是建立一種信任關(guān)系,其他的事情自可迎刃而解。云測數(shù)據(jù)在這個行業(yè)內(nèi)有章有法的運營行為,是其能夠獲得成功的關(guān)鍵。這給整個行業(yè)做出了正面示范,也引領(lǐng)了行業(yè)的健康發(fā)展態(tài)勢。
全機器化、全智能化的時代還遠遠沒有到來,在通往這個目標的過程中,相應(yīng)的人力消耗與線下活動是必需的,因此云測數(shù)據(jù)具備充足的發(fā)展空間和機會。AI數(shù)據(jù)服務(wù)看上去所做的事情足夠基礎(chǔ),但這些工作卻是AI行業(yè)發(fā)展不可缺少的。如果說數(shù)據(jù)是驅(qū)動AI運行的能源,那么數(shù)據(jù)標注就是提供石油的那個角色。如果說數(shù)據(jù)是驅(qū)動AI運行的血液,那么數(shù)據(jù)標注就是造血干細胞,其作用與功能的重要性是怎么描述也不為過的。而云測數(shù)據(jù)正是這個新生行業(yè)的執(zhí)牛耳者,將隨著AI行業(yè)的發(fā)展而不斷成長。
- 蜜度索驥:以跨模態(tài)檢索技術(shù)助力“企宣”向上生長
- 比亞迪第五代DM技術(shù)問世,首搭秦L/海豹06 DM-i,開創(chuàng)油耗2時代!
- 小紅書沉帖降權(quán)怎么做,有效方法大盤點!
- 亞洲時刻京東送上電視好禮 以舊換新一體化服務(wù)讓低價更靠譜
- 互聯(lián)網(wǎng)營銷師和全媒體運營師的區(qū)別?
- 聯(lián)想集團車計算“超級大腦”概念機亮相
- 華策影視設(shè)立專項基金成立AIGC應(yīng)用研究院
- 三部委審批,聯(lián)合發(fā)布9個新職業(yè),“互聯(lián)網(wǎng)營銷師”上榜
- 互聯(lián)網(wǎng)營銷師的報考條件是什么?
- 互聯(lián)網(wǎng)營銷師的適合人群有哪些?
- 互聯(lián)網(wǎng)營銷師行業(yè)前景怎么樣?
免責聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關(guān)資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負任何法律責任。任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。