中國科技彎道超車在即,云測數(shù)據(jù)鑄造AI“新引擎”

原標(biāo)題:中國科技彎道超車在即,云測數(shù)據(jù)鑄造AI“新引擎”

科技行業(yè)發(fā)展?jié)L滾向前,不過一直以來,中國科技行業(yè)都是一個追隨者,可以說在PC時代我們是一個完全的學(xué)習(xí)者,而在互聯(lián)網(wǎng)時代,我們的網(wǎng)絡(luò)應(yīng)用和服務(wù)開始能夠和海外巨頭并駕齊驅(qū),而到了移動互聯(lián)網(wǎng)時代,開始呈現(xiàn)領(lǐng)先全球的態(tài)勢,中國移動互聯(lián)網(wǎng)發(fā)展的進(jìn)程遠(yuǎn)超西方發(fā)達(dá)國家,很多人都覺得中國人太依賴手機(jī)了。不過想要領(lǐng)先世界,那么機(jī)會真正出現(xiàn)在人工智能領(lǐng)域,AI改變世界已經(jīng)是一個不爭的趨勢,而在這個領(lǐng)域,中國科技界正在凝聚一股強大的力量。

AI三要素和人工智能五小強

在互聯(lián)網(wǎng)乃至移動互聯(lián)網(wǎng)時代,大家突然發(fā)現(xiàn)中國賴以成功的人口紅利優(yōu)勢依然存在,不斷增加的互聯(lián)網(wǎng)用戶帶來了非常好的發(fā)展基礎(chǔ)。即便是在最近兩年,下沉市場還帶動了拼多多這樣的企業(yè)誕生,可以說,市場規(guī)模依然是科技界的最大優(yōu)勢。不過讓人感到欣慰的是,這種優(yōu)勢還將繼續(xù)起作用,到了人工智能時代,依舊是中國科技行業(yè)能夠?qū)崿F(xiàn)彎道超車的基礎(chǔ)。因為大量的人口紅利、多樣且豐富的使用場景、對新技術(shù)的接受程度等等因素疊加,產(chǎn)生了大量的可在AI場景中數(shù)據(jù),這種數(shù)據(jù)樣本從規(guī)模到價值都非常宏大。對人工智能三要素來說,這也是其為關(guān)鍵的數(shù)據(jù)優(yōu)勢。

AI三要素是指算法、算力和數(shù)據(jù),用簡單的話講,算法可以說是計算的方法,好的算法效率高,準(zhǔn)確率高,而算力則是硬件能力,在量子計算機(jī)誕生之前,在算力方面,不會產(chǎn)生什么跨時代的差距,目前努力的方向也是芯片產(chǎn)品的小微化,能夠讓更多的智能設(shè)備具有運算能力。而5G的發(fā)展將會帶來一個非常巨大的變革就是設(shè)備可以共享云端算力,這會大大增強智能設(shè)備的算力,這也是為什么我們會說5G時代才是真正的萬物互聯(lián)的原因。而數(shù)據(jù)這個層面,那就非常簡單了,是AI學(xué)習(xí)的基礎(chǔ),就好像是你讀的書,簡單的可以說,你讀的書越多,你也就越聰明越有智慧。而在這個層面,各大科技公司開始出現(xiàn)了一些差距。

目前中國在AI數(shù)據(jù)方面還是具有顯著優(yōu)勢的,硅谷的人工智能公司大部分都只能在算法上想辦法。而中國市場的數(shù)據(jù)規(guī)模更為龐大,更多的公司可以提供這些數(shù)據(jù)來供人工智能公司進(jìn)行學(xué)習(xí),由此產(chǎn)生了一個非常好的人工智能生態(tài),而一旦這個生態(tài)達(dá)到臨界爆發(fā),人工智能的自學(xué)習(xí)能力達(dá)到一定的程度,那么就會產(chǎn)生一個代際的差距,就好像大學(xué)生和小學(xué)生一樣。而目前中國在人工智能領(lǐng)域有五家公司被業(yè)界稱為“五小強”,算法層有商湯、曠視,AI數(shù)據(jù)領(lǐng)域有云測數(shù)據(jù),硬件方面有涂鴉智能、地平線,這些公司雖然不是BAT級的巨頭公司,但是在人工智能領(lǐng)域都有著自己專業(yè)的深耕和成果,可以說是中國人工智能領(lǐng)域彎道超車的中堅力量。

AI領(lǐng)域的數(shù)據(jù)英雄

在人工智能“五小強”中都是人工智能領(lǐng)域的頭部企業(yè),商湯、曠視經(jīng)常在視覺和識別等方面一騎絕塵,而涂鴉和地平線,支撐了目前大量的智能產(chǎn)品進(jìn)入全球千家萬戶,而云測數(shù)據(jù)用高質(zhì)量的AI數(shù)據(jù)撐起了人工智能的一片天,曾被媒體稱為“AI領(lǐng)域的數(shù)據(jù)英雄”。簡單說,云測數(shù)據(jù)就像是生產(chǎn)行業(yè)燃料的企業(yè),幫助算法公司去把數(shù)據(jù)進(jìn)行標(biāo)記,從而實現(xiàn)更好的學(xué)習(xí)效果,而這個工作可以說是非常龐大和繁瑣,但確實又非常重要。不然再好再多的數(shù)據(jù),也沒有辦法實現(xiàn)他們的核心價值。

比如人工智能領(lǐng)域有一個有趣的話題,人臉識別的準(zhǔn)確率對于有色人種隨著膚色的加深會大大下降,這里有一個很重要的原因就是訓(xùn)練數(shù)據(jù)的不足。如果想要訓(xùn)練一個低精度的人臉識別比如性別識別,那么隨便標(biāo)注性別人像的數(shù)據(jù)就可以了,但如果要精準(zhǔn)識別一個人,就要有不同維度的被標(biāo)注好的數(shù)據(jù)。由此也就誕生了定制化的AI數(shù)據(jù)服務(wù),還原或搭建真實使用場景中所需要的環(huán)境,采集好定制化的場景數(shù)據(jù)并經(jīng)過精準(zhǔn)標(biāo)注后,用這些高質(zhì)量數(shù)據(jù)去訓(xùn)練算法模型,才能使其具有越來越智能。

這種定制化的數(shù)據(jù)服務(wù)能力的要求很高,必須具備對場景深度的還原能力、作業(yè)協(xié)同化能力、專業(yè)化能力這三種能力,首先保證對用戶的需求進(jìn)行精準(zhǔn)的拆解、理解甚至預(yù)判,其次設(shè)立專業(yè)規(guī)范的協(xié)作流程,最后有足夠?qū)I(yè)的人士能夠保證數(shù)據(jù)標(biāo)注的質(zhì)量。比如說,在醫(yī)療領(lǐng)域做X光片病理診斷中,標(biāo)注人員需要非常專業(yè),甚至是副主任醫(yī)師專業(yè)以上的級別,才能對病理的片子進(jìn)行正確的數(shù)據(jù)標(biāo)注與解讀。類似的情況也出現(xiàn)在教育、法律、智能駕駛等多個領(lǐng)域。

而云測數(shù)據(jù)正是這個領(lǐng)域的頭部企業(yè),他們通過自建數(shù)據(jù)標(biāo)注基地和場景實驗室的方式,打造專業(yè)的定制化采集和高質(zhì)量的標(biāo)注隊伍,幫助人工智能企業(yè)獲取更多優(yōu)質(zhì)的特定場景數(shù)據(jù),持續(xù)為AI訓(xùn)練、優(yōu)化提供安全可靠、精準(zhǔn)高質(zhì)的數(shù)據(jù)服務(wù)?,F(xiàn)在已經(jīng)覆蓋了智能駕駛、智慧城市、智能家居、智慧金融、新零售等諸多領(lǐng)域的定制化的數(shù)據(jù)采集、數(shù)據(jù)標(biāo)注服務(wù),實現(xiàn)了語音、圖像、文本、視頻的全領(lǐng)域覆蓋,全方位支持各類型數(shù)據(jù)的處理。可以說是成為了人工智能領(lǐng)域的數(shù)據(jù)基礎(chǔ)服務(wù)提供者。目前已經(jīng)擁有了行業(yè)內(nèi)最大規(guī)模的專業(yè)數(shù)據(jù)服務(wù)全職人員,成功為上百家企業(yè)提供了AI數(shù)據(jù)服務(wù)。

數(shù)據(jù)優(yōu)勢是核心優(yōu)勢

目前在算法和算力方面,其實并沒有什么代際差距,所以人工智能競爭的關(guān)鍵核心,還是在數(shù)據(jù)本身,這是行業(yè)的源頭活水,也是發(fā)展的關(guān)鍵。不過對于人工智能公司來說,選擇第三方的數(shù)據(jù)標(biāo)準(zhǔn)公司已經(jīng)是當(dāng)下最優(yōu)的選擇,這里面存在人員成本、專業(yè)程度以及效率質(zhì)量等多方面問題,可以說越專業(yè)的數(shù)據(jù)公司就有著越高的數(shù)據(jù)標(biāo)記能力,更有著豐富的數(shù)據(jù)標(biāo)記經(jīng)驗和對客戶訓(xùn)練需求的深刻理解。這對于云測數(shù)據(jù)來說,其實是一個很好的機(jī)會,而隨著行業(yè)規(guī)模的不斷擴(kuò)大,其領(lǐng)軍和帶頭作用也越發(fā)明顯,而其在隱私保護(hù)、數(shù)據(jù)安全等方面的高標(biāo)準(zhǔn),也逐漸成為行業(yè)的標(biāo)桿。所以云測數(shù)據(jù)也開始越來越多地出現(xiàn)在大眾視野之中,從相當(dāng)程度上推動了AI 數(shù)據(jù)行業(yè)的規(guī)范化發(fā)展。

不過總體來看,整個數(shù)據(jù)領(lǐng)域的水平還有待發(fā)展,還有大量良莠不齊的外包團(tuán)隊,進(jìn)行一些游擊戰(zhàn)式的數(shù)據(jù)標(biāo)注服務(wù),但隨著企業(yè)對數(shù)據(jù)標(biāo)準(zhǔn)要求的提升,數(shù)據(jù)標(biāo)注向著更專業(yè)的方向發(fā)展是大勢所趨,因為這樣才能建立真正的人工智能壁壘,畢竟最好的建筑材料才能建設(shè)起最堅固的房子。云測數(shù)據(jù)總經(jīng)理曾說過,“以人臉識別為例,以前的需求是拉框、標(biāo)注五官,現(xiàn)在需要標(biāo)注幾百個點,精確到3-5像素以內(nèi)。而諸如智能駕駛領(lǐng)域的3D點云標(biāo)注、和家居、金融等領(lǐng)域涉及的NLP標(biāo)注等,對數(shù)據(jù)標(biāo)注的整體能力也有更高的要求”這種級別的數(shù)據(jù)服務(wù),門檻還是相當(dāng)高的。

其實從社會發(fā)展來看,倒也有很多相似之處,之前我們追求經(jīng)濟(jì)發(fā)展的速度,現(xiàn)在則追求經(jīng)濟(jì)發(fā)展的質(zhì)量,只有速度沒有質(zhì)量,最后還是沙上建塔,經(jīng)不起風(fēng)浪的沖刷。而中國人工智能行業(yè)如果想要真正實現(xiàn)彎道超車和逆襲,對數(shù)據(jù)標(biāo)注方面的專業(yè)度提升和投入,還是要加大關(guān)注。而云測數(shù)據(jù)這樣的專業(yè)機(jī)構(gòu),也會迎來更大的發(fā)展空間。

免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進(jìn)一步核實,并對任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。

2020-03-03
中國科技彎道超車在即,云測數(shù)據(jù)鑄造AI“新引擎”
目前中國在人工智能領(lǐng)域有五家公司被業(yè)界稱為“五小強”,算法層有商湯、曠視,AI數(shù)據(jù)領(lǐng)域有云測數(shù)據(jù),硬件方面有涂鴉智能、地平線,這些公司雖然不是BAT級的巨頭公司,但是在人工智能領(lǐng)域都有著自己專業(yè)的深耕

長按掃碼 閱讀全文