專訪龍貓數(shù)據(jù)CTO姚毅:為AI企業(yè)提供精準數(shù)據(jù)服務

對于AI公司來講,數(shù)據(jù)的采集、清洗、標注過程嚴重拖慢研發(fā)效率,耗費大量人力時間,而且數(shù)據(jù)標出來如果不規(guī)范,量不夠大,難以滿足專業(yè)化的應用需求。然而,每一項 AI 技術的場景應用,背后都需要海量數(shù)據(jù)的支持。所以在人工智能產(chǎn)業(yè)鏈上,專業(yè)化的AI數(shù)據(jù)服務商便應運而生。

隨著AI行業(yè)的縱深發(fā)展對數(shù)據(jù)的需求量不斷增加,數(shù)據(jù)服務即是根據(jù)應用方要求,利用人工為圖片、視頻和語音內(nèi)容打標簽、做標注。為AI公司用來訓練算法模型,然后應用到圖像識別、語音識別、動作識別、自動駕駛等不同領域。數(shù)據(jù)標注得越準確、數(shù)量越多,算法模型的效果就越好,高質(zhì)量的數(shù)據(jù)標注決定一家AI公司的行業(yè)競爭力。龍貓數(shù)據(jù)就是奔馳在這個行業(yè)的一匹黑馬。

“深度學習是機器學習中一種基于對數(shù)據(jù)進行表征學習的方法,表征學習的目的,是通過從大規(guī)模數(shù)據(jù)中進行學習,并不斷追求更好的表示方法,即通常所說的模型。”龍貓數(shù)據(jù)CTO姚毅說。針對這樣的技術特性,龍貓數(shù)據(jù)在人工智能數(shù)據(jù)業(yè)務方面做到了效率高、數(shù)量大、準確性高的特點。

姚毅介紹:“數(shù)據(jù)采集方面,性別、年齡都要控制好比例,還要考慮地域的差異。甚至采集設備的位置都會影響數(shù)據(jù)質(zhì)量;數(shù)據(jù)的清洗標注環(huán)節(jié),要根據(jù)作業(yè)的精度要求去掉不符合的數(shù)據(jù)。最后質(zhì)量檢測,要驗證合格的數(shù)據(jù)率,不合格數(shù)據(jù)需要重走流程。”

人工智能有三大要素:計算力、算法和數(shù)據(jù)。其中數(shù)據(jù)是人工智能的基礎,數(shù)據(jù)量越大算法的效果越好,使得企業(yè)可以實現(xiàn)一些過去只有人能夠做的事情,因此數(shù)據(jù)是人工智能的前提。據(jù)姚毅介紹:“龍貓數(shù)據(jù)對客戶在數(shù)據(jù)采集和標注領域提出的需求由技術團隊提供定制化服務,旗下?lián)碛械谋姲脚_龍貓眾包,包括移動端APP、PC端標注網(wǎng)站等提供精準的數(shù)據(jù)采集及標注。”姚毅表示,目前龍貓眾包用戶量達到四百余萬,可承擔千萬人以上樣本量,是國內(nèi)可調(diào)動數(shù)據(jù)處理人員最多、結果最精準的 AI 數(shù)據(jù)服務平臺。

在采訪中姚毅不止一次提到在數(shù)據(jù)采集和標注中“精準”對AI客戶的重要性,龍貓數(shù)據(jù)的精準和極致又是如何做到的?因為數(shù)據(jù)具有體量大、多樣性、價值密度低、速度快等特點。所以“精準”取決于數(shù)據(jù)樣本的數(shù)量與質(zhì)量。龍貓數(shù)據(jù)不斷的采集、標注、清洗、存儲等方式快速獲取有價值的數(shù)據(jù)和信息,積累大量數(shù)據(jù)集與數(shù)據(jù)樣本,為人工智能機器的深度學習。因此,人工智能產(chǎn)品精準的識別度需要大量的數(shù)據(jù)樣本支持其計算機進行深度學習、訓練。換句話說,龍貓數(shù)據(jù)“精準”的數(shù)據(jù)是人工智能產(chǎn)品研發(fā)結果的核心要素!

姚毅認為在人工智能行業(yè)快速發(fā)展的前提下,以深度學習為代表的算法在諸多領域被逐漸應用,對優(yōu)質(zhì)數(shù)據(jù),尤其是優(yōu)質(zhì)一手數(shù)據(jù)的需求量快速增長。當前,這些“有價值”的數(shù)

據(jù)往往很難依靠市場上的“公開數(shù)據(jù)”獲取,因而為做AI數(shù)據(jù)服務的公司提供了新的市場機遇。

據(jù)了解龍貓數(shù)據(jù)成立于2014年,是一家專業(yè)的AI數(shù)據(jù)服務公司,致力于為整個AI領域提供最專業(yè)的數(shù)據(jù)服務。龍貓數(shù)據(jù)經(jīng)過三年的發(fā)展已經(jīng)成為國內(nèi)AI數(shù)據(jù)主要的服務商,受到業(yè)界廣泛的認可。創(chuàng)始人CTO姚毅畢業(yè)于浙江大學 計算機系工學碩士,多年技術開發(fā)及管理經(jīng)驗。創(chuàng)業(yè)前曾就職于 Google、中興、點心、豌豆莢等公司。2010年作為第一批工程師加入創(chuàng)新工場,成為點心OS團隊創(chuàng)始團隊成員。2012年加入豌豆莢,領導好友系統(tǒng)及游戲 SDK的開發(fā),使好友系統(tǒng)積累上億條用戶數(shù)據(jù),SDK 嵌入一千多款游戲。

高質(zhì)量的人才創(chuàng)造高質(zhì)量的技術,高質(zhì)量的技術提供高質(zhì)量的服務。用模塊化的思路打造平臺,實現(xiàn)能夠快速匹配用戶需求的共享數(shù)據(jù)平臺。帶著這個理念與邏輯詳細龍貓數(shù)據(jù)在未來的發(fā)展道路上一定會更快更穩(wěn),創(chuàng)新科技!

極客網(wǎng)企業(yè)會員

免責聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網(wǎng)站對有關資料所引致的錯誤、不確或遺漏,概不負任何法律責任。任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權或存在不實內(nèi)容時,應及時向本網(wǎng)站提出書面權利通知或不實情況說明,并提供身份證明、權屬證明及詳細侵權或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關文章源頭核實,溝通刪除相關內(nèi)容或斷開相關鏈接。

2018-07-27
專訪龍貓數(shù)據(jù)CTO姚毅:為AI企業(yè)提供精準數(shù)據(jù)服務
對于AI公司來講,數(shù)據(jù)的采集、清洗、標注過程嚴重拖慢研發(fā)效率,耗費大量人力時間,而且數(shù)據(jù)標出來如果不規(guī)范,量不夠大,難以滿足專業(yè)化的應用需求。

長按掃碼 閱讀全文