DataVisor維擇科技創(chuàng)始人兼CEO謝映蓮近日在《福布斯》上發(fā)表了她對(duì)大數(shù)據(jù)發(fā)展的見解,她認(rèn)為推動(dòng)下一次大數(shù)據(jù)浪潮的動(dòng)力不是“集中數(shù)據(jù)”,而是“集中智能”的能力。“集中智能”指運(yùn)用有效的工具優(yōu)化企業(yè)各部門的工作流程,運(yùn)用先進(jìn)的特征工程直接從原始數(shù)據(jù)中獲取智能見解并輸出有預(yù)見性的決策。
▽以下為原文譯文
數(shù)據(jù)對(duì)現(xiàn)代數(shù)字經(jīng)濟(jì)的運(yùn)作至關(guān)重要。但是,僅有數(shù)據(jù)并不能自動(dòng)轉(zhuǎn)換為可操作的智能能力,也不會(huì)自動(dòng)推動(dòng)數(shù)字經(jīng)濟(jì)繁榮發(fā)展。想要在全球數(shù)字經(jīng)濟(jì)中取得成功,除數(shù)據(jù)外,還需要先進(jìn)的操作工具和解決方案,從而大規(guī)模獲得可行的智能見解。
當(dāng)前,不少企業(yè)仍停留在用大量集中式的數(shù)據(jù)驅(qū)動(dòng)企業(yè)發(fā)展的階段,但是,從數(shù)據(jù)安全和隱私保護(hù)等角度出發(fā),我們應(yīng)該從“集中數(shù)據(jù)”向“集中智能”過渡。
2015年,IBM指出:“當(dāng)今世界90%的數(shù)據(jù)是在過去兩年中創(chuàng)建的。”回頭看這段數(shù)字化之路,我們提升了數(shù)據(jù)解釋、創(chuàng)建數(shù)據(jù)圖表、圖形和可視化效果的能力,同時(shí)也增強(qiáng)了數(shù)據(jù)分析能力。為了在企業(yè)級(jí)利用這些能力,我們還開發(fā)了集中式數(shù)據(jù)分析方法使企業(yè)和機(jī)構(gòu)能夠受益。
如今,AI和機(jī)器學(xué)習(xí)等變革性技術(shù)快速崛起,智能能力也隨之變得異常復(fù)雜,同時(shí),“集中數(shù)據(jù)”和“集中智能”之間出現(xiàn)了溝壑。在“集中數(shù)據(jù)”階段,我們?nèi)栽谶M(jìn)行可視化的數(shù)據(jù)管理和數(shù)據(jù)分析解釋,努力找出趨勢并嘗試?yán)斫馑鼈?。?dāng)我們進(jìn)入到“集中智能”階段時(shí),意味著數(shù)據(jù)不僅停留在解釋階段,“集中智能”能夠預(yù)測性地創(chuàng)建可行的智能見解,并有效采取大規(guī)模實(shí)時(shí)的行動(dòng)。重要的是,可操作的智能位于系統(tǒng)內(nèi)部,它是集中式的。
什么是集中式?集中式不是一個(gè)新概念。數(shù)據(jù)規(guī)模和復(fù)雜性的快速增長使企業(yè)難以管理自己的信息。因此,企業(yè)往往朝著集中團(tuán)隊(duì)、工具和流程的方向去發(fā)展。表面上看,集中式代表了企業(yè)對(duì)大數(shù)據(jù)增長趨勢的積極應(yīng)對(duì)。不少企業(yè)在實(shí)現(xiàn)降本增效的路上努力,并取得了不同程度的成功。但實(shí)際上,還有一些企業(yè)停留在只“集中數(shù)據(jù)”而不是“集中智能”的階段,而“集中數(shù)據(jù)”的成本和效率收益仍然有限。
鑒于當(dāng)今數(shù)字經(jīng)濟(jì)的需求,數(shù)據(jù)安全的壓力和用戶體驗(yàn)的競爭都在不斷增加。大數(shù)據(jù)智能已成為當(dāng)代最有價(jià)值的商品。但對(duì)于大多數(shù)企業(yè)而言,“集中智能”仍然是一個(gè)遙不可及的目標(biāo),主要原因是許多企業(yè)普遍缺乏先進(jìn)的特征工程的能力。特征工程對(duì)于構(gòu)建智能系統(tǒng)至關(guān)重要。特征能從大數(shù)據(jù)中發(fā)掘出的可行見解,這些見解轉(zhuǎn)換為智能來供AI算法使用,也就是說,通過特征來釋放出大數(shù)據(jù)的力量。
那么,為什么先進(jìn)的特征工程尚未得到廣泛的應(yīng)用呢?因?yàn)樘卣鞴こ瘫仨毷謩?dòng)完成,這是一個(gè)復(fù)雜且耗時(shí)的工作。在迎接各類業(yè)務(wù)挑戰(zhàn)時(shí),需要大量有效特征去應(yīng)對(duì),這是個(gè)很難克服的困難。
實(shí)時(shí)生成高質(zhì)量的特征需要大量專業(yè)領(lǐng)域的知識(shí),來自專家豐富的經(jīng)驗(yàn)?zāi)軌蛑С痔卣鞴こ梯敵鎏卣鞯膬r(jià)值、適用性、相關(guān)性,并且還能對(duì)操作進(jìn)行有效優(yōu)化。除此之外許多因素影響著特征工程的質(zhì)量和效率,比如,在準(zhǔn)備好生產(chǎn)就緒的代碼之前,數(shù)據(jù)科學(xué)團(tuán)隊(duì)和特征工程團(tuán)隊(duì)需要詳細(xì)溝通;復(fù)雜特征的創(chuàng)建需要考慮可擴(kuò)展性;大規(guī)模獲取智能見解也需要耗費(fèi)大量內(nèi)存等。先進(jìn)的算法帶來了巨大的復(fù)雜性,對(duì)數(shù)千個(gè)數(shù)據(jù)點(diǎn)進(jìn)行實(shí)時(shí)全面分析,在流程上仍需進(jìn)行大量優(yōu)化。
如果一個(gè)系統(tǒng)仍舊依賴于手動(dòng)操作,該系統(tǒng)是無法真正實(shí)現(xiàn)智能的。對(duì)于企業(yè)來說,要提高模型性能、提升效率、優(yōu)化靈活性并采取實(shí)時(shí)行動(dòng)是至關(guān)重要的,同時(shí),企業(yè)內(nèi)不同團(tuán)隊(duì)的能力和獨(dú)立性也非常重要。這意味著:自動(dòng)化和定制之間的平衡將很關(guān)鍵。
如果某個(gè)領(lǐng)域的專業(yè)知識(shí)可以被應(yīng)用在處理特定業(yè)務(wù)問題上,那就意味著一些標(biāo)準(zhǔn)化特征也有機(jī)會(huì)被應(yīng)用在自動(dòng)化模型的構(gòu)建。通過自動(dòng)化的能力,直接從原始數(shù)據(jù)中獲得新特征。比如,在欺詐檢測領(lǐng)域中,影響檢測精度的關(guān)鍵特征是IP地址,如果能從原始數(shù)據(jù)的一個(gè)IP地址中自動(dòng)提取可用特征,那自動(dòng)化能力、準(zhǔn)確性和效率都將大大提高。
先進(jìn)的特征工程本質(zhì)上是“集中智能”在實(shí)踐中的體現(xiàn)。因?yàn)樗砹艘环N高效、大規(guī)模地從大量眾多來源的原始數(shù)據(jù)中集中提取可操作的智能見解的能力,并且這些智能見解能夠?qū)崟r(shí)對(duì)其他諸多領(lǐng)域產(chǎn)生積極影響。
重塑企業(yè)的大數(shù)據(jù)系統(tǒng),既是縱向的過程,也是橫向的過程??v向角度來看,“集中智能”的目標(biāo)是使組織中的每個(gè)團(tuán)隊(duì)都能利用數(shù)據(jù)做出貢獻(xiàn),并獲取智能見解。橫向角度看,“集中智能”需要在所有相關(guān)用例和業(yè)務(wù)場景中實(shí)現(xiàn)集中智能風(fēng)控的目標(biāo)。
先進(jìn)的實(shí)時(shí)特征工程能推進(jìn)企業(yè)的現(xiàn)代化進(jìn)程,加速并優(yōu)化企業(yè)的風(fēng)控模式,從而確保更安全,更高效,更繁榮的數(shù)字經(jīng)濟(jì)發(fā)展。
(免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。
任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。 )