維擇科技謝映蓮:集中智能,從大量原始數(shù)據(jù)中直接挖出“黃金”

DataVisor維擇科技創(chuàng)始人兼CEO謝映蓮近日在《福布斯》上發(fā)表了她對大數(shù)據(jù)發(fā)展的見解,她認(rèn)為推動下一次大數(shù)據(jù)浪潮的動力不是“集中數(shù)據(jù)”,而是“集中智能”的能力。“集中智能”指運(yùn)用有效的工具優(yōu)化企業(yè)各部門的工作流程,運(yùn)用先進(jìn)的特征工程直接從原始數(shù)據(jù)中獲取智能見解并輸出有預(yù)見性的決策。

▽以下為原文譯文

維擇科技謝映蓮:集中智能,從大量原始數(shù)據(jù)中直接挖出“黃金”

數(shù)據(jù)對現(xiàn)代數(shù)字經(jīng)濟(jì)的運(yùn)作至關(guān)重要。但是,僅有數(shù)據(jù)并不能自動轉(zhuǎn)換為可操作的智能能力,也不會自動推動數(shù)字經(jīng)濟(jì)繁榮發(fā)展。想要在全球數(shù)字經(jīng)濟(jì)中取得成功,除數(shù)據(jù)外,還需要先進(jìn)的操作工具和解決方案,從而大規(guī)模獲得可行的智能見解。

當(dāng)前,不少企業(yè)仍停留在用大量集中式的數(shù)據(jù)驅(qū)動企業(yè)發(fā)展的階段,但是,從數(shù)據(jù)安全和隱私保護(hù)等角度出發(fā),我們應(yīng)該從“集中數(shù)據(jù)”向“集中智能”過渡。

2015年,IBM指出:“當(dāng)今世界90%的數(shù)據(jù)是在過去兩年中創(chuàng)建的。”回頭看這段數(shù)字化之路,我們提升了數(shù)據(jù)解釋、創(chuàng)建數(shù)據(jù)圖表、圖形和可視化效果的能力,同時也增強(qiáng)了數(shù)據(jù)分析能力。為了在企業(yè)級利用這些能力,我們還開發(fā)了集中式數(shù)據(jù)分析方法使企業(yè)和機(jī)構(gòu)能夠受益。

如今,AI和機(jī)器學(xué)習(xí)等變革性技術(shù)快速崛起,智能能力也隨之變得異常復(fù)雜,同時,“集中數(shù)據(jù)”和“集中智能”之間出現(xiàn)了溝壑。在“集中數(shù)據(jù)”階段,我們?nèi)栽谶M(jìn)行可視化的數(shù)據(jù)管理和數(shù)據(jù)分析解釋,努力找出趨勢并嘗試?yán)斫馑鼈儭.?dāng)我們進(jìn)入到“集中智能”階段時,意味著數(shù)據(jù)不僅停留在解釋階段,“集中智能”能夠預(yù)測性地創(chuàng)建可行的智能見解,并有效采取大規(guī)模實時的行動。重要的是,可操作的智能位于系統(tǒng)內(nèi)部,它是集中式的。

什么是集中式?集中式不是一個新概念。數(shù)據(jù)規(guī)模和復(fù)雜性的快速增長使企業(yè)難以管理自己的信息。因此,企業(yè)往往朝著集中團(tuán)隊、工具和流程的方向去發(fā)展。表面上看,集中式代表了企業(yè)對大數(shù)據(jù)增長趨勢的積極應(yīng)對。不少企業(yè)在實現(xiàn)降本增效的路上努力,并取得了不同程度的成功。但實際上,還有一些企業(yè)停留在只“集中數(shù)據(jù)”而不是“集中智能”的階段,而“集中數(shù)據(jù)”的成本和效率收益仍然有限。

鑒于當(dāng)今數(shù)字經(jīng)濟(jì)的需求,數(shù)據(jù)安全的壓力和用戶體驗的競爭都在不斷增加。大數(shù)據(jù)智能已成為當(dāng)代最有價值的商品。但對于大多數(shù)企業(yè)而言,“集中智能”仍然是一個遙不可及的目標(biāo),主要原因是許多企業(yè)普遍缺乏先進(jìn)的特征工程的能力。特征工程對于構(gòu)建智能系統(tǒng)至關(guān)重要。特征能從大數(shù)據(jù)中發(fā)掘出的可行見解,這些見解轉(zhuǎn)換為智能來供AI算法使用,也就是說,通過特征來釋放出大數(shù)據(jù)的力量。

那么,為什么先進(jìn)的特征工程尚未得到廣泛的應(yīng)用呢?因為特征工程必須手動完成,這是一個復(fù)雜且耗時的工作。在迎接各類業(yè)務(wù)挑戰(zhàn)時,需要大量有效特征去應(yīng)對,這是個很難克服的困難。

實時生成高質(zhì)量的特征需要大量專業(yè)領(lǐng)域的知識,來自專家豐富的經(jīng)驗?zāi)軌蛑С痔卣鞴こ梯敵鎏卣鞯膬r值、適用性、相關(guān)性,并且還能對操作進(jìn)行有效優(yōu)化。除此之外許多因素影響著特征工程的質(zhì)量和效率,比如,在準(zhǔn)備好生產(chǎn)就緒的代碼之前,數(shù)據(jù)科學(xué)團(tuán)隊和特征工程團(tuán)隊需要詳細(xì)溝通;復(fù)雜特征的創(chuàng)建需要考慮可擴(kuò)展性;大規(guī)模獲取智能見解也需要耗費(fèi)大量內(nèi)存等。先進(jìn)的算法帶來了巨大的復(fù)雜性,對數(shù)千個數(shù)據(jù)點進(jìn)行實時全面分析,在流程上仍需進(jìn)行大量優(yōu)化。

如果一個系統(tǒng)仍舊依賴于手動操作,該系統(tǒng)是無法真正實現(xiàn)智能的。對于企業(yè)來說,要提高模型性能、提升效率、優(yōu)化靈活性并采取實時行動是至關(guān)重要的,同時,企業(yè)內(nèi)不同團(tuán)隊的能力和獨立性也非常重要。這意味著:自動化和定制之間的平衡將很關(guān)鍵。

如果某個領(lǐng)域的專業(yè)知識可以被應(yīng)用在處理特定業(yè)務(wù)問題上,那就意味著一些標(biāo)準(zhǔn)化特征也有機(jī)會被應(yīng)用在自動化模型的構(gòu)建。通過自動化的能力,直接從原始數(shù)據(jù)中獲得新特征。比如,在欺詐檢測領(lǐng)域中,影響檢測精度的關(guān)鍵特征是IP地址,如果能從原始數(shù)據(jù)的一個IP地址中自動提取可用特征,那自動化能力、準(zhǔn)確性和效率都將大大提高。

先進(jìn)的特征工程本質(zhì)上是“集中智能”在實踐中的體現(xiàn)。因為它代表了一種高效、大規(guī)模地從大量眾多來源的原始數(shù)據(jù)中集中提取可操作的智能見解的能力,并且這些智能見解能夠?qū)崟r對其他諸多領(lǐng)域產(chǎn)生積極影響。

重塑企業(yè)的大數(shù)據(jù)系統(tǒng),既是縱向的過程,也是橫向的過程??v向角度來看,“集中智能”的目標(biāo)是使組織中的每個團(tuán)隊都能利用數(shù)據(jù)做出貢獻(xiàn),并獲取智能見解。橫向角度看,“集中智能”需要在所有相關(guān)用例和業(yè)務(wù)場景中實現(xiàn)集中智能風(fēng)控的目標(biāo)。

先進(jìn)的實時特征工程能推進(jìn)企業(yè)的現(xiàn)代化進(jìn)程,加速并優(yōu)化企業(yè)的風(fēng)控模式,從而確保更安全,更高效,更繁榮的數(shù)字經(jīng)濟(jì)發(fā)展。

(免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進(jìn)一步核實,并對任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負(fù)任何法律責(zé)任。
任何單位或個人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。 )