BAT是如何運作金融大數(shù)據(jù)的?

文 | 鈦媒體 吳俊宇

2月13日訊,新年開工,李彥宏的內(nèi)部信就在朋友圈中引發(fā)了一波刷屏。李彥宏說,“這樣一個時代,是很明顯的金融創(chuàng)新的新時代” ,這充分表明金融業(yè)務(wù)將是百度未來的四大方向之一。而他的一句“數(shù)據(jù)秒殺一切算法”,更是從側(cè)面透露了以大數(shù)據(jù)為代表的人工智能技術(shù)將成為百度金融的必殺技。

金融創(chuàng)新很大一部分原因在于大數(shù)據(jù)和金融之間的結(jié)合。縱觀BAT、京東、小米、萬達(dá)、平安這些把觸角伸到互聯(lián)網(wǎng)金融領(lǐng)域的巨頭,無一不是在大數(shù)據(jù)層面上有所布局。大數(shù)據(jù)和金融相結(jié)合,幾乎已經(jīng)成為金融領(lǐng)域的通用做法。

金融數(shù)據(jù)都像是煤礦,價值含量、挖掘成本更重要

談數(shù)據(jù)必須先談數(shù)據(jù)的完整度和價值含量。就像煤礦一樣,大數(shù)據(jù)中的價值含量、挖掘成本比數(shù)量更為重要。非結(jié)構(gòu)化數(shù)據(jù),就像是有雜質(zhì)的煤礦,無法直接使用。大數(shù)據(jù)還需要進(jìn)行脫敏、提純、結(jié)構(gòu)化,才能變成可以被直接運用于商業(yè)層面的有價值的信息。

金融數(shù)據(jù)作為專業(yè)度要求更高的數(shù)據(jù)尤為如此。對于BAT三家而言,布局其實都比較完整。

2015年年底的時候,阿里集團(tuán)透露,在阿里數(shù)據(jù)平臺事業(yè)部的服務(wù)器上,攢下了超過100PB已處理過的數(shù)據(jù)。

BAT三家公司,數(shù)據(jù)體積相差不會太多, 三家?guī)缀醵加蠰BS、交易、社交等一系列不同維度數(shù)據(jù),只是能力有所區(qū)別。

比如說,百度有地圖、貼吧、糯米、外賣、Uber、攜程、去哪兒;阿里有高德、微博、口碑、支付寶、飛豬、優(yōu)酷等;而騰訊有微信、QQ、京東、新美大等。

三家數(shù)據(jù)核心優(yōu)勢可以如此簡單劃分——

百度:基于搜索而誕生的公共數(shù)據(jù)、需求數(shù)據(jù)。百度的優(yōu)勢在于數(shù)據(jù)最全面,數(shù)據(jù)樣本比較復(fù)雜,數(shù)據(jù)的廣度和多樣性上比較強,擁有核心技術(shù)和數(shù)據(jù)礦山,而且是一座富礦。

阿里:基于淘寶天貓業(yè)務(wù)而誕生的電商數(shù)據(jù)、信用數(shù)據(jù)。阿里的核心業(yè)務(wù)在電子商務(wù)上,數(shù)據(jù)比較聚集,更容易做分析。這種數(shù)據(jù)類型的優(yōu)勢在于,更容易變現(xiàn),挖掘出商業(yè)價值。

騰訊:基于微信、QQ誕生的社交數(shù)據(jù)、關(guān)系數(shù)據(jù),以及游戲數(shù)據(jù),相對較雜。不過,容易分析人們的生活和行為,從里面挖掘出商業(yè)、健康等領(lǐng)域的信息。

大數(shù)據(jù)領(lǐng)域有這樣一種說法——所有的數(shù)據(jù)都是風(fēng)險數(shù)據(jù)。而拍拍貸風(fēng)險副總裁顧鳴博士之前提出過一個金字塔結(jié)構(gòu)圖。

在這張圖中,征信數(shù)據(jù)位于金字塔的頂端。往下走是消費數(shù)據(jù)、運營商數(shù)據(jù)、社交數(shù)據(jù)、行為數(shù)據(jù)以及其他數(shù)據(jù)。

越是靠近金字塔的頂部,大數(shù)據(jù)在風(fēng)控領(lǐng)域的應(yīng)用就會越直接,獲取數(shù)據(jù)的難度隨之增加,覆蓋率當(dāng)然會降低;相反,越是靠近金字塔的底部,大數(shù)據(jù)在風(fēng)控方面的應(yīng)用難度就越大,但是數(shù)據(jù)的數(shù)量和覆蓋率都會變大。

把BAT三家套入這個金字塔結(jié)構(gòu)中就會發(fā)現(xiàn)。阿里的數(shù)據(jù)離變現(xiàn)幾乎只有一步之遙。阿里以電商-支付-信用為三級跳板,針對性很強,數(shù)據(jù)價值純度高,金融數(shù)據(jù)的整合上做的也比較完善,缺點是覆蓋面還是不夠。不過,這些年來不斷收購、入股優(yōu)酷、微博、高德等一系列企業(yè),阿里數(shù)據(jù)維度其實也在越來越豐富,也在不斷往金字塔的底層下探。

騰訊有社交、行為數(shù)據(jù),這些數(shù)據(jù)不能直接運用,但獲取的信息會更豐富。而騰訊目前的大數(shù)據(jù)策略是先將產(chǎn)品補全,產(chǎn)品后臺數(shù)據(jù)打通,形成穩(wěn)定生態(tài)圈。本階段先利用大數(shù)據(jù)挖掘改進(jìn)自己的產(chǎn)品。后期有成熟的模式合適的產(chǎn)品,則利用自家的社交及關(guān)系數(shù)據(jù)時,開展對大數(shù)據(jù)的進(jìn)一步挖掘。

雖說有人認(rèn)為百度和騰訊很多數(shù)據(jù)是非結(jié)構(gòu)化數(shù)據(jù),在風(fēng)控上的運用難度較大,很難直接商業(yè)化。不過,這些數(shù)據(jù)恰恰是金字塔最底層的數(shù)據(jù)。在普惠金融的環(huán)境下,互聯(lián)網(wǎng)全域大數(shù)據(jù)帶來的價值不可忽略。

百度的數(shù)據(jù)最為全面、完善,覆蓋面最廣?;ヂ?lián)網(wǎng)環(huán)境下,每個人都會在網(wǎng)上留下痕跡。因此,位于底層的互聯(lián)網(wǎng)行為數(shù)據(jù)覆蓋面最廣,維度最多樣,對破解我國數(shù)億成年人尤其是草根群體的信用空白難題幫助最大。

表面上看這些數(shù)據(jù)大多數(shù)和金融無關(guān),但如果挖掘得當(dāng),能夠通過建立模型,給用戶勾勒出比較準(zhǔn)確的畫像。讓那些看似與風(fēng)險不太相關(guān)的數(shù)據(jù)在互聯(lián)網(wǎng)金融風(fēng)控的場景中體現(xiàn)價值。

四個角度告訴你,金融大數(shù)據(jù)到底用在了哪些地方

之所以要花這么大的篇幅去談三家的數(shù)據(jù)來源,主要還是因為今天無論是金融、電商、物流、生活服務(wù)等各個領(lǐng)域,其實都離不開維度全面的數(shù)據(jù)。

因為數(shù)據(jù)維度越豐富,對用戶粗顆粒的畫像就會越了解。某一個畫像的用戶到底喜歡什么,都可以一清二楚地了解到。企業(yè)也能夠面對做很多有針對性的營銷。

尤其是在金融領(lǐng)域,企業(yè)對大數(shù)據(jù)掌握越全面,所能涉及到的業(yè)務(wù)也會越豐富。BAT數(shù)據(jù)最豐富,在金融業(yè)務(wù)領(lǐng)域橫亙支付、貸款、理財、保險、證券、銀行、征信、基金、眾籌等各個領(lǐng)域。而小米、京東、萬達(dá)等企業(yè)因為體量、數(shù)據(jù)等相對而言優(yōu)勢不大,則會在這9個領(lǐng)域中缺失某些領(lǐng)域的布局。

BAT在9個領(lǐng)域的布局,其實都是以大數(shù)據(jù)為核心串聯(lián)在一起的。無論是征信、風(fēng)控、消費金融、財富管理都或多或少運用到了大數(shù)據(jù)。

1、大數(shù)據(jù)征信:在個人征信領(lǐng)域,目前是金融行業(yè)面臨的最大問題?;谟脩粼诨ヂ?lián)網(wǎng)上的消費行為、社交行為、搜索行為等產(chǎn)生的海量數(shù)據(jù),其價值并未被充分挖掘,個人征信在大數(shù)據(jù)的采集和信息挖掘上面仍有很大的想象空間。

阿里的芝麻信用在其中算是最會玩的。芝麻信用幾乎打通了用戶的身份特質(zhì),行為偏好,人脈關(guān)系,信用歷史,履約能力等各類信息。這恰恰是因為接入了電商、支付、社交等各類數(shù)據(jù)維度。

2、大數(shù)據(jù)風(fēng)控:大數(shù)據(jù)風(fēng)控目前應(yīng)該是前沿技術(shù)在金融領(lǐng)域的最成熟應(yīng)用,相對于智能投顧、區(qū)塊鏈等還在初期的金融科技應(yīng)用,大數(shù)據(jù)風(fēng)控目前已經(jīng)在業(yè)界逐步普及。目前,美國基本上都用三大征信局的信息,最傳統(tǒng)的評分基本上都是用FICO來做的。各家平臺會嘗試著用機器學(xué)習(xí)、神經(jīng)網(wǎng)絡(luò)等大數(shù)據(jù)處理方法。

國內(nèi)市場對于大數(shù)據(jù)風(fēng)控的嘗試還是比較積極。特別是大公司,可以將移動互聯(lián)網(wǎng)的行為和貸款申請人聯(lián)系到一起展開大數(shù)據(jù)風(fēng)控。百度在風(fēng)控層面上的進(jìn)展還是比較突出,百度安全每天要處理數(shù)十億網(wǎng)民搜索請求,保護(hù)數(shù)億用戶的終端安全,保護(hù)十萬網(wǎng)站的安全,因此積累了大量的數(shù)據(jù)。

一個很具體的案例就是,通過海量互聯(lián)網(wǎng)行為數(shù)據(jù),比如監(jiān)測相關(guān)設(shè)備ID在哪些借貸網(wǎng)站上進(jìn)行注冊、同一設(shè)備是否下載多個借貸App,可以實時發(fā)現(xiàn)多頭貸款的征兆,把風(fēng)險控制到最低。

3、大數(shù)據(jù)消費金融:消費金融對大數(shù)據(jù)的依賴是天然形成的。比如說消費貸、工薪貸、學(xué)生貸,這些消費型的金融貸款很依賴對用戶的了解。所以必須對用戶畫像進(jìn)行分析提煉,通過相關(guān)模型展開風(fēng)險評估,并根據(jù)模型及數(shù)據(jù)從多維度為用戶描繪一個立體化的畫像。

百度金融的優(yōu)勢在于,通過基于大數(shù)據(jù)和人工智能技術(shù)為基礎(chǔ)的合作商戶管理平臺,為合作商戶提供涵蓋營銷和金融服務(wù)的全面管理方案,降低獲客成本,解決細(xì)分行業(yè)的微小需求。一方面可以降低風(fēng)險,另一方面也能提升金融的安全度。

在大數(shù)據(jù)消費金融的領(lǐng)域中,騰訊和阿里的優(yōu)勢很大程度上是在渠道層面上的。正如前文所說的,阿里以電商-支付-信用為三級跳板,針對性很強支付寶接入消費金融產(chǎn)品之后會有較強的渠道作用。而在去年12月,騰訊的“微粒貸”已經(jīng)接入到了微信支付當(dāng)中。在消費金融的發(fā)展速度上,騰訊速度也不差。

4、大數(shù)據(jù)財富管理:財富管理是近些年來在我國金融服務(wù)業(yè)中出現(xiàn)的一個新業(yè)務(wù)。主要為客戶提供長期的投顧服務(wù),實現(xiàn)客戶資產(chǎn)的優(yōu)化配置。這方面業(yè)務(wù)在傳統(tǒng)金融機構(gòu)中存在的比較多。不過因為技術(shù)能力不足,大數(shù)據(jù)財富管理在傳統(tǒng)金融機構(gòu)中相對弱勢。

財富管理在互聯(lián)網(wǎng)公司的業(yè)務(wù)中也非常流行。螞蟻金服一開始最為簡單的財富管理方式就是余額寶,后來逐漸演化成經(jīng)過大數(shù)據(jù)計算智能推薦給用戶的各種標(biāo)準(zhǔn)化的“寶寶”理財產(chǎn)品。百度金融是依托“百度大腦”通過互聯(lián)網(wǎng)人工智能、大數(shù)據(jù)分析等手段,精準(zhǔn)識別和刻畫用戶,提供專業(yè)的“千人千面”的定制化財富管理服務(wù)。

金融大數(shù)據(jù)的孿生兄弟金融云是地基,未來更具看點

大數(shù)據(jù)和云計算永遠(yuǎn)都是相伴相隨的一對孿生兄弟。金融大數(shù)據(jù)核心工作包括三方面,即獲取數(shù)據(jù)、建立模型、模型在實踐中優(yōu)化、迭代。而對于金融大數(shù)據(jù)而言,金融云才是它的地基。

打個不恰當(dāng)?shù)谋确?,前文中說大數(shù)據(jù)是煤礦,而金融云其實就是礦井。礦井的安全行、可靠性決定了挖煤的效率和結(jié)果。

金融云把底層技術(shù)很多問題都解決了。大量金融模型都是金融云所引入的,如客戶模型、產(chǎn)品模型、賬務(wù)模型等。同時金融云關(guān)注金融本身的嚴(yán)謹(jǐn)性和周密性、安全性的考慮。

2016年7月,“騰訊云+未來”峰會上,騰訊云和騰訊金融云都已成為最重點部署的業(yè)務(wù)。同年9月,百度世界大會金融科技分論壇上,百度金融云正式向業(yè)界開放。10月,阿里云棲大會上,阿里金融云負(fù)責(zé)人則是提出將會和生態(tài)合作伙伴、服務(wù)聯(lián)盟為金融行業(yè)量身定制推出云增強服務(wù)。

大數(shù)據(jù)必須要跑在云端,而金融大數(shù)據(jù)更需要和業(yè)內(nèi)其他企業(yè)展開數(shù)據(jù)、支付、業(yè)務(wù)等一系列的合作。金融云對可用性、安全性的要求嚴(yán)格,比如說對一個高度可控可信的云安全體系而言,基礎(chǔ)環(huán)境安全、風(fēng)控與審計、數(shù)據(jù)安全三者缺一不可。而金融云在未來的競爭中將發(fā)揮越來越重要的作用。

極客網(wǎng)企業(yè)會員

免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進(jìn)一步核實,并對任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。

2017-02-13
BAT是如何運作金融大數(shù)據(jù)的?
新年開工,李彥宏的內(nèi)部信就在朋友圈中引發(fā)了一波刷屏。李彥宏說,“這樣一個時代,是很明顯的金融創(chuàng)新的新時代” ,這充分表明金融業(yè)務(wù)將是百度未來的四大方向之一。而他的一句“數(shù)據(jù)秒殺一切算法”,更是從側(cè)面透露了以大數(shù)據(jù)為代表的人工智能技術(shù)將成為百度金融的必殺技。

長按掃碼 閱讀全文