互金公司言必稱大數(shù)據(jù)風控,到底有幾分成色?

大數(shù)據(jù)風控是目前Fintech領域的主要應用,也是資本關注的焦點。很多互金公司都開發(fā)了大數(shù)據(jù)風控模型,業(yè)界也涌現(xiàn)了很多專門做大數(shù)據(jù)風控技術然后向業(yè)界輸出技術能力的技術型公司。然而,大數(shù)據(jù)風控有很強的技術壁壘,并非每家公司都能做好,不排除一些企業(yè)利用大數(shù)據(jù)風控的概念進行炒作。對于不懂技術的普通人而言,大數(shù)據(jù)風控的概念也是云里霧里。

那么,到底大數(shù)據(jù)風控是怎樣的,價值在哪里,又面臨哪些發(fā)展中的問題?

大數(shù)據(jù)風控已是互金公司的核心競爭力

大數(shù)據(jù)風控的價值已經(jīng)不用再多介紹了。這已經(jīng)成為互金公司的核心競爭力,也是互金區(qū)別于傳統(tǒng)金融的重要特征。互金公司能夠為傳統(tǒng)金融機構(gòu)所不能服務的人群提供普惠金融服務,基于大數(shù)據(jù)的風控手段功不可沒。通過全方位收集用戶的各項數(shù)據(jù)信息,并進行有效的建模、迭代,對用戶信用狀況進行評價,可以決定是否放貸以及放貸額度、貸款利率。

相比于傳統(tǒng)金融的風控模式,大數(shù)據(jù)風控可以通過機器的大規(guī)模數(shù)據(jù)運算,完成大量用戶的貸款申請審核工作,提升工作效率。傳統(tǒng)金融的審核由人工完成,效率會相對有限;大數(shù)據(jù)風控可以針對業(yè)務運行中出現(xiàn)的新情況、新數(shù)據(jù)進行快速迭代,增強模型的有效性;機器和軟件可以“24*365”模式工作,擺脫工作時間的限制。

互金公司發(fā)力大數(shù)據(jù)風控

目前很多互金公司都在做大數(shù)據(jù)風控,虎嗅之前的文章對BAT在消費金融業(yè)務進行盤點時總結(jié)了BAT在大數(shù)據(jù)風控方面的技術。京東也有相關的布局。BATJ的大數(shù)據(jù)風控技術

除了BATJ這樣的大公司,近年來新興起的已經(jīng)具備一定規(guī)模的互金公司也大力布局大數(shù)據(jù)風控,以網(wǎng)貸公司和貸款搜索平臺為主,大多推出了相關的大數(shù)據(jù)風控技術體系。國內(nèi)部分網(wǎng)貸公司與金融搜索公司的大數(shù)據(jù)風控技術

除此之外,還涌現(xiàn)了不少做大數(shù)據(jù)風控技術的金融科技公司,開發(fā)大數(shù)據(jù)反欺詐模型和信用評估模型,向資金端或資產(chǎn)端有資源的金融企業(yè)輸出技術。這類企業(yè)也不斷獲得資本青睞。統(tǒng)計顯示,近四個月內(nèi),至少有8家做大數(shù)據(jù)風控技術輸出的公司獲得融資,其中九次方大數(shù)據(jù)、51信用卡、用錢寶都已融到B輪以上。大數(shù)據(jù)風控技術領域投融資情況(按融資時間排序)

從以上幾個表格可以看出,從BAT這樣的大公司,到互金領域的創(chuàng)業(yè)公司,都在著力研發(fā)大數(shù)據(jù)風控技術。大數(shù)據(jù)風控的價值可見一斑。

大數(shù)據(jù)風控具體是怎樣的?

大數(shù)據(jù)風控模型的構(gòu)建,包含了明確模型目標、定義目標變量、確定樣本、確定分析技術、構(gòu)建模型、模型初步驗證、數(shù)據(jù)處理、模型迭代等環(huán)節(jié)。我們專訪了用錢寶CEO焦可等業(yè)內(nèi)人士后發(fā)現(xiàn),核心工作包括三方面,即獲取數(shù)據(jù)、建立模型、模型在實踐中優(yōu)化、迭代。

數(shù)據(jù)的來源

對于大數(shù)據(jù)風控業(yè)務而言,數(shù)據(jù)來源主要包括幾部分:

一是用戶申請時提交的數(shù)據(jù)信息,如年齡、性別、籍貫、收入狀況等,這些數(shù)據(jù)可以了解用戶的基本情況,驗證用戶的身份;

二是用戶在使用過程中產(chǎn)生的行為數(shù)據(jù),包括資料的更改、選填資料的順序、申請中使用的設備等,可以通過用戶的行為來進行特征挖掘;

三是用戶在平臺上累積的交易數(shù)據(jù),如果公司運營比較久的話,可以累積比較多的用戶借款相關數(shù)據(jù),這類數(shù)據(jù)對于判斷用戶信用會有很高的價值;

四是第三方數(shù)據(jù),包括來自政府、公用事業(yè)、銀行等機構(gòu)的數(shù)據(jù),以及用戶在電商、社交網(wǎng)絡、網(wǎng)絡新聞等互聯(lián)網(wǎng)應用上留存的數(shù)據(jù)。這類數(shù)據(jù)可以從多角度展示用戶的特征,利用這些數(shù)據(jù)進行建模分析,可以找出不同特征與信用水平之間的相關性。

數(shù)據(jù)的建模

數(shù)據(jù)是基礎,下一步要做的是構(gòu)建模型,對數(shù)據(jù)進行分析利用。數(shù)據(jù)本身沒有價值,數(shù)據(jù)中蘊含的信息有很大價值,這些信息可以逐步歸納為用戶的特征向量,這些特征可以分為強特征和弱特征,強特征是大而廣之的特征,如性別、年齡、籍貫、學歷、收入檔次等,弱特征可以認為是比較細微、小眾的特征,如喜歡晚上喝咖啡、經(jīng)常在早上打電話、半夜發(fā)朋友圈等,不同的特征與用戶的違約概率有或強或若的關系。

風控即風險控制,評估用戶可能的違約情況,主要包括反欺詐和信用評價兩部分。反欺詐是辨別那些一開始就想違約,進而弄虛作假的用戶,信用評價是對用戶的資信狀況進行評價,判斷其在借款到期后是否會因為無力還款而違約。這兩部分還可以繼續(xù)細分,如身份驗證、預付能力、還款意愿評估、還款能力評估、穩(wěn)定性評估等。

大數(shù)據(jù)風控模型構(gòu)建的兩個必要步驟,一是發(fā)現(xiàn)不同特征與違約之間是否有相關性,二是為不同的特征賦予權(quán)重或違約概率,以確定擁有多項特征的用戶的信用狀況,決定是否提供金融服務、具體的額度以及利率水平。

建模的技術主要包括logistic回歸、決策樹、普通線性回歸、分層分析、聚類分析、時間序列等機器學習算法,隨著人工智能技術的進步,神經(jīng)網(wǎng)絡、強化學習等前沿的算法也已經(jīng)運用到大數(shù)據(jù)建模過程中。

模型的應用與迭代

模型開發(fā)出來后,應用到具體的信貸等金融活動中,等若干個放款周期結(jié)束后,會有結(jié)果數(shù)據(jù)出來,這時候需要依據(jù)這些運營數(shù)據(jù)對模型進行修正,經(jīng)過一次次的迭代,模型的有效性、實用性會逐步提升。

例如,一家企業(yè)完成了100萬單的信貸記錄,這就意味著在貸款陸續(xù)到期后,其大數(shù)據(jù)風控體系將收獲100萬的數(shù)據(jù)樣本,這些數(shù)據(jù)樣本與用戶信用高度相關,具有很高的價值,使用這些數(shù)據(jù)對風控模型進行進一步的優(yōu)化,可以提升風控的有效性。由此可見,大數(shù)據(jù)風控需要與具體業(yè)務緊密結(jié)合,不斷“學習”,才能夠穩(wěn)定、可持續(xù)的升級,對業(yè)務有進一步的指導意義。

總體來說,目前大數(shù)據(jù)風控還在發(fā)展初期,未來行業(yè)一個可能的演化路徑是:一些擁有數(shù)據(jù)資源和技術算法優(yōu)勢的企業(yè)在市場規(guī)模上具備了一定優(yōu)勢后,擁有更多的數(shù)據(jù)資源來支持模型的優(yōu)化迭代,強化其技術優(yōu)勢,從而可以在控制風險的基礎上提高貸款申請的通過率,使自己技術支持下的交易規(guī)模越做越大。在不考慮黑天鵝事件的前提下,行業(yè)可能出現(xiàn)強者恒強的馬太效應。

如何判斷大數(shù)據(jù)風控的成色

幾乎所有的互金公司都在宣傳自己的大數(shù)據(jù)風控,這樣可以讓用戶更加放心,也給投資機構(gòu)講一個技術含量高的故事,但并非每個公司都有相應的能力。就算確實在開發(fā)大數(shù)據(jù)技術,能力也有高下之分。如何判斷一家互金公司的大數(shù)據(jù)風控技術的成色?

首先看團隊實力,團隊是否有足夠的技術人員,是否有相應的開發(fā)經(jīng)驗和履歷。技術團隊的規(guī)模與構(gòu)成是衡量其大數(shù)據(jù)能力的重要指標,這一點比較直觀。

其次,看公司的業(yè)務特征是否有使用的數(shù)據(jù)技術的必要。用錢寶CEO焦可認為,企業(yè)如果服務于足夠海量的用戶群體,交易頻次也足夠高頻,則有通過大數(shù)據(jù)技術提升運營能力的需要,也會有越來越大的數(shù)據(jù)支撐模型的迭代。

如果一家企業(yè)只是服務于有限的客戶,使用傳統(tǒng)的線下風控模式就可以,沒有使用大數(shù)據(jù)技術的必要,而且過程中無法產(chǎn)生大量的數(shù)據(jù),也就無法為模型提供數(shù)據(jù)支持,所以也就沒有使用大數(shù)據(jù)風控的可能性。例如,在P2P行業(yè),如果借款人都是機構(gòu),且都是大額融資標的,則大數(shù)據(jù)風控沒有用武之地,也沒有使用的必要。

另外,還要看經(jīng)營的時間長短。陸金所董事長計葵生曾表示,驗證一個大數(shù)據(jù)風控模型的有效性,至少需要5萬筆貸款進行驗證。如果業(yè)務經(jīng)營沒有多長時間,不會累積足夠的歷史數(shù)據(jù),也就無法對模型進行技術進行及時的迭代更新,其有效性也就面臨很大考驗。

大數(shù)據(jù)風控面臨哪些問題?

發(fā)展大數(shù)據(jù)風控無疑是行業(yè)必經(jīng)趨勢,但其發(fā)展道路肯定也不是一帆風順,還是面臨很多障礙和困境。

首先是數(shù)據(jù)源的問題。數(shù)據(jù)量需要進一步擴大,為模型提供訓練數(shù)據(jù)方面的支撐。對于一些缺乏信用數(shù)據(jù)的群體而言,目前很多線下行為都還沒有數(shù)據(jù)化,線上數(shù)據(jù)也比較有限,對于這類群體,各種行為線上化、數(shù)據(jù)化進而將數(shù)據(jù)結(jié)構(gòu)化,需要有一個過程。近些年來隨著智能手機與社交網(wǎng)絡應用的普及,很多缺乏信用數(shù)據(jù)的群體在線上有了一些數(shù)據(jù),但數(shù)據(jù)量還需要進一步增加。未來物聯(lián)網(wǎng)的發(fā)展可能帶來更豐富的數(shù)據(jù)信息,輔助進行風控決策。

其次是面對的欺詐行為層出不窮,不斷考驗模型的有效性。總會有想要騙貸的群體對反欺詐模型進行研究,尋找漏洞以騙取資金,各種偽造技術也助長其欺詐行為。一個模型出來以后,剛開始可能比較有效,但面對新出現(xiàn)的欺詐行為可能又缺乏辨別能力,導致模型精準度下降。這就需要大數(shù)據(jù)風控模型在試錯中不斷迭代,加入更多復雜特征和更多維度的特征。這對于大數(shù)據(jù)風控公司的技術能力是持續(xù)的考驗。

另外,大數(shù)據(jù)風控的發(fā)展要避免場景、行業(yè)、授信人群的集中化。企業(yè)做大數(shù)據(jù)風控,往往會選擇一個場景、垂直行業(yè)或細分人群進行切入,這樣可以將一個場景做深做透,深度分析、利用該領域的數(shù)據(jù),但從金融的規(guī)律看,信貸過于集中于某個領域可能帶來風險。讀秒CEO周靜表示,在做資產(chǎn)的時候,包括人群區(qū)域性、資產(chǎn)類別盡可能得做分散。零售信貸行業(yè)很多風險事件是因為行業(yè)對某一個群體人的過度的授信,導致風險延伸到整個經(jīng)濟。如果集中在某個場景或者某一類人群,風險可能越來越大,最終對行業(yè)市場有一個很大的沖擊。

免責聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網(wǎng)站對有關資料所引致的錯誤、不確或遺漏,概不負任何法律責任。任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關文章源頭核實,溝通刪除相關內(nèi)容或斷開相關鏈接。

2016-10-26
互金公司言必稱大數(shù)據(jù)風控,到底有幾分成色?
發(fā)展大數(shù)據(jù)風控無疑是行業(yè)必經(jīng)趨勢,但其發(fā)展道路肯定也不是一帆風順,還是面臨很多障礙和困境。

長按掃碼 閱讀全文