互金風(fēng)控進(jìn)化史:人工、實(shí)地到智能大數(shù)據(jù)走過(guò)哪些曲折?

今天大家都已經(jīng)習(xí)慣了線上秒批、數(shù)字信用等基于人工智能和大數(shù)據(jù)的風(fēng)控體系。但是追溯到十幾年前,數(shù)字風(fēng)控卻付出過(guò)慘重的代價(jià)。十幾年一路走來(lái),隨著大數(shù)據(jù)以及人工智能等技術(shù)的不斷完善,互聯(lián)網(wǎng)金融才真正讓大數(shù)據(jù)風(fēng)控走向完美。

日前,在玖富集團(tuán)開(kāi)放日上,玖富首席數(shù)據(jù)科學(xué)家、首席風(fēng)險(xiǎn)官谷穎講解了人工智能的應(yīng)用要素和發(fā)展階段,揭示了智能風(fēng)控的進(jìn)化史。

(玖富集團(tuán)開(kāi)放日)

從互聯(lián)網(wǎng)金融祖師爺?shù)目宓粽f(shuō)起

NextCard是互聯(lián)網(wǎng)金融行業(yè)繞不過(guò)的一個(gè)案例。這家公司堪稱互聯(lián)網(wǎng)金融的祖師爺。NextCard總部設(shè)在舊金山,通過(guò)互聯(lián)網(wǎng)發(fā)放信用卡的公司。公司提供一套VISA卡網(wǎng)上信用審批系統(tǒng),并為使用者申請(qǐng)者提供互動(dòng)服務(wù)。

(維基百科關(guān)于NextCard的介紹)

在這家公司的征信體系之中,信用資料較少的申請(qǐng)人,只需在這里存有一定額度的存款,就可申請(qǐng)到信用卡。和今天很多互聯(lián)網(wǎng)金融項(xiàng)目相似,NextCard主打短平快借貸,在當(dāng)時(shí)備受美國(guó)用戶的喜愛(ài)。從1996年推出到2001年的第三季度,NextCard積累了120萬(wàn)個(gè)信用卡賬戶,未償余額達(dá)20億美元,其成本卻比傳統(tǒng)做法低70%。

NextCard幾乎擁有今天互聯(lián)網(wǎng)金融企業(yè)的所有特點(diǎn),甚至今天很多中國(guó)互聯(lián)網(wǎng)金融項(xiàng)目都與之相似。不過(guò),遺憾的是,2002年9月,NextCard遭到聯(lián)邦證券監(jiān)察機(jī)構(gòu)的調(diào)查并宣告破產(chǎn)。破產(chǎn)的最大原因是因?yàn)樵摴镜目蛻糁饕际且恍┍黄渌刨J機(jī)構(gòu)拒絕的消費(fèi)者,導(dǎo)致欺詐、壞賬的激增。

然而,NextCard把許多屬于客戶故意拖欠不還的普通信用壞賬歸為“欺詐”損失(“欺詐”損失被歸納于一次性損失,財(cái)務(wù)上不需要相應(yīng)的儲(chǔ)備金),它需要大量增加儲(chǔ)備金來(lái)預(yù)備將來(lái)的信用損失,導(dǎo)致其喪失流動(dòng)資金,不得不宣布破產(chǎn)。

回到15年前來(lái)看,NextCard錯(cuò)誤很明顯,主要是這三點(diǎn):

1、在征信把關(guān)層面上就已經(jīng)出現(xiàn)了漏洞

對(duì)于美國(guó)銀行來(lái)說(shuō),影響審批額度的主要因素包括客戶基本特征(包括男女、年齡、教育程度等等)、客戶風(fēng)險(xiǎn)暴露情況(社會(huì)收入、債務(wù)情況、還債能力綜合評(píng)估)、現(xiàn)有的社會(huì)表現(xiàn)(房貸還款情況、其他銀行信用卡使用情況等)。但NextCard高估了人性,明顯對(duì)用戶的信用水準(zhǔn)期待過(guò)高,忽略了信用欺詐的嚴(yán)重性,導(dǎo)致公司破產(chǎn)。

2、在風(fēng)控層面上也缺乏合理的預(yù)警機(jī)制

按道理來(lái)說(shuō),在公司出現(xiàn)壞賬時(shí),應(yīng)該加強(qiáng)儲(chǔ)備金,以此抵御風(fēng)險(xiǎn),但是NextCard幾乎沒(méi)有設(shè)置壞賬紅線,甚至也沒(méi)有為壞賬準(zhǔn)備對(duì)沖風(fēng)險(xiǎn)的儲(chǔ)備金,僅僅只是把壞賬歸納為一次性損失,這樣的損失過(guò)多的情況下,最終只會(huì)導(dǎo)致壞賬如滾雪球一般越滾越大。

3、迷信線上審批,缺乏線下人工風(fēng)控把關(guān)

在那個(gè)時(shí)代,線下人工把關(guān)是風(fēng)控不可缺少的一環(huán),很多小微企業(yè)的信貸甚至需要風(fēng)控人員到現(xiàn)場(chǎng)查看生產(chǎn)現(xiàn)場(chǎng),結(jié)合生產(chǎn)工藝,了解生產(chǎn)組織情況,固定資產(chǎn)更新情況。風(fēng)控不僅僅是資本和金融層面的事情,更需要真正深入到產(chǎn)業(yè)之中,去了解一家企業(yè)的運(yùn)行狀況。顯然,NextCard缺乏對(duì)線下的把控,以至于全盤(pán)皆輸。

“人肉”風(fēng)控的必不可少與邏輯悖論

NextCard的垮掉本質(zhì)上是線上風(fēng)控、征信技術(shù)有限,無(wú)法戰(zhàn)勝人工的結(jié)果。在傳統(tǒng)金融機(jī)構(gòu)、小貸公司中,不僅僅有一整套嚴(yán)格的審核標(biāo)準(zhǔn),需要貸款人提供各式各樣繁瑣的資料,而且風(fēng)控人員甚至還會(huì)自己的經(jīng)驗(yàn)判斷,在面對(duì)一些特定行為特征、生活習(xí)慣的客戶會(huì)首先有一個(gè)自己的直觀打分判斷,這些是長(zhǎng)期經(jīng)驗(yàn)累積的結(jié)果。想要拿到一筆貸款,金融機(jī)構(gòu)、貸款公司會(huì)付出很高的人力、物力、時(shí)間成本。

玖富作為中國(guó)最早的互聯(lián)網(wǎng)金融服務(wù)公司之一,如今已經(jīng)有11年的歷史,在行內(nèi)頗受好評(píng)。這家金融服務(wù)公司當(dāng)年為確保資產(chǎn)項(xiàng)目的真實(shí)、安全、可控,通過(guò)非常嚴(yán)格的完整審核體系的層層篩選,內(nèi)部建立了獨(dú)立的線上風(fēng)控模型,并引入了實(shí)地征信風(fēng)控合作。

不過(guò),實(shí)地風(fēng)控體系依然會(huì)存在各式各樣的邏輯悖論。

對(duì)于金融企業(yè)來(lái)說(shuō),風(fēng)控模型和風(fēng)控體系需要非常有經(jīng)驗(yàn)的金融從業(yè)人士來(lái)進(jìn)行把控,比如說(shuō),銀行的風(fēng)控模型的出發(fā)點(diǎn)主要是測(cè)量借款方的還款能力,一般來(lái)講,模型包含了兩部分的評(píng)判,即客觀性的和主觀性的。客觀性的主要是數(shù)據(jù)類型,能量化的。如公司的年度審計(jì)財(cái)務(wù)報(bào)告,銀行流水,繳稅金額等,這些數(shù)據(jù)放在已設(shè)定好的模型里就能給出個(gè)分?jǐn)?shù)或等級(jí),做為參考。

但光靠客觀數(shù)據(jù)還不夠,比如說(shuō)這公司所在的行業(yè)是淘汰落后的行業(yè)(如鋼鐵、水泥等),那么評(píng)級(jí)可能需要有些降級(jí),再比如說(shuō)公司的管理人在該行業(yè)的經(jīng)驗(yàn)?zāi)晗薜拈L(zhǎng)短,都會(huì)影響到這家公司的風(fēng)險(xiǎn),所以這部分就得靠人為主觀的去做些調(diào)整。

因此,人在傳統(tǒng)風(fēng)控體系中起到了很大的作用。比如說(shuō),需要人工標(biāo)記壞樣本的方式來(lái)記錄壞樣本訂單號(hào),人工通過(guò)相關(guān)黑信息關(guān)聯(lián)找出來(lái)的標(biāo)記樣本。系統(tǒng)設(shè)計(jì)是盡可能多的和并且盡可能精準(zhǔn)的的收集到壞樣本。

但是人畢竟是計(jì)算能力有限,而且對(duì)復(fù)雜的征信環(huán)境缺乏整體把控能力。在人工審核過(guò)程中,很容易出現(xiàn)樣品偏差的問(wèn)題。比如說(shuō),你發(fā)現(xiàn)騙子符合某些聚集特征,你指定策略1進(jìn)行打擊后,騙子的這種欺詐手段被控制,以后的損失案例都不具備這樣的聚集特征。如果壞樣本的收集時(shí)間在策略1上線之后,這個(gè)時(shí)候模型訓(xùn)練的結(jié)果極有可能出現(xiàn)滿足聚集特征的風(fēng)險(xiǎn)低,不滿足聚集特征的交易反而風(fēng)險(xiǎn)高,也就是說(shuō)聚集特征的權(quán)重是負(fù)數(shù)。

另一個(gè)問(wèn)題在于,金融行業(yè)的勞動(dòng)力成本正在逐年上升。在傳統(tǒng)金融尤其是傳統(tǒng)信貸服務(wù)領(lǐng)域,我國(guó)傳統(tǒng)信貸能服務(wù)的客戶群僅占總?cè)丝诘?5%左右。傳統(tǒng)信貸服務(wù)需要依托線下網(wǎng)點(diǎn)展開(kāi),資質(zhì)審核、合同簽訂等流程都需面對(duì)面進(jìn)行,服務(wù)效率低下,最終的結(jié)果是一方面風(fēng)控人員不足,另一方面是單純的線下人肉風(fēng)控也缺乏對(duì)風(fēng)控體系的百分百把控。

智能風(fēng)控三階段究竟解決了哪些問(wèn)題

對(duì)此的應(yīng)對(duì)方案是兩個(gè):一是引入在金融領(lǐng)域?qū)τ谡餍朋w系有能力建構(gòu)一整套完整風(fēng)控模型的人;第二個(gè)才是把大數(shù)據(jù)、人工智能引入到征信體系之中,進(jìn)行智能風(fēng)控。

今天BAT三巨頭上手互聯(lián)網(wǎng)金融的時(shí)候,幾乎都在不斷引入能夠駕馭風(fēng)控模型的人,以此根據(jù)不同行業(yè),不同數(shù)據(jù)建構(gòu)起不同的風(fēng)控模型。玖富也在不斷引入風(fēng)控模型的把關(guān)人,比如說(shuō)首席數(shù)據(jù)科學(xué)家兼首席風(fēng)控官谷穎。谷穎博士在回國(guó)之前曾在華爾街投行工作達(dá)十年之久,其團(tuán)隊(duì)更連續(xù)六年在全美固定收益策略、量化研究領(lǐng)域排名第一。而且在一批成熟金融人才的研發(fā)下,玖富也構(gòu)建起了“火眼”風(fēng)控系統(tǒng)。

玖富的“火眼”風(fēng)控系統(tǒng)形成了線上化、機(jī)器化、模塊化的風(fēng)控構(gòu)架體系。充分利用大數(shù)據(jù)分析技術(shù)建立獨(dú)特的風(fēng)控體系,具有處理高效、風(fēng)險(xiǎn)可控、成本低、邊際效應(yīng)明顯等特點(diǎn),能夠可以提早發(fā)現(xiàn)用戶早期逾期表現(xiàn),并能有更多的時(shí)間進(jìn)行調(diào)整。

根據(jù)她的說(shuō)法,人工智能應(yīng)用在金融領(lǐng)域有三個(gè)階段。第一個(gè)階段是機(jī)器學(xué)習(xí)(ML)階段,即互聯(lián)網(wǎng)金融為代表的金融機(jī)構(gòu)全面滲透到所有模型建設(shè)中;第二個(gè)階段是自然語(yǔ)言處理(NLP)階段,即國(guó)內(nèi)大量互聯(lián)網(wǎng)貸款和征信公司都在大量使用自然語(yǔ)言處理技術(shù);第三個(gè)階段是知識(shí)圖譜(KG)階段,即大量使用知識(shí)圖譜進(jìn)行反欺詐分析?!盎鹧邸憋L(fēng)控系統(tǒng)恰恰覆蓋了這三個(gè)階段的所有應(yīng)用,也是目前比較完善的風(fēng)控系統(tǒng)。

機(jī)器學(xué)習(xí)(ML)階段解決的核心問(wèn)題在于,讓風(fēng)控模型自動(dòng)學(xué)習(xí)、自動(dòng)匹配各項(xiàng)數(shù)據(jù),在模型內(nèi)發(fā)現(xiàn)異常,揪出信用黑戶。尤其是機(jī)器學(xué)習(xí)算法能夠根據(jù)數(shù)百萬(wàn)消費(fèi)者案例,如:資產(chǎn)、履約、身份、偏好、社會(huì)關(guān)系及借貸情況等進(jìn)行開(kāi)發(fā)和訓(xùn)練,利用算法評(píng)估預(yù)測(cè)用戶是否會(huì)違約、是否會(huì)按時(shí)歸還貸款等。

自然語(yǔ)言處理(NLP)階段解決的問(wèn)題則是可以在個(gè)人及企業(yè)主頁(yè)、社交媒體中發(fā)現(xiàn)蘊(yùn)含著與違約風(fēng)險(xiǎn)深度關(guān)聯(lián)的深層含義,通過(guò)復(fù)雜的詞向量模型將文本轉(zhuǎn)化為計(jì)算機(jī)能夠識(shí)別和計(jì)算的詞向量表征,并基于深度學(xué)習(xí)技術(shù)對(duì)其進(jìn)行特征提取,最終運(yùn)用成熟的分類器網(wǎng)絡(luò)將文本數(shù)據(jù)與違約風(fēng)險(xiǎn)實(shí)現(xiàn)高度的風(fēng)險(xiǎn)掛鉤,而通過(guò)傳統(tǒng)方式很難充分挖掘其風(fēng)險(xiǎn)價(jià)值。

知識(shí)圖譜反欺詐(KG)分析恰恰是最重要的一個(gè)環(huán)節(jié),因?yàn)橹R(shí)圖譜反欺詐需要把所有技術(shù)融合在一起,構(gòu)建圖譜,從中發(fā)現(xiàn)欺詐行為。這也是很多互聯(lián)網(wǎng)金融公司目前在主攻的方向。

因?yàn)樵谶^(guò)去,反欺詐人員需要根據(jù)借款人提供的信息,查找多方面資料,進(jìn)行不同屬性的比對(duì),從而發(fā)現(xiàn)不良征信人。這種工作復(fù)雜而枯燥,為了識(shí)別團(tuán)伙欺詐,往往需要收集、整理、分析各種維度的數(shù)據(jù),工作量更是成倍增加。而知識(shí)圖譜反欺詐能夠把把每個(gè)客戶的信息、以及網(wǎng)絡(luò)上公開(kāi)的信息織成一張巨大的關(guān)系網(wǎng),并通過(guò)可視化的圖形將這種關(guān)系展示出來(lái)。結(jié)合反欺詐部門(mén)的經(jīng)驗(yàn),找存在欺詐的客戶。

寫(xiě)在最后:

雖然如今大部分平臺(tái)都在采用“大數(shù)據(jù)技術(shù)”來(lái)做風(fēng)控,但審核結(jié)果嚴(yán)重趨同,現(xiàn)狀不容樂(lè)觀。真正大數(shù)據(jù)風(fēng)控技術(shù)需要多云數(shù)據(jù)源(平臺(tái)積累、征信機(jī)構(gòu)、同業(yè)共享)來(lái)支持風(fēng)控審核模型決策,這恰恰是中國(guó)互聯(lián)網(wǎng)金融企業(yè)最需要發(fā)展的方向,也是必然需要走過(guò)的曲折道路。

免責(zé)聲明:本網(wǎng)站內(nèi)容主要來(lái)自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁(yè)或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書(shū)面權(quán)利通知或不實(shí)情況說(shuō)明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開(kāi)相關(guān)鏈接。

2017-06-15
互金風(fēng)控進(jìn)化史:人工、實(shí)地到智能大數(shù)據(jù)走過(guò)哪些曲折?
今天大家都已經(jīng)習(xí)慣了線上秒批、數(shù)字信用等基于人工智能和大數(shù)據(jù)的風(fēng)控體系。但是追溯到十幾年前,數(shù)字風(fēng)控卻付出過(guò)慘重的代價(jià)。

長(zhǎng)按掃碼 閱讀全文