科學(xué)的風(fēng)控評(píng)估體系

第一節(jié) 大數(shù)據(jù)風(fēng)控現(xiàn)狀

目前,大數(shù)據(jù)風(fēng)控似乎已經(jīng)成為互聯(lián)網(wǎng)金融企業(yè)的必備宣傳點(diǎn)。凡提及自己的風(fēng)控體系,好像不提大數(shù)據(jù)都不好意思見(jiàn)人。連"E租寶"這樣的龐氏騙局企業(yè),在宣傳中也號(hào)稱"引領(lǐng)大數(shù)據(jù)在行業(yè)信用管理和風(fēng)控防范之中的應(yīng)用趨勢(shì)"。但除了空洞的宣傳外,行業(yè)內(nèi)對(duì)于如何落地大數(shù)據(jù)風(fēng)控并沒(méi)有給出合理可信的解釋。

在很多情況下,大數(shù)據(jù)風(fēng)控目前更像一群處男在談?wù)撔?,大家都沒(méi)有做過(guò),大家又表現(xiàn)的好像都做過(guò),大家都在談?wù)撍?,但其?shí)都不知道到底體驗(yàn)是什么。

當(dāng)然,我們也看到了優(yōu)秀的互聯(lián)網(wǎng)金融公司組建了大數(shù)據(jù)團(tuán)隊(duì),開(kāi)展了大數(shù)據(jù)風(fēng)控的探索。比例,利用知識(shí)圖譜在社交數(shù)據(jù)上做欺詐分析,利用邏輯回歸,支持向量機(jī)(SVM),決策樹(shù)等模型補(bǔ)充或替代傳統(tǒng)的打分卡,在更廣泛的數(shù)據(jù)源上進(jìn)行建模分析等。

第二節(jié) 大數(shù)據(jù)風(fēng)控落地路漫漫

然而,大數(shù)據(jù)風(fēng)控建設(shè)的道路還很遠(yuǎn)。原因有如下幾點(diǎn)。

一、不同的消費(fèi)場(chǎng)景下,客戶客群的特征是不一樣的,收集到的客戶信息差異可能很大,這些大數(shù)據(jù)方法的有效性前提就受到質(zhì)疑。比如,針對(duì)熱愛(ài)社交的80、90后年輕群體,能夠爬取到有價(jià)值的社交數(shù)據(jù),知識(shí)圖譜就能發(fā)揮出一些價(jià)值。但針對(duì)貸款主流群體的60后來(lái)說(shuō),這些人用社交網(wǎng)絡(luò)的非常少,"巧婦難為無(wú)米之炊",這種方法就難有用武之地。

二、在中國(guó)目前的信用體系下,貸款審批的衡量是很復(fù)雜的。反欺詐能力,額度評(píng)估能力與催收手段等綜合起來(lái),共同決定了風(fēng)險(xiǎn)決策的能力。大數(shù)據(jù)在這些能力上的落地探索,還處于非常初期的階段。在不同的場(chǎng)景下,有些可能是反欺詐的決定性更強(qiáng)些,有些可能是額度的評(píng)定更強(qiáng)些,有些可能是催收的手段來(lái)的更直接。拋開(kāi)具體的貸款場(chǎng)景談?wù)擄L(fēng)控的大數(shù)據(jù)技術(shù),是有失偏頗的。

三、算法都是有適用性和局限性的,不是說(shuō)看起來(lái)炫的方法就一定更有效,有沒(méi)有效果,要看療效。但療效到底如何,不做是不知道的。

四、大數(shù)據(jù)算法的難以解釋性,導(dǎo)致了算法落地的困難。比如,用SVM作出的模型可能從歷史數(shù)據(jù)上顯示是更好的,但是為什么會(huì)更好卻無(wú)法解釋,也無(wú)法保證是否在將來(lái)的業(yè)務(wù)中表現(xiàn)也好。同時(shí),模型對(duì)金融產(chǎn)品是有指導(dǎo)意義的,如果模型本身不可解釋,則對(duì)也會(huì)對(duì)產(chǎn)品的設(shè)計(jì)和推廣帶來(lái)障礙。

五,傳統(tǒng)的金融產(chǎn)品,如房貸,車貸等,一定意義上也是大數(shù)據(jù)決策的。人工的風(fēng)控決策方法,是信審人員長(zhǎng)期與不良借款人斗智斗勇的結(jié)晶,是人的智慧對(duì)大數(shù)據(jù)的總結(jié)。數(shù)據(jù)挖掘算法在與人的經(jīng)驗(yàn)的結(jié)合和PK的過(guò)程中,難以快速勝出。

大數(shù)據(jù)風(fēng)控的顛覆性效果,現(xiàn)階段更多的體現(xiàn)在創(chuàng)新型的金融產(chǎn)品上,比如淘寶和京東的分期服務(wù),針對(duì)學(xué)生的3C分期服務(wù),針對(duì)高速場(chǎng)景下貨車的分期服務(wù)等。

同時(shí),大數(shù)據(jù)風(fēng)控的投入,卻是很大的。無(wú)論從基礎(chǔ)的設(shè)施投入、系統(tǒng)研發(fā),到昂貴的大數(shù)據(jù)人才的雇用,再到負(fù)樣本(壞賬)的積累,都是巨大的投入。當(dāng)企業(yè)的老板沒(méi)有高瞻遠(yuǎn)矚到愿意持續(xù)無(wú)悔的砸錢投入,當(dāng)企業(yè)的技術(shù)人才沒(méi)有過(guò)硬到一定能排除萬(wàn)難取得最終的勝利,大數(shù)據(jù)的產(chǎn)出都存在很大的未知數(shù)。這些未知數(shù)讓很多老板望而卻步。

如何能讓大數(shù)據(jù)風(fēng)控切實(shí)落地,產(chǎn)生實(shí)實(shí)在在的價(jià)值,不僅僅是大數(shù)據(jù)技術(shù)專家思考的核心問(wèn)題,更是金融公司老板所關(guān)切的重要問(wèn)題。

不幸的是,這些老板決策了對(duì)大數(shù)據(jù)技術(shù)的投資,并承擔(dān)了最終的結(jié)果(壞賬,以及對(duì)技術(shù)投資的回報(bào)率(ROI)),而他們往往對(duì)技術(shù)并不能深入的了解。如何高效地在這個(gè)領(lǐng)域進(jìn)行資源的投入,是眼下的當(dāng)務(wù)之急。

第三節(jié):建立效果評(píng)估體系,循序漸進(jìn)開(kāi)展大數(shù)據(jù)風(fēng)控

大數(shù)據(jù)風(fēng)控是未來(lái),但落地的困境又這么多,扭轉(zhuǎn)局面的關(guān)鍵點(diǎn)在哪里?這個(gè)關(guān)鍵點(diǎn),應(yīng)該是在建立廣泛認(rèn)可的效果評(píng)估體系,然后在效果評(píng)估的框架下面,逐步推動(dòng)大數(shù)據(jù)技術(shù)的普及。這個(gè)效果評(píng)估體系,將具備如下的特征。

一、指標(biāo)的制定是服務(wù)階段性商業(yè)目標(biāo)的。在產(chǎn)品上線的階段,有放貸限額,小范圍試錯(cuò);而業(yè)務(wù)成熟階段,則會(huì)追求更高的批過(guò)率和更低的壞賬率,并尋求兩者之間最佳平衡。

二、用量化指標(biāo)進(jìn)行衡量。也就是說(shuō),大數(shù)據(jù)風(fēng)控作為風(fēng)控的方法,應(yīng)該用清晰的指標(biāo)來(lái)衡量取得的成果。

三、指標(biāo)的物理含義是一般人都能理解的。只有讓為投入買單的老板們理解了大數(shù)據(jù)風(fēng)控的衡量指標(biāo),他們才能作出決策以開(kāi)展持續(xù)的技術(shù)投入。

四、指標(biāo)是完備的。比如,實(shí)施了一種大數(shù)據(jù)風(fēng)控技術(shù),可能帶來(lái)壞賬率的下降,但同時(shí)也可能帶來(lái)批過(guò)率的下降。雖然壞賬少了,但業(yè)務(wù)量也降低了。但從"得"的指標(biāo)上衡量,是沒(méi)有意義的。要"得"與"失"結(jié)合起來(lái),根據(jù)企業(yè)不同的發(fā)展階段,選擇不同的技術(shù)。

在該評(píng)估體系下,老板們將能清晰地衡量具體的風(fēng)控技術(shù)來(lái)帶的ROI,然后決策該采用什么樣的技術(shù)手段。在有清晰的產(chǎn)出預(yù)期下,大數(shù)據(jù)風(fēng)控的投入就可以有循漸進(jìn)的執(zhí)行。企業(yè)將不再困惑于各種難以理解的模型算法,而是把它們當(dāng)成工具,然后選擇最優(yōu)的算法即可。也就是說(shuō),在有邏輯回歸,支持向量機(jī),深度學(xué)習(xí)等多種方法候選的情況下,任何一種方法都可能有自己適用的人群。方法之間沒(méi)有優(yōu)劣之分,只有誰(shuí)更適合。

第四節(jié):建立模型評(píng)估體系

基于大數(shù)據(jù)的思想,人們提出了很多模型(支持向量機(jī),邏輯回歸,深度學(xué)習(xí)等)來(lái)做風(fēng)控系統(tǒng)。同一種模型用不同的模型參數(shù)又可以橫向衍生出很多新的模型。 那么在眾多的數(shù)學(xué)模型中,怎樣知道應(yīng)該使用那一種模型呢? 模型評(píng)估體系的建設(shè)就顯得尤為重要。 通常評(píng)估一個(gè)模型的好壞應(yīng)該從模型的三個(gè)屬性去評(píng)估。他們分別是模型的

a.精確性:在預(yù)測(cè)狀態(tài)變量時(shí),模型必須有一定的精確性

b.穩(wěn)健性:模型應(yīng)該對(duì)于目標(biāo)總體中的所有樣本都有效,而不僅僅是對(duì)開(kāi)發(fā)測(cè)試樣本有效

c.合理性:模型表現(xiàn)出來(lái)的趨勢(shì)對(duì)于觀測(cè)到的行為必須有意義。

在這里我們主要講講模型的精確性。KS值、洛倫茲曲線(ROC)是被廣泛使用的模型精確性評(píng)估指標(biāo)。在統(tǒng)計(jì)學(xué)中,KS值是用來(lái)衡量模型的區(qū)分能力。通俗來(lái)講就是模型區(qū)分好客戶與壞客戶的能力。好客戶是指守約客戶,壞客戶是指違約客戶。KS值越大,模型的識(shí)別能力就越強(qiáng),反之,就越弱。ROC曲線的作用是衡量信貸模型的目標(biāo)累積強(qiáng)度。這里的目標(biāo)是指違約客戶,通俗來(lái)講ROC曲線的凸度大小反應(yīng)了模型識(shí)別壞客戶的能力。凸度越大說(shuō)明模型越優(yōu)秀如:在20%的總體人群中就能夠辨別出60%的所有違約人群。ROC曲線凸度大小和KS值大小是正相關(guān)關(guān)系。ROC曲線的凸度越大,相對(duì)應(yīng)模型的KS值就越大。這些指標(biāo)有助于多個(gè)模型甄別,模型參數(shù)優(yōu)化的情況。即便對(duì)于當(dāng)前來(lái)看不錯(cuò)的模型,我們也應(yīng)該定期檢驗(yàn)?zāi)P偷闹匾u(píng)估指標(biāo)。評(píng)估體系的建立固然重要但同時(shí)也要充分認(rèn)識(shí)模型的局限性。在利用模型制定信貸策略時(shí),我們應(yīng)該信奉‘實(shí)踐是檢驗(yàn)真理的唯一標(biāo)準(zhǔn)’。

第五節(jié):行業(yè)內(nèi)公司現(xiàn)狀及未來(lái)展望

北京數(shù)云普惠科技有限公司致力于向消費(fèi)金融公司普及大數(shù)據(jù)技術(shù),提供標(biāo)準(zhǔn)化、模塊化、易用的大數(shù)據(jù)風(fēng)控系統(tǒng)以降低消費(fèi)金融企業(yè)客戶使用大數(shù)據(jù)技術(shù)的資金成本和技術(shù)門檻。其創(chuàng)始人海歸博士孫林和首席科學(xué)家海歸博士付亞博認(rèn)為,困擾企業(yè)進(jìn)行大數(shù)據(jù)技術(shù)投入的因素,不僅包括技術(shù)的難度和領(lǐng)導(dǎo)者的判斷,更多的來(lái)自于技術(shù)本身對(duì)既有業(yè)務(wù)管理體系和決策層知識(shí)結(jié)構(gòu)的挑戰(zhàn)。它像一把雙刃劍,如果用的不好,可能會(huì)對(duì)企業(yè)的業(yè)務(wù)帶來(lái)混亂和災(zāi)難。明確的效果評(píng)估體系,能給大數(shù)據(jù)風(fēng)控技術(shù)落地帶來(lái)有效的指導(dǎo)和管控,把業(yè)務(wù)的開(kāi)展統(tǒng)一到一個(gè)目標(biāo)體系上來(lái)。當(dāng)大數(shù)據(jù)風(fēng)控的應(yīng)用能夠達(dá)到投入即能改善業(yè)務(wù)效果時(shí),公司的發(fā)展就能進(jìn)入一個(gè)良性的循環(huán)。當(dāng)企業(yè)的業(yè)務(wù)都管理在一個(gè)大數(shù)據(jù)系統(tǒng)中的時(shí)候,企業(yè)的客戶資源,數(shù)據(jù)資產(chǎn)等都不再受限于某一個(gè)員工角色,人員流失等對(duì)企業(yè)的影響就會(huì)越來(lái)越小,也會(huì)減輕管理的難度。

優(yōu)信金融作為優(yōu)信拍旗下二手車消費(fèi)金融公司,在大數(shù)據(jù)風(fēng)控應(yīng)用上有長(zhǎng)期的積累和探索,其CRO倪驥先生認(rèn)為當(dāng)前使用大數(shù)據(jù)進(jìn)行風(fēng)控還有很多困難。1,目前大數(shù)據(jù)還不夠大。很多數(shù)據(jù)在覆蓋率上能達(dá)到50%已經(jīng)是驚喜了。2,傳統(tǒng)的風(fēng)險(xiǎn)模型都需要違約數(shù)據(jù)的積累,中小型互聯(lián)網(wǎng)金融機(jī)構(gòu)在時(shí)間成本和資金成本都難以承受。因此,互聯(lián)網(wǎng)金融企業(yè)相當(dāng)需要與征信服務(wù)公司和數(shù)據(jù)提供商的多方位合作以提升在數(shù)據(jù)積累和建模等多方面的能力。

未來(lái),在“談消風(fēng)聲”公眾號(hào)里,我們將推出一個(gè)系列的文章,通俗易懂地講解大數(shù)據(jù)風(fēng)控的效果評(píng)估指標(biāo)。第一篇,我們將從“混淆矩陣”開(kāi)始講起,具體內(nèi)容,在“談消風(fēng)聲”公眾號(hào)里回復(fù)“混淆矩陣”即可獲得。

免責(zé)聲明:本網(wǎng)站內(nèi)容主要來(lái)自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁(yè)或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書(shū)面權(quán)利通知或不實(shí)情況說(shuō)明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開(kāi)相關(guān)鏈接。

2016-03-15
科學(xué)的風(fēng)控評(píng)估體系
第一節(jié) 大數(shù)據(jù)風(fēng)控現(xiàn)狀目前,大數(shù)據(jù)風(fēng)控似乎已經(jīng)成為互聯(lián)網(wǎng)金融企業(yè)的必備宣傳點(diǎn)。凡提及自己的風(fēng)控體系,好像不提大數(shù)據(jù)都不好意思見(jiàn)人。連 "E租寶 "這樣的龐氏騙局企業(yè),在宣傳中也號(hào)稱 "引領(lǐng)大數(shù)據(jù)在行業(yè)信用管理和風(fēng)控防范之中的應(yīng)用趨勢(shì) "。但除了空洞的宣傳外,行業(yè)內(nèi)對(duì)于如何落地

長(zhǎng)按掃碼 閱讀全文