導讀
伴隨互聯(lián)網金融發(fā)展起來的大數據、征信等概念,今天已經被廣為人知。但與此同時,如何保護互聯(lián)網上的個人數據信息也成為亟待解決的問題。
中國金融四十人論壇(CF40)成員、央行金融研究所所長孫國峰近日撰文指出,大數據從互聯(lián)網應用場景向金融領域的轉移往往發(fā)生在一些金融科技企業(yè)的集團內部,這個過程缺乏監(jiān)管和規(guī)范,可能會侵犯到用戶的知情權、選擇權和隱私權,當前隱私數據保護的邊界不清晰。
當前,大數據在金融領域的應用主要包括大數據風控和大數據征信兩個方面。在發(fā)展過程中,金融大數據應用面臨的風險主要有四點。第一,一些金融科技巨頭憑借其在互聯(lián)網領域的固有優(yōu)勢,掌握了大量數據,客觀上可能會產生數據寡頭的現(xiàn)象,可能會帶來數據壟斷。第二,政府和企業(yè)都面臨數據孤島難題。第三,由于相關的法律法規(guī)體系尚不健全,數據交易存在許多不規(guī)范的地方,甚至出現(xiàn)數據非法交易和盜取信息的現(xiàn)象。大數據來源復雜多樣加大了用戶隱私泄露的風險。
針對上述金融大數據應用中存在的諸多問題,孫國峰認為,要充分發(fā)揮政府和市場的力量,從個人信息保護立法、信息共享機制建設、市場自律等多方入手,為金融大數據產業(yè)健康發(fā)展提供良好制度環(huán)境。
在制定個人信息保護的法律法規(guī)時,他認為,要系統(tǒng)考慮并解決以下問題:第一,可以在現(xiàn)有法律法規(guī)的基礎上,充分考慮大數據的實際發(fā)展,盡可能拓寬現(xiàn)有法律法規(guī)適用于大數據產業(yè)的業(yè)務規(guī)范的邊界;第二,要明確大數據的監(jiān)管機構,特別是金融大數據的監(jiān)管機構,界定其職能范圍并賦予其足夠的監(jiān)管權力;第三,要保護好大數據主體的權利,如數據主體的知情權、選擇權、訪問權、個人數據可攜權等;第四,要對數據控制者處理數據的行為邊界進行嚴格的界定,數據控制者必須依法合規(guī)地進行數據處理,規(guī)范從互聯(lián)網應用場景向金融領域的大數據轉移;第五,要對數據控制者等其他主體非法使用數據的相關行為進行明確的處罰規(guī)定等。
1、大數據在金融行業(yè)的應用
大數據指“無法在一定時間范圍內用常規(guī)工具進行捕捉、管理和處理的巨量數據集合”。傳統(tǒng)的數據集合往往是基于特定目的收集的,隨著新興信息技術的發(fā)展,互聯(lián)網移動終端越來越融入到日常生活和經濟行為之中,尤其是智能硬件和設備的普及,與出行、消費、娛樂、支付等相關的數據呈爆發(fā)式增長趨勢,互聯(lián)網企業(yè)積累了大量數據。這些數據從多個維度刻畫了經濟主體的行為特征,從中可以挖掘出許多額外的信息和關聯(lián)邏輯。傳統(tǒng)的數據庫軟件工具和數據分析方法無法在短時間內抓取、管理和處理大數據,不僅僅因為其規(guī)模大,還在于其復雜性,傳統(tǒng)數據一般都是結構化數據,而大數據往往包含大量非結構化數據,包括圖片、視頻、語音、地理位置等,并且數據都在實時更新中,云平臺、云計算、機器學習等技術的突破使得對大數據的分析成為可能。金融行業(yè)由于天然具有數據量大的優(yōu)勢,成為大數據應用的重要領域,具體主要包括大數據風控和大數據征信兩大方面:
大數據風控
金融是經營風險的行業(yè),風險控制能力是金融機構的核心競爭力。金融機構通過信用評分模型來定量計算貸款違約的可能性,確定違約的損失分布,以規(guī)避風險損失,并根據預測的風險水平進行利率定價。傳統(tǒng)的信用評分模型主要使用歷史借貸數據和財務數據來預測和判斷借款人的違約風險,采用傳統(tǒng)的統(tǒng)計方法進行分析,這種方法最大的缺陷就是無法對那些缺乏歷史借貸數據的借款人進行信用風險評估。在征信體系不完善的經濟體中會存在信貸供給不足的現(xiàn)象。我國央行征信系統(tǒng)雖然覆蓋了8億多人,但只有3億多人具有信貸歷史,傳統(tǒng)的風控技術對這部分信貸歷史記錄空白的群體是無效的。即便在征信業(yè)高度發(fā)達的美國,美國個人消費信用評估公司(FICO)評分也被批評信用評價標準過于單一,評估結果具有片面性,在時間上表現(xiàn)出嚴重的滯后性。
大數據風控是基于互聯(lián)網大數據,將數據挖掘、機器學習等大數據建模方法運用到貸前信用評審、反欺詐等風控管理環(huán)節(jié)。與傳統(tǒng)風控模型相比,大數據風控有三個基本特征:一是處理的數據種類多,更加多維度。大數據風控模型除了重視傳統(tǒng)的信貸變量之外,還納入了社交網絡信息等信息,為信貸記錄缺失的群體獲取基本金融服務提供了可能性。比如,ZsetFinance的數據來源非常廣泛,既包括傳統(tǒng)的信貸記錄等金融機構搜集的結構化數據,也包括法律記錄、交易信息、電子商務、社交信息等非傳統(tǒng)的數據和非結構化數據。二是關注行為數據,而不僅僅是歷史財務數據。傳統(tǒng)的信用評分模型變量均與反映被評價主體債務狀況和資金延付狀況等資金活動相關,但大數據信用評估更關注被評價主體的行為數據,在互聯(lián)網大數據時代,電子商務、社交網絡和用戶的搜索行為等大數據都映射著經濟主體的教育背景、工作經歷、社交圈子,這些信息與信用水平可能存在某種聯(lián)系。大數據技術是在充分考察借款人借款行為背后的線索和線索間的關聯(lián)性基礎上進行數據分析,降低貸款違約率。三是模型的建立是不斷迭代和動態(tài)調整的結果。大數據風控模型的輸入端是成千上萬的原始數據,然后基于機器學習等技術進行大數據挖掘,尋找數據間的關聯(lián)性,在關聯(lián)性基礎上將變量進行整合,轉換成測量指標,每一種指標反映借款人某一方面的特點,比如詐騙概率、信用風險、償還能力等。再將這些指標輸入不同的模型中,最后將模型結果按一定的權重加總,最終輸出的就是信用評分。在整個過程中,原始數據轉換成指標需要進行不斷的迭代,不同模型的權重值可以根據樣本進行動態(tài)調整。
越來越多的互聯(lián)網金融公司,特別是網絡借貸、互聯(lián)網消費金融等領域的公司開始利用大數據風控技術。2016年1月12日,美國的一家網貸平臺SOFI聲明不再將FICO評分納入信貸審批決策,另外一家為消費企業(yè)提供貸款的美國公司Kabbage則將亞馬遜、ebay等電子商務網站數據和Facebook、Twitter等社交網站數據納入風險評估模型之中,新興的互聯(lián)網金融公司ZestFinance聲稱一切數據皆信用。
大數據征信
風控與征信都是管理風險的活動,不同的是,風控一般是某一公司依靠企業(yè)自身的數據和資源進行風險管理,而征信是第三方機構“依法收集、整理、保存、加工自然人、法人及其他組織的信用信息,并對外提供信用報告、信用評估、信用信息咨詢等服務,幫助客戶判斷、控制信用風險,進行信用管理的活動”。
傳統(tǒng)的基于信貸歷史數據的風控技術背后是社會征信體系的建設。美國是世界上征信業(yè)較為發(fā)達的國家之一,一個重要原因是美國信用卡產業(yè)非常發(fā)達。美國的征信體系主要由三類機構組成,一是商業(yè)銀行和貸款機構,這些資金的貸出方在業(yè)務開展過程中積累了大量的關于客戶借款、還款和違約的歷史數據,這些都屬于信用的強相關變量,這些機構都會將這些信用歷史記錄傳給第二類機構,征信公司。美國有三家主要的征信公司,Experian、Equifax、TransUnion,主要負責搜集和儲存征信數據,包括從地方法院收集公共記錄信息和貸款機構收集逾期債務信息,并將數據進行清洗和處理后輸出標準化的數據產品,提供給銀行和其他金融機構,征信公司也會開發(fā)出一些信用評分產品。第三類機構就是專注于信用評分的公司,最著名的是FICO評分,主要作用是根據征信公司的信用報告,找到變量與違約概率之間的關系,即構建信用評價模型。銀行和其他金融機構可以根據FICO評分進行放貸決策。
中國的征信機構由中國人民銀行征信中心和其他民營征信機構組成。在互聯(lián)網時代,大數據在征信行業(yè)的應用帶來了大數據征信,就是指通過采集個人或企業(yè)在互聯(lián)網交易、從事互聯(lián)網業(yè)務以及使用互聯(lián)網服務過程中留存下來的信息數據,并結合線下渠道采集的相關信息,利用云計算等技術手段進行信用評估和評價的活動。
國內從事大數據征信的機構主要由四類:一是電商類平臺,將平臺上積累的用戶行為數據進行采集、整理和加工,并經過深度挖掘和評估,為合作的金融機構信貸審批提供風險定價服務;二是P2P網絡借貸類,通過自建客戶信用系統(tǒng),用于自身平臺撮合的投融資業(yè)務;三是以網絡金融征信系統(tǒng)、小額信貸行業(yè)信用信息共享服務平臺為代表的同業(yè)信息數據庫,通過采集P2P平臺借貸兩端客戶的個人基本信息、貸款申請及還款等信息,向加入該數據庫的P2P機構提供查詢服務;四是互聯(lián)網大數據公司,通過收集、整理、保存來源于第三方的互聯(lián)網數據,運用分析模型和信用評分技術,形成符合客戶需要的征信報告、評級報告等產品,提供給第三方客戶。
大數據征信在我國有很大的發(fā)展?jié)摿?,一方面,中國的征信體系覆蓋面仍然有限。據波士頓咨詢公司測算,截至2015年底,中國個人征信的覆蓋率只有35%,與美國個人征信體系92%的覆蓋率相差甚遠。另一方面,中國的互聯(lián)網尤其是移動互聯(lián)網發(fā)展迅速,移動終端累積了海量的用戶行為數據,這些網絡交易和社交平臺積累的數據為彌補信用記錄空白主體的信用評估數據非常重要。
從風控、征信等角度看,大數據在金融行業(yè)的應用前景廣闊,但在發(fā)展的過程中也需要注意到存在的風險。
2、金融大數據應用面臨的風險
金融科技巨頭可能產生數據壟斷
一些金融科技巨頭憑借其在互聯(lián)網領域的固有優(yōu)勢,掌握了大量數據,客觀上可能會產生數據寡頭的現(xiàn)象,可能會帶來數據壟斷。一些機構掌握了核心的信用數據資源,有的機構掌握電商交易數據和金融數據,有的機構掌握集團的傳統(tǒng)金融機構和互聯(lián)網金融平臺的金融數據,有的機構則依托大股東掌握大量線下交易數據,還通過合作的方式掌握了合作企業(yè)的數據。由于缺乏分享的激勵機制,導致與征信的共享理念存在沖突。
存在數據孤島現(xiàn)象,數據融合困難
政府和企業(yè)都面臨數據孤島難題。大數據時代,數據已經成為核心資源,企業(yè)出于保護商業(yè)機密或者節(jié)約數據整理成本的考慮而不愿意共享自身數據,一些政府部門也缺乏數據公開的動力。數據孤島現(xiàn)象的存在,將導致大數據信用評估模型采用的數據維度和算法的不同,大數據征信模型的公信力和可比性容易遭到質疑。
數據安全和個人隱私保護難度升級
目前,大數據的獲取大致有四種方法:自有平臺積累、通過交易或合作獲取、通過技術手段獲取、用戶自己提交的數據等。但是由于相關的法律法規(guī)體系尚不健全,數據交易存在許多不規(guī)范的地方,甚至出現(xiàn)數據非法交易和盜取信息的現(xiàn)象。大數據來源復雜多樣加大了用戶隱私泄露的風險,其一,我國金融大數據行業(yè)的發(fā)展乃至Fintech行業(yè)的發(fā)展,在很大程度上得益于互聯(lián)網應用場景的發(fā)展,而大數據從互聯(lián)網應用場景向金融領域的轉移往往發(fā)生在一些金融科技企業(yè)的集團內部,這個過程缺乏監(jiān)管和規(guī)范,可能會侵犯到用戶的知情權、選擇權和隱私權。其二,應用數據存在多重交易和多方接入的可能性,隱私數據保護的邊界不清晰;其三,技術手段的加入,加大了信息獲取的隱蔽性,一旦出現(xiàn)隱私泄露糾紛,用戶將面臨取證難、訴訟難的問題;其四,大數據采集數據的標準不一,用戶的知情權、隱私權可能受到侵犯。可見,在大數據環(huán)境下,個人數據應用的隱私保護是一個復雜的消費者權益保護問題,涉及到道德、法律、技術等諸多領域。
3、加強對金融大數據應用的監(jiān)管
針對金融大數據應用中存在的諸多問題,要充分發(fā)揮政府和市場的力量,從個人信息保護立法、信息共享機制建設、市場自律等多方入手,為金融大數據產業(yè)健康發(fā)展提供良好制度環(huán)境。
建立并完善個人信息保護的法律制度體系
通過建立個人信息保護的法律制度體系,使大數據產業(yè)在數據采集、加工整合以及使用等多個環(huán)節(jié)能夠依法合規(guī)的發(fā)展。在制定個人信息保護的法律法規(guī)時,要系統(tǒng)考慮并解決以下問題:第一,可以在現(xiàn)有法律法規(guī)的基礎上,充分考慮大數據的實際發(fā)展,盡可能拓寬現(xiàn)有法律法規(guī)適用于大數據產業(yè)的業(yè)務規(guī)范的邊界;第二,要明確大數據的監(jiān)管機構,特別是金融大數據的監(jiān)管機構,界定其職能范圍并賦予其足夠的監(jiān)管權力;第三,要保護好大數據主體的權利,如數據主體的知情權、選擇權、訪問權、個人數據可攜權等;第四,要對數據控制者處理數據的行為邊界進行嚴格的界定,數據控制者必須依法合規(guī)地進行數據處理,規(guī)范從互聯(lián)網應用場景向金融領域的大數據轉移;第五,要對數據控制者等其他主體非法使用數據的相關行為進行明確的處罰規(guī)定等。
加快信息共享機制的建設
推動政府信息公開和行業(yè)之間的信息共享,打破數據壁壘,發(fā)揮大數據推動各個行業(yè)升級和轉型的作用,促進降低信息等多方面的成本,提高經濟效率和社會福利。第一,進一步完善個人信息保護的法律法規(guī),以此避免信息共享帶來的數據安全和個人隱私泄露等問題。第二,打破數據壟斷,對大數據進行分級管理,將政府掌握的大數據界定為公共品,依法合規(guī)向社會開放分享;將機構掌握的涉及到公共利益的大數據界定為準公共品,持有這類大數據的機構必須在保護好個人隱私等條件下分享其數據;主要涉及到商業(yè)利益的大數據界定為非公共品,對這類大數據也要推動其在合法使用的范圍內進行交易。第三,還需要推動大數據標準化,使政府信息和不同行業(yè)之間的數據可以交互式使用,打破信息共享過程中面臨的技術壁壘。
發(fā)揮行業(yè)自律組織作用
行業(yè)自律組織可以在規(guī)范行業(yè)內部大數據的使用等方面發(fā)揮作用。首先,行業(yè)自律組織可以積極制定大數據信息采集、使用標準,探索大數據信息數據庫的安全管理標準和異議處理機制,引導規(guī)范大數據產業(yè)發(fā)展,保護信息主體的權益。其次,行業(yè)自律組織有利于推動大數據標準化。標準真實的大數據是人工智能大數據分析的基礎,行業(yè)自律組織可以積極牽頭或者配合監(jiān)管機構制定大數據標準,并整合不同行業(yè)的大數據。
- 蜜度索驥:以跨模態(tài)檢索技術助力“企宣”向上生長
- 馬云現(xiàn)身支付寶20周年紀念日:AI將改變一切,但不意味著決定一切
- 萬事達卡推出反欺詐AI模型 金融科技擁抱生成式AI
- OpenAI創(chuàng)始人的世界幣懸了?高調收集虹膜數據引來歐洲監(jiān)管調查
- 華為孟晚舟最新演講:長風萬里鵬正舉,勇立潮頭智為先
- 華為全球智慧金融峰會2023在上海開幕 攜手共建數智金融未來
- 移動支付發(fā)展超預期:2022年交易額1.3萬億美元 注冊賬戶16億
- 定位“敏捷的財務收支管理平臺”,合思品牌升級發(fā)布會上釋放了哪些信號?
- 分貝通商旅+費控+支付一體化戰(zhàn)略發(fā)布,一個平臺管理企業(yè)所有費用支出
- IMF經濟學家:加密資產背后的技術可以改善支付,增進公益
- 2022年加密貨幣“殺豬盤”涉案金額超20億美元 英國銀行業(yè)祭出限額措施
免責聲明:本網站內容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網站出現(xiàn)的信息,均僅供參考。本網站將盡力確保所提供信息的準確性及可靠性,但不保證有關資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網站對有關資料所引致的錯誤、不確或遺漏,概不負任何法律責任。任何單位或個人認為本網站中的網頁或鏈接內容可能涉嫌侵犯其知識產權或存在不實內容時,應及時向本網站提出書面權利通知或不實情況說明,并提供身份證明、權屬證明及詳細侵權或不實情況證明。本網站在收到上述法律文件后,將會依法盡快聯(lián)系相關文章源頭核實,溝通刪除相關內容或斷開相關鏈接。