假期剛過,易鑫集團產品部經理王楊一大早就坐在電腦前,開始整理十一期間的運營數據。各條事業(yè)線、上百個產品、不同渠道,還有一些重要的測試期產品需要呈現更多細節(jié)。這個工作量,以往需要一個數據分析團隊花費一整天的時間才能完成,而在易鑫智能數據倉庫(以下簡稱“智能數倉”)的支持下,只要短短30分鐘。
“智能數倉”的作用不僅在提升數據分析的效率。作為一家專業(yè)的汽車金融交易平臺,易鑫集團累計實現的汽車金融交易量已超過200萬臺,是數十家銀行等金融機構的合作伙伴。在平臺紛繁忙碌的日常運營中,“智能數倉”的存在猶如“核心大腦”,為多業(yè)務體系穩(wěn)定高效的運行提供了最強有力的科技保障。
從“散裝”數據,到自建“智能數倉”
徐飛是易鑫“智能數倉”項目的第一位員工。彼時的易鑫,還沒有一個真正意義上的“數據倉庫”,眾多業(yè)務數據被“散裝”在幾十個互不相通的業(yè)務操作系統(tǒng)中,只能通過手工報表導入信息。數據標準不統(tǒng)一,靠“手工”管理的表格極易出現錯漏,嚴重制約了業(yè)務的進一步發(fā)展。
作為國內首批從事大數據平臺建設、應用研發(fā)的專業(yè)人員,徐飛不僅參與過多家大型互聯網企業(yè)的數據中心構建,還有一段不短的創(chuàng)業(yè)經歷,幫助過眾多中小型互聯網公司構建獨立中心數據倉庫,這使得他在自建易鑫“智能數倉”的工作中,能給出更精準的設計和前瞻性的戰(zhàn)略布局。
“和互聯網公司匯集海量用戶的行為數據不同,易鑫是以業(yè)務數據為主,對數據平臺的安全性、穩(wěn)定性和數據精準度、可用易用性要求更高;同時,公司多業(yè)務并行,數據橫跨多個系統(tǒng)、鏈條拉得很長,口徑不統(tǒng)一、標準不兼容,第三方商業(yè)數據庫沒法完全滿足需求;作為一家平臺化發(fā)展的企業(yè),系統(tǒng)必須具備支持多項目運行的復雜運算和無限擴容的能力,以滿足隨著業(yè)務增長、未來數據處理量幾倍、甚至上百倍增長的要求。”
徐飛說:“綜合考察各種商業(yè)數據庫的方案,也參考了互聯網企業(yè)經驗,我們發(fā)現自建數倉是最‘慢’、最‘費力’,但也最‘扎實’的解決方案。”
上圖:易鑫“智能數倉”團隊在工作中
構建深入業(yè)務的“核心大腦”
同一團隊的老秦曾參與過新浪等互聯網公司的數據倉庫建設。在他眼中,易鑫自建“智能數倉”,至少要具備三方面能力:首先,有統(tǒng)一的輸入輸出標準,能夠支持海量多源異構數據的靈活存儲和高效計算;其次,能夠構建橫跨多個業(yè)務系統(tǒng)的通用數據標準,實現對跨平臺數據的有效組織和貫通;第三,具備加工數據產品和提供數據服務的能力,有支持統(tǒng)計、分析、挖掘等的中臺操作模塊,可以基于SLA標準對外穩(wěn)定輸出。
為了解決存儲和擴容問題,團隊用互聯網公司標準,搭建了基于Hadoop框架的分布式計算存儲平臺,輔以領域內先進的Flink/Spark實時計算引擎,建立起包含100多個節(jié)點的服務器布局,讓系統(tǒng)可以無限擴容的同時,還具有了大批量的離線數據處理及“秒級”計算能力。然后,系統(tǒng)抓取易鑫近百個系統(tǒng)中的源數據,并進行全面“清洗”,再根據業(yè)務邏輯將數據按照“業(yè)務對象”、“業(yè)務周期”、“用戶”等不同主題模型化,進行分門別類的存儲。“就像把不同工廠生產的衣物鞋帽,按照上衣、下裝、鞋襪、配件等打上分類標簽,或者按照男人、女人、小孩等適用場景分到不同倉庫中,讓數據井然有序。”老秦解釋說。
“當中最難的,是如何將分屬不同系統(tǒng)中的數據,劃歸到統(tǒng)一的標準口徑下。”作為“智能數倉”核心數據工程師的馬維直言,來易鑫之前,自己從未如此貼近過業(yè)務:“互聯網公司的數據,都是IP、瀏覽等定義清晰的字段。但在易鑫,各個汽車金融業(yè)務之間并沒有百分百的對應關系,每當業(yè)務系統(tǒng)出現一個新字段,都需要重新定義。”
她舉例說,比如客戶流失率,易鑫風控審核的多級漏斗是一個自行設計的業(yè)務流程,很難從歷史數據庫中找到準確匹配的字段。系統(tǒng)按照自定義的內容提供了客戶流失數據,很快被業(yè)務部門發(fā)現不符合常理。經過“智能數倉”技術團隊和業(yè)務端反復比對數據源后,最終找到了原因,隨后又從源頭重新定義數據指標,這才得出了合理結果。“因為沒有歷史參照,數據指標很難一次性定義得非常準確,我們需要大量的數據做驗證。這在小型汽車金融企業(yè)是無法辦到的。”馬維說。
目前,易鑫“智能數倉”每天接收并處理來自近百個業(yè)務系統(tǒng)的大約1.5TB數據,并行處理超過1萬個計算任務;多種維度的數據,可以通過手機、PC端實時展示,或處理為既定指標和數據包,定期發(fā)送到各個業(yè)務端,以支持公司各個層面的業(yè)務運作,成為名副其實的“核心大腦”。
上圖:易鑫“智能數倉”團隊在討論問題
從數據平臺到數據服務中臺
福珍是易鑫資產管理部經理,需要以日為單位統(tǒng)計資產質量情況。之前她只能通過手工表格的方式傳遞信息,現在只需在系統(tǒng)中輕輕一點,“智能數倉”中的BI模塊就能按照她設定的規(guī)則,隨時展現匯總結果。這一切得益于“智能數倉”開發(fā)的數據中臺服務。
為滿足業(yè)務部門對數據的使用要求,目前“智能數倉”提供了三種形式的數據服務。通過易鑫的“通天曉”服務端,用戶可以看到上百種不同維度、不同口徑的數據,滿足各個業(yè)務部門對定制數據的要求;而在BI平臺提供的數據中臺,福珍這樣的業(yè)務人員可根據需要自定義數據規(guī)則,設計屬于自己的數據報表。此外,“智能數倉”還支持向公司十數個業(yè)務系統(tǒng)提供統(tǒng)一標準的數據接口,按照既定規(guī)則自動向業(yè)務系統(tǒng)派發(fā)作業(yè)任務。
“我們希望將‘技術’數倉向‘業(yè)務’數倉轉變。為此,我們正在搭建業(yè)務中臺,開發(fā)各種輔助工具讓普通業(yè)務人員經過簡單技能培訓,就能更方便地通過‘智能數倉’進行工作。”徐飛介紹,目前易鑫已開發(fā)出多項輔助支持工具,如“數詢”,可以讓使用者快速查詢獲取數據;“數語”提供所有數據的精確描述,能夠幫助業(yè)務人員追索數據源頭和流向;“數診”則能根據自定義規(guī)則對字段內容準確性進行評估、診斷、預警等。
更多使用者,意味著更大的風險存在。汽車金融行業(yè)的特性,要求系統(tǒng)對消費者個人信息進行嚴格的保護。為此,易鑫從2018年開始就嚴格規(guī)范系統(tǒng)內對消費者個人信息的使用。在業(yè)務端,所有個人信息提取都必須進過授權,進入“智能數倉”系統(tǒng)內的消費者敏感信息都進行了分級、加密和脫敏處理,所有對外輸出信息都用加密字段進行傳輸,最大可能地保護了數據的安全使用和消費者信息不外泄。
在徐飛心中,“智能數倉”不是一種產品而是一種服務,是易鑫在服務200多萬客戶基礎上,錘煉出的一種基于汽車金融場景的智能數據服務。它的高效、穩(wěn)定運營,可精準展現各個業(yè)務的關鍵環(huán)節(jié)信息,幫助業(yè)務端更快、更高效地服務于消費者。
上圖:易鑫“智能數倉”團隊部分成員
數據賦能業(yè)務,驅動企業(yè)成長
數據賦能業(yè)務的成果正在展現。借助“智能數倉”提供的數據支持,易鑫的技術部門重新定義了風控標準,將原本“一刀切”的審核標準改為基于一定風險系數配比的綜合考量模型。經評估,客戶的履約表現明顯優(yōu)于同期行業(yè)整體水平;易鑫產品部也在依托資方分析模塊的數據,和資方合作伙伴一起探討新的金融方案,比如向客戶提供更有彈性的汽車融資方案,以滿足多元化、個性化的消費者需求。
“‘智能數倉’是易鑫智能商業(yè)的基礎設施。自確定‘Tech+Fin’的發(fā)展戰(zhàn)略以來,易鑫一直致力于將‘數據提供的知識’應用到經營分析和管理決策中,將汽車金融業(yè)務的運營由傳統(tǒng)的‘人治’變?yōu)橛蓹C器和算法管理的新模式。”易鑫CTO賈志峰說:“就我們所調研和了解的范圍來看,易鑫‘智能數倉’的業(yè)務和服務能力已經能夠滿足現有汽車金融企業(yè)的各項需求,甚至具備相當程度的跨行業(yè)數據管理能力。我們也正在和行業(yè)頭部的金融機構、汽車廠商,和互聯網公司開拓新的業(yè)務模式,希望提高彼此的運營效率,達到行業(yè)共贏。”
沿著“Tech+Fin”的核心發(fā)展思路,易鑫正在積極從行業(yè)‘先行者’往‘播種者’的角色轉換,通過輸出技術能力,來提升汽車金融行業(yè)整體數據智能化管理水平,將是易鑫的下一個目標。
(免責聲明:本網站內容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網站出現的信息,均僅供參考。本網站將盡力確保所提供信息的準確性及可靠性,但不保證有關資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網站對有關資料所引致的錯誤、不確或遺漏,概不負任何法律責任。
任何單位或個人認為本網站中的網頁或鏈接內容可能涉嫌侵犯其知識產權或存在不實內容時,應及時向本網站提出書面權利通知或不實情況說明,并提供身份證明、權屬證明及詳細侵權或不實情況證明。本網站在收到上述法律文件后,將會依法盡快聯系相關文章源頭核實,溝通刪除相關內容或斷開相關鏈接。 )