數(shù)據(jù)管理的演進:從響應業(yè)務到創(chuàng)造業(yè)務

企業(yè)對數(shù)據(jù)的利用有三個階段:響應運營,響應業(yè)務,創(chuàng)造業(yè)務。數(shù)據(jù)中臺解決的是響應業(yè)務的問題,第三階段“創(chuàng)造業(yè)務”,則需要AI中臺。

數(shù)據(jù)中臺的意義

數(shù)據(jù)中臺對一個企業(yè),起著至關重要的作用。在數(shù)據(jù)中臺這個稱謂成型之前,各個企業(yè)也都在用不同的方式來盡可能地利用數(shù)據(jù)產生價值。只是在這個過程中,也不得不處理著數(shù)據(jù)帶來的各種問題,比如各個業(yè)務系統(tǒng)經(jīng)年累月以煙囪架構形式存在而導致的數(shù)據(jù)孤島、數(shù)據(jù)隔離、數(shù)據(jù)不一致等等。因為這些問題實在是過于繁雜,企業(yè)開始建立數(shù)據(jù)團隊,或者數(shù)據(jù)部分開始繼續(xù)數(shù)據(jù)整頓工作,因此數(shù)據(jù)倉庫、數(shù)據(jù)湖、主數(shù)據(jù)治理等一系列的工作職能應運而生。

本質上,這些工作都是因為業(yè)務需要不得不進行的一系列數(shù)據(jù)治理的動作,對于如何利用數(shù)據(jù)來發(fā)力,并沒有形成一個強有力的底座。有點像“頭痛醫(yī)頭、腳痛醫(yī)腳”:各個業(yè)務系統(tǒng)規(guī)范不一致了,于是開展了元數(shù)據(jù)治理;數(shù)據(jù)分析的時候數(shù)據(jù)關聯(lián)不上了,于是不得不進行主數(shù)據(jù)治理。

這樣的數(shù)據(jù)治理工作在進行了很多年后,數(shù)據(jù)中臺這個概念逐漸有人提出了,阿里的《企業(yè)IT轉型直到:阿里巴巴中臺戰(zhàn)略思想與架構實踐》這本書更是把用中臺戰(zhàn)略把這個概念推向了一個極致。中臺戰(zhàn)略中,人們常說:大中臺,小前臺。在這種模式下,頻繁出現(xiàn)的字眼是:共享。那么,到底共享的是什么?答案便是數(shù)據(jù)的服務。中臺戰(zhàn)略,并不是搭建一個數(shù)據(jù)平臺,但是中臺的大部分服務都是圍繞數(shù)據(jù)而生,更加巧妙的地方是中臺戰(zhàn)略讓數(shù)據(jù)在數(shù)據(jù)平臺和業(yè)務系統(tǒng)之間形成了一個良性的閉環(huán)。于是,數(shù)據(jù)和業(yè)務系統(tǒng)融為了一體。

(圖1 數(shù)據(jù)中臺所解決的問題)

過去,數(shù)據(jù)依賴于手工進行,沒有軟件;有了數(shù)據(jù)中臺,以功能驅動,固定的數(shù)據(jù)輸入,得到固定的數(shù)據(jù)輸出,構建出能用的服務變得更快速、更加的標準化,解決了業(yè)務側的“能用”問題。但是,如何以固定的輸入,以產生更靈活多變的輸出,提供比如個性化的服務,做到“好用”,數(shù)據(jù)中臺并沒有給出答案。

在建立了數(shù)據(jù)中臺架構之后,我們逐步認識到,原來數(shù)據(jù)的價值并不只是個運營出個參考的分析報表,做一系列的預算。數(shù)據(jù)中臺為大型企業(yè)數(shù)據(jù)利用最大化提供了一個初始的參照方向。當我們發(fā)現(xiàn),深度學習、機器學習等等一系列技術開始在這個平臺下施展拳腳的時候,我們可能已經(jīng)清晰地認識到:中臺并不是數(shù)據(jù)分析利用的終點。

企業(yè)利用數(shù)據(jù)的三個發(fā)展階段

如果回顧數(shù)據(jù)分析的歷程,可以歸納發(fā)現(xiàn)數(shù)據(jù)利用大概有如下三個階段:

響應運營

響應業(yè)務

創(chuàng)造業(yè)務

(圖2 企業(yè)對數(shù)據(jù)的利用,有三個發(fā)展階段)

第一階段:響應運營

響應運營是數(shù)據(jù)分析最直接也是最原始的訴求。沒有誰不不會關心自己的用戶留存率,沒有誰不關心自己的營收額;出現(xiàn)了故障、如何分析定位,如何預測預防,運用數(shù)據(jù)分析自然不過。但是在運營分析過程中,也發(fā)現(xiàn)了另外一系列的問題,比如各個業(yè)務系統(tǒng)的數(shù)據(jù)存儲格式、存儲介質都不相同,在進行基本的運營分析的時候,無法流暢的進行。此時,不得不進行一系列的數(shù)據(jù)治理。常見的主數(shù)據(jù)、元數(shù)據(jù)治理就是發(fā)生在這個階段,只是數(shù)據(jù)倉庫將主數(shù)據(jù)和元數(shù)據(jù)治理進行了規(guī)范化。

第二階段:響應業(yè)務

數(shù)據(jù)分析停留在運營階段的時候,對企業(yè)來講最大的感受就是投入產出比不對稱。這個問題在大數(shù)據(jù)爆發(fā)的時間點上,更為凸顯。例如在今天的業(yè)務場景下,傳統(tǒng)的數(shù)據(jù)倉庫已經(jīng)解決不了海量數(shù)據(jù)、異構數(shù)據(jù)等一系列問題,而大行其道的大數(shù)據(jù)分析技術,硬件要求高、學習門檻高。要實施一個大數(shù)據(jù)平臺,成立一個大數(shù)據(jù)團隊,這是一個不小的成本開銷,更何況現(xiàn)在有不少數(shù)據(jù)分析團隊要借助機器學習等手段,來對數(shù)據(jù)做分析來響應運營,這導致基礎設施成本、整體門檻進一步提高。

于是像數(shù)據(jù)中臺這樣的思想就被提了出來:既然數(shù)據(jù)是從業(yè)務系統(tǒng)產生的,那么是否業(yè)務系統(tǒng)也需要數(shù)據(jù)分析結果呢?對于數(shù)據(jù)平臺來說,數(shù)據(jù)平臺本身提供兩大能力:數(shù)據(jù)存儲和數(shù)據(jù)計算的能力。那么業(yè)務系統(tǒng)的數(shù)據(jù)存儲和數(shù)據(jù)計算能力是否可以剝離到數(shù)據(jù)平臺,僅僅讓業(yè)務系統(tǒng)很輕量的維護自己的業(yè)務流程操作?所以利用中臺剝離了復雜的業(yè)務環(huán)境,再配合微服務等技術,一下子讓人感受到了“數(shù)據(jù)服務的共享”。

而對業(yè)務場景來說,很多時候是需要數(shù)據(jù)服務的,例如用戶的基本信息管理、用戶的行為數(shù)據(jù)分析,這些數(shù)據(jù)不但可以暴露給業(yè)務系統(tǒng)使用,甚至可以直接丟給終端用戶自行使用。類似這種契合點,讓數(shù)據(jù)平臺變成了一個服務,提供給業(yè)務系統(tǒng)。而對數(shù)據(jù)服務的使用者來說,在消費數(shù)據(jù)的同時也在繼續(xù)產生數(shù)據(jù),這樣在數(shù)據(jù)平臺和業(yè)務系統(tǒng)之間就構成了一個良性的閉環(huán)。

第三階段:創(chuàng)造業(yè)務

業(yè)務不會總停滯不前,因為人的生活會改變,想要的體驗會改變。過去,大家到視頻平臺看視頻,利用通用的數(shù)據(jù)服務,不同的用戶看到的視頻推薦都是一樣的;很快,我們就會發(fā)現(xiàn)根據(jù)用戶的偏好,推薦個性化的視頻幾乎是必不可少的體驗要求。然后,我們就開始思考:數(shù)據(jù)是否可以變成個性化服務提供給終端用戶?這是一個非常簡單、常見的例子。當這樣的個性化數(shù)據(jù)服務越來越多之后,各種服務不斷組合,就會創(chuàng)造出很多可能性,進而提供創(chuàng)新的個性化體驗和新的業(yè)務模式,這就是數(shù)據(jù)服務用于創(chuàng)造業(yè)務的階段。

雖然有了數(shù)據(jù)中臺,但是當有大規(guī)模的、基于智能算法的數(shù)據(jù)服務需要落地實現(xiàn)時,依然會碰到以下挑戰(zhàn)。

如何對規(guī)?;闹悄芊者M行管理:當只是零星三兩個智能服務的時候,通過手動人工管理等方式,不會有太大的問題;然則,當智能服務成千上萬的時候,如何管理、如何構建、如何高效維護,就會成為很大的麻煩。

沒有良好的工程實踐來保證質量和流暢性:對于常規(guī)的應用軟件開發(fā)我們有TDD、自動化測試、CI/CD等成熟的工程實踐做保障;但是在智能服務這一塊,無論是編程開發(fā)、還是服務構建,都沒有成熟的工程實踐,也沒有良好的基礎設施支撐,非常依賴于構建這個服務的數(shù)據(jù)工程師的個人能力,導致在實施過程中,問題難以復現(xiàn),難于定位。

數(shù)據(jù)安全、治理和數(shù)據(jù)量不充分:數(shù)據(jù)中臺的價值點,在于提供了數(shù)據(jù)的計算和存儲的能力,但是在智能服務構建下,光有計算和存儲還不夠。治理到什么程度的數(shù)據(jù),才能較好的支撐服務的構建?個性化的服務與數(shù)據(jù)安全沖突的時候,如何抉擇?數(shù)據(jù)量不足導致算法模型泛化能力太差,怎么辦?

(圖3 創(chuàng)造業(yè)務階段,數(shù)據(jù)中臺面臨的挑戰(zhàn))

從數(shù)據(jù)中臺到AI中臺

什么是AI中臺?

數(shù)據(jù)中臺本身還是圍繞數(shù)據(jù)服務來進行的,而非圍繞智能服務來進行的。未來的操作系統(tǒng),一定會越來越個性化,甚至每一個人看到的登錄界面都不一樣,系統(tǒng)可以根據(jù)對應的終端用戶自行呈現(xiàn)符合該用戶習慣的系統(tǒng)界面。那么對于這樣的場景和服務,我們需要怎樣的平臺?整個軟件開發(fā)架構和流程是否也都會相應重造?

回到創(chuàng)造業(yè)務的需求。以簡單的銷售業(yè)務為例,數(shù)據(jù)中臺提供的服務本質如下圖所示:

(圖4 軟件平臺的業(yè)務模式)

這是目前最常見的軟件平臺的運作方式,開發(fā)人員開發(fā)出了對應的軟件服務后,提供給終端用戶使用,雖然會有銷售售賣該服務。這種方式,好比是拿著一個錘子找釘子,而不是給釘子快速制作一把合適的錘子再去售賣。

能不能這樣:將整個軟件組裝出來的服務,包裝成個性化的產品一樣去售賣,提供量身定做的服務?那么整個運營模式就變成:平臺提供了一種快速構建智能服務的過程,服務售賣者利用這個平臺,自己動手構建出服務,拿出去售賣,類似一個提供“智能業(yè)務服務的PaaS”。

(圖5 引入AI中臺的軟件平臺業(yè)務模式)

如果嘗試給AI中臺下個定義:

AI中臺是一個用來構建大規(guī)模智能服務的基礎設施,對企業(yè)需要的算法模型提供了分步構建和全生命周期管理的服務,讓企業(yè)可以將自己的業(yè)務不斷下沉為一個個算法模型,以達到復用、組合創(chuàng)新、規(guī)模化構建智能服務的目的。

借助一個平臺,將軟件的服務個性化的創(chuàng)造,這將是未來的發(fā)展趨勢。在麥肯錫的分析報告中,我們可以看到,各個企業(yè)或者行業(yè),都在第三個階段做了不同的探索和努力。

從數(shù)據(jù)中臺演進到AI中臺

從AI中臺落地實施的方式來看,AI中臺可以是數(shù)據(jù)中臺的進一步延伸,從數(shù)據(jù)中臺一步一步演進過去。

首先,從基礎設施角度,可以將數(shù)據(jù)中臺智能化

所謂的智能化,是指將在數(shù)據(jù)中臺進行的一系列的數(shù)據(jù)服務構建操作進行智能化實現(xiàn),讓數(shù)據(jù)的接入、存儲、分析展現(xiàn)、訓練、到構建管道(pipeline)都更加自動化。例如,對于通用的CI/CD來說,測試不過則會構建失敗,那對于AI中臺下,就要考慮一個推薦模型構建失敗的條件是什么?答案可能是“本次模型的準確率低于上一次構建的準確率”的時候,CI應該被構建失敗。在實踐中,這可能是CI構建過程的維度之一,還會有很多其他指標和維度。我們就需要在現(xiàn)有的數(shù)據(jù)平臺的CI中,實現(xiàn)并自動化這些指標和維度,使之更加智能化。

其次,對于中臺使用者來說,將煙囪式模型構建過程改造為可復用的模型構建過程

目前基于數(shù)據(jù)中臺的一個智能服務模型開發(fā)來說,流程如下:

(圖6 煙囪式模型構建過程)

這基本類似于一個橫向的煙囪架構,導致目前對一個基于算法模型產生的服務進行拆分的時候,都不是特別地順暢。如果大部分業(yè)務場景依舊以流程為主還好,如果新業(yè)務需要引入多的智能服務,那么一系列的問題就會暴露出來:

借助于現(xiàn)有數(shù)據(jù)平臺手工進行數(shù)據(jù)操作

煙囪架構開發(fā),對人員能力要求高

環(huán)節(jié)無法有效拆分,響應周期慢

智能場景規(guī)?;芾韽碗s

訓練,部署,發(fā)布依賴于手工部署缺乏有效的流水線

和數(shù)據(jù)平臺孤立,缺乏統(tǒng)一的數(shù)據(jù)服務接口

基礎設施隔離,無法動態(tài)進行資源的分配和管理

AI中臺需要具備構建智能服務的能力,就要求我們對服務構建的過程進行如下拆分:

(圖7 可復用的模型構建過程)

首先需要從基礎設施層面進行集成。常規(guī)的數(shù)據(jù)中臺依賴于大量的CPU和內存,相反,機器學習模型對GPU的依賴反而更高,但是又不能脫離數(shù)據(jù)中臺,因為它依舊需要利用數(shù)據(jù)中臺的存儲和計算能力來處理大量的數(shù)據(jù)。所以如何通過一個接口、一個調度器、一個管道pipeline來集成整個工作流,就成了需要考量的事情了。

AI中臺至少應該分為以下幾個層級:

基礎設施:對CPU做虛擬化的技術已經(jīng)相對成熟,但是智能服務依賴的更多的是GPU,那么GPU如何做虛擬化,算法模型訓練和數(shù)據(jù)是否需要共同使用相同的機器,還是集群相互隔離,都是需要在一開始設計好的。

資源管理:一切都是資源,無論是網(wǎng)絡、內存,還是數(shù)據(jù)、服務,都是資源。對于模型構建者,關注的只是算法本身,如果該構建者需要數(shù)據(jù),那這樣的數(shù)據(jù)就是一個資源而已,無論資源是以環(huán)境變量的方式提供、還是以服務的方式提供,構建者本身并不需要關心。此時,必須一個資源管理系統(tǒng),對數(shù)據(jù)服務進行統(tǒng)一管理。

中臺和模型:中臺有數(shù)據(jù)的計算和存儲能力外,還應該具備算模型的能力,這里的模型指的是一些業(yè)界通用的、或者企業(yè)級通用算法模型。它可能是一個算法、可能是一個別人已訓練好的模型,可以使用遷移學習的方式去使用。對于中臺來說,它都是一個數(shù)據(jù)集的體現(xiàn),不應該和一個表,一個文件有特別的區(qū)分。

流水線:流水是構建規(guī)模化智能服務非常重要的一個環(huán)節(jié),工作如其名,讓我們構建智能服務的時候,可以像流水線工作一樣,達到這樣的效果,則需要對整個任務進行非常詳細的分解。

智能應用層智能應用層直接面向終端,怎么利用元數(shù)據(jù)等功能,組合各自不同模型提供的服務,構建出組合效應的創(chuàng)新服務。

(圖8 AI中臺的架構層次)

在數(shù)據(jù)中臺的基礎上,擴展對GPU級別資源的管理和整合能力,調度層提供統(tǒng)一的任務、服務、智能CI/CD等服務,來實現(xiàn)AI中臺。這樣以來,就可以達到:

和數(shù)據(jù)平臺結合,利用數(shù)據(jù)平臺的能力作為數(shù)據(jù)支撐,最大化的發(fā)揮數(shù)據(jù)平臺的價值

拆分服務構建環(huán)節(jié),智能服務開發(fā)流程化,快速響應業(yè)務需求

利用元數(shù)據(jù)管理方式,提供統(tǒng)一的標準格式,場景可以多人協(xié)同配合開發(fā)

基礎設施共享化,模型的訓練和發(fā)布與數(shù)據(jù)平臺有效綁定,服務的構建自動化

統(tǒng)一的元數(shù)據(jù)管理系統(tǒng),模型的全生命周期可管理

通用AI能力平臺化,降低人員要求,提升協(xié)作效率

也即,利用算、模型、框架,動態(tài)、快速地組裝服務,創(chuàng)造出新的個性化體驗和新的業(yè)務新的業(yè)務模式,解決“好用”的問題。

結語

數(shù)據(jù)中臺提供的是存儲和計算的能力,基于不同的業(yè)務場景,構建出了用來支撐不同業(yè)務的數(shù)據(jù)服務,依托于強大的計算力,可以快速縮短獲得結果的周期。而AI中臺則是將算法模型融入進來構建為服務,讓構建算法模型服務,更加快速高效,以更加面向業(yè)務。但無論是數(shù)據(jù)中臺還是AI中臺,都是一層基礎設施,做好基礎設施只是第一步,如何讓它的價值最大化,還要依托于AI中臺不斷結合業(yè)務來持續(xù)優(yōu)化,做到“持續(xù)智能”。


銀行與金融科技融合的理想境界是什么?是銀行即服務。伴隨著開放銀行在國外愈演愈烈,中國作為全球金融科技的領先力量與深度參與者,迅速燃起了對開放銀行這種平臺化商業(yè)理念的研究與試錯。

銀行、互聯(lián)網(wǎng)巨頭、金融IT服務商、金融科技創(chuàng)新公司、消費金融公司、保險機構等都迅速入局,試圖通過與商業(yè)生態(tài)系統(tǒng)共享數(shù)據(jù)、算法、交易、流程和其他業(yè)務功能,為商業(yè)生態(tài)系統(tǒng)的客戶、員工、第三方開發(fā)者、供應商和其他合作伙伴提供服務,使合作雙方創(chuàng)造出新的價值,構建新的核心能力。金融科技作為以新技術為核心的創(chuàng)新,立足于新理念、新政策將形成澎湃的力量,重塑中國金融產業(yè)新生態(tài)。

2019年6月14日,億歐智庫研究院將在“2019丨全球新經(jīng)濟年會·金融科技峰會”上發(fā)布《2019開放銀行與金融科技發(fā)展研究報告》,深度解讀金融科技賦能開放銀行的融合與落地應用——上海·虹橋·世貿展館邀您見證!搶票鏈接:https://www.iyiou.com/post/ad/id/792

本文已標注來源和出處,版權歸原作者所有,如有侵權,請聯(lián)系我們。

極客網(wǎng)企業(yè)會員

免責聲明:本網(wǎng)站內容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網(wǎng)站對有關資料所引致的錯誤、不確或遺漏,概不負任何法律責任。任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內容可能涉嫌侵犯其知識產權或存在不實內容時,應及時向本網(wǎng)站提出書面權利通知或不實情況說明,并提供身份證明、權屬證明及詳細侵權或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關文章源頭核實,溝通刪除相關內容或斷開相關鏈接。

2019-03-18
數(shù)據(jù)管理的演進:從響應業(yè)務到創(chuàng)造業(yè)務
數(shù)據(jù)中臺本身還是圍繞數(shù)據(jù)服務來進行的,未來的操作系統(tǒng),一定會越來越個性化,甚至系統(tǒng)可以根據(jù)對應的終端用戶自行呈現(xiàn)符合該用戶習慣的系統(tǒng)界面——AI中臺的概念應運而生。

長按掃碼 閱讀全文