大數據浪潮推動科技發(fā)展,從大數據1.0的BI/Datawarehouse時代,經歷過大數據2.0的Web/APP時代,屬于IOT的大數據3.0時代已然來臨。近日,Analysys易觀發(fā)布IOTA整體技術架構,為企業(yè)進行數字用戶分析和營銷貢獻了新工具。
早期大數據平臺利用Lambda數據架構,將收集來的數據在流式計算平臺和批量數據處理離線平臺進行計算,主要解決實時數據處理需求和批量離線處理需求。穩(wěn)定性高、成本可控且便于晚間閑時錯峰計算的Lambda架構支撐了起步時期的數據行業(yè),但由于實時與批量計算結果不一致引起的數據口徑問題、ETL批量計算在計算窗口內無法完成、數據源變化后修改開發(fā)周期長、服務器存儲大等缺陷,后期的Lambda數據架構越來越無法適應飛速擴增的數據處理需求。
Lambda典型架構
在Lambda之后,Kappa架構成為主流,核心思想是通過改進流計算系統(tǒng)來解決數據全量處理的問題,使得實時計算和批處理過程使用同一套代碼,并且只有在必要的時候才會對歷史數據進行重復計算。雖然比起Lambda,Kappa結構能夠將實時和離線代碼統(tǒng)一起來,既方便維護又解決了數據口徑不一致問題,但其缺點也很明顯:流式處理對于歷史數據的高吞吐量力不從心,開發(fā)周期長,服務器成本浪費嚴重。
Kappa典型架構
而在IOT大潮下,智能手機、PC、智能硬件設備的計算能力越來越強,而業(yè)務需求要求數據實時響應需求能力也越來越強,過去傳統(tǒng)的中心化、非實時化數據處理的思路已經不適應現在的大數據分析需求,Analysys易觀提出新一代的大數據IOTA架構來解決上述問題,整體思路是設定標準數據模型,通過邊緣計算技術把所有的計算過程分散在數據產生、“去ETL化”、計算和查詢過程當中,以統(tǒng)一的數據模型貫穿始終,從而提高整體的預算效率,同時滿足即時計算的需要,可以使用各種Ad-hoc Query來查詢底層數據:
IOTA整體技術結構
凝聚了Analysys易觀團隊多年心血的IOTA架構,解決了傳統(tǒng)技術中ETL和相關開發(fā)的痛點,提高了整體數據分析效率;Ad-hoc即時查詢功能使用戶無需多等就能直接查詢到前幾秒發(fā)生的事件;邊緣計算技術解除了中央端集中處理的限制,將計算過程分散到數據產生、存儲和查詢端,同時確保客戶端傳送數據時能馬上進行反饋。
IOTA架構實現方法
為了驗證IOTA架構,Analysys易觀也自主設計并實現了“秒算”引擎,目前支持易觀內部月活5.5億設備端同時進行計算。此外基于“秒算”引擎,Analysys易觀研發(fā)出了可以獨立部署在企業(yè)客戶內、進行數字用戶分析和營銷的“易觀方舟”精細化運營產品。
Analysys易觀認為,在大數據3.0時代,Lambda大數據架構已經無法滿足企業(yè)用戶日常大數據分析和精益運營的需要,去ETL化的IOTA大數據架構才是未來。Lambda大數據架構為大數據分析行業(yè)提供了創(chuàng)新思維和技術基礎,Analysys易觀以此為基礎,將繼續(xù)致力于互聯(lián)網企業(yè)的用戶與產品運營。
免責聲明:本網站內容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網站出現的信息,均僅供參考。本網站將盡力確保所提供信息的準確性及可靠性,但不保證有關資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網站對有關資料所引致的錯誤、不確或遺漏,概不負任何法律責任。任何單位或個人認為本網站中的網頁或鏈接內容可能涉嫌侵犯其知識產權或存在不實內容時,應及時向本網站提出書面權利通知或不實情況說明,并提供身份證明、權屬證明及詳細侵權或不實情況證明。本網站在收到上述法律文件后,將會依法盡快聯(lián)系相關文章源頭核實,溝通刪除相關內容或斷開相關鏈接。