去年底,《中共中央、國務院關于構建數(shù)據(jù)基礎制度更好發(fā)揮數(shù)據(jù)要素作用的意見》(以下簡稱:" 數(shù)據(jù)二十條 ")正式頒布,標志著數(shù)據(jù)基礎制度的建設步入快車道,數(shù)據(jù)要素化有望全面提速。
" 數(shù)據(jù)二十條 " 引來熱議的同時,也讓數(shù)據(jù)科學再次成為各界關注的焦點。業(yè)界普遍認為,我國具有海量數(shù)據(jù)規(guī)模和豐富應用場景,全面激活數(shù)據(jù)要素潛能和做強數(shù)字經濟,離不開數(shù)據(jù)科學的長期支撐。
無獨有偶,在 2023 數(shù)據(jù)科學峰會上,IDC 等權威咨詢機構也作出判斷:企業(yè)與組織需要把數(shù)據(jù)科學能力納入未來發(fā)展戰(zhàn)略之中,數(shù)據(jù)科學基礎平臺將成為未來產業(yè)數(shù)字化的標配。
作為一門發(fā)展了五十余載的學科,數(shù)據(jù)科學為何能做到歷久彌新?在人工智能浪潮中,數(shù)據(jù)科學的價值緣何得到持續(xù)凸顯?正如百分點科技董事長兼 CEO 蘇萌所言:" 在經歷小數(shù)據(jù)和大數(shù)據(jù)時代之后,數(shù)據(jù)科學正進入全面擁抱 AI 浪潮的 3.0 時代,數(shù)據(jù)科學將加速組織數(shù)智化能力的進階。"
全面擁抱數(shù)據(jù)科學 3.0 時代
"ChatGPT 之所以表現(xiàn)如此好,關鍵原因在于數(shù)據(jù)質量非常高,可以訓練出非常好的效果。今天,AI 的底層基礎就是數(shù)據(jù)科學。"IDC 中國副總裁兼首席分析師武連峰談到數(shù)據(jù)科學能力時舉例說。
的確,數(shù)據(jù)科學作為使用科學方法從數(shù)據(jù)中提取意義和洞察的領域,綜合了數(shù)學、統(tǒng)計學、計算機技術、人工智能以及領域知識等,核心目標是做數(shù)據(jù)在業(yè)務側的價值實現(xiàn)。如今,隨著數(shù)字化轉型縱深發(fā)展和數(shù)據(jù)要素化全面提速,廣大用戶愈發(fā)重視建設數(shù)據(jù)科學能力。
" 當前是數(shù)據(jù)科學的 3.0 時代,正在全面擁抱 AI 浪潮。" 蘇萌介紹道," 在這之前,數(shù)據(jù)科學經歷了小數(shù)據(jù)時代和大數(shù)據(jù)時代。"
在小數(shù)據(jù)時代,數(shù)據(jù)科學主要運用關系型數(shù)據(jù)庫、數(shù)據(jù)倉庫、ETL 等技術,主要面向結構化數(shù)據(jù)、歷史數(shù)據(jù)和線下數(shù)據(jù),聚焦商業(yè)領域的數(shù)據(jù)整合、描述性分析和 BI 等應用;在大數(shù)據(jù)時代,互聯(lián)網和移動互聯(lián)網帶來了海量非結構化數(shù)據(jù)和數(shù)據(jù)處理分析技術的更迭,像 Storm、Spark 等計算框架極大提升了數(shù)據(jù)處理的深度、廣度和速度,而機器學習成為數(shù)據(jù)科學的重要技術手段,市場數(shù)據(jù)科學應用以單點技術和場景為主。
" 大數(shù)據(jù)成為孕育 AI 的沃土,AI 則是大數(shù)據(jù)的重要使用者。在這一波人工智能浪潮中,AI 逐漸成為新一代基礎設施,多模態(tài)數(shù)據(jù)需要進入到可分析、可解釋、可參與預測和決策輔助的場景中來。" 蘇萌表示道。
因此,進入到數(shù)據(jù)科學 3.0 時代,無論是數(shù)據(jù)的復雜度,還是技術迭代發(fā)展的速度,亦或是各種場景與數(shù)據(jù)、技術的深化融合程度,均遠勝過往,這意味著單一工具和單點技術已經不能滿足用戶訴求。
" 端到端的數(shù)據(jù)科學解決方案成為大勢所趨。" 蘇萌介紹道。事實的確如此, Plantir、Alteryx、百分點科技等國內外企業(yè)均致力于完善和迭代數(shù)據(jù)科學平臺產品體系,構建端到端數(shù)據(jù)科學解決方案,降低數(shù)據(jù)集成、數(shù)據(jù)清洗等底層工作復雜度,加快數(shù)據(jù)科學在千行百業(yè)中的落地。
這其中,百分點科技的數(shù)據(jù)科學基礎平臺 DeepMatrix 又尤為值得關注。
DeepMatrix,樹立數(shù)據(jù)科學基礎平臺標桿
正所謂工欲善其事必先利其器。
當下,很多行業(yè)用戶一方面數(shù)據(jù)規(guī)模越來越大、數(shù)據(jù)類型愈發(fā)廣泛和豐富、數(shù)據(jù)孤島現(xiàn)象愈發(fā)普遍;另一方面,實時數(shù)據(jù)分析需求愈發(fā)增長,數(shù)據(jù)安全可信合規(guī)保障難度又持續(xù)提高,使得數(shù)據(jù)要素的充分釋放依然面臨諸多挑戰(zhàn)。
例如,根據(jù)相關數(shù)據(jù)統(tǒng)計顯示,當前全球注入 AI 模型的數(shù)據(jù)連 1% 都達不到,數(shù)據(jù)要素的釋放在未來有著巨大空間。
無疑,數(shù)據(jù)科學基礎平臺就是廣大行業(yè)用戶們釋放數(shù)據(jù)要素潛能的利器。Gartner 認為,面向未來,數(shù)據(jù)科學與機器學習平臺必須實現(xiàn)全生命周期的數(shù)據(jù)科學活動,能夠自動化或增強數(shù)據(jù)處理、模型構建、在線服務的各項工作;同時,還具備多人協(xié)作和廣泛的開源與集成能力。
" 數(shù)據(jù)科學不能脫離真實場景。本質上,數(shù)據(jù)科學是一項團隊型任務,必須具備三大核心能力:軟技能、一體化工具和領域知識,而數(shù)據(jù)科學基礎平臺則可以很好地支撐起這三大核心能力。" 百分點科技 CTO 劉譯璟表示道。
因此,百分點科技根據(jù)過去十三年里多個行業(yè)數(shù)據(jù)價值實現(xiàn)的豐富實踐,逐步打造出數(shù)據(jù)科學基礎平臺 --DeepMatrix,沉淀出規(guī)劃設計、數(shù)據(jù)治理、建模分析和數(shù)據(jù)應用四大階段,覆蓋數(shù)據(jù)價值實現(xiàn)的全生命周期,具備全面數(shù)據(jù)類型支持、完善數(shù)據(jù)治理能力、強大數(shù)據(jù)建模能力、豐富數(shù)據(jù)洞察能力、高效知識生產能力和高度復用領域知識六大能力。
據(jù)悉,DeepMatrix 數(shù)據(jù)科學基礎平臺具備兩大特征:一是知識化,不斷將程序性知識、事實性知識和概念性知識等數(shù)據(jù)科學知識沉淀到平臺之中,有效解決傳統(tǒng)企業(yè)數(shù)字化轉型面臨的數(shù)據(jù)科學冷啟動問題。例如,在數(shù)據(jù)建模方面,DeepMatrix 已經沉淀了數(shù)百個機器學習算法、領域模型并支持多語種語義分析,大部分都是經過行業(yè)真實場景驗證過的。
二是智能化,DeepMatrix 內置了智能輔助開發(fā)系統(tǒng),自動化輔助開發(fā)者選擇方案和完成數(shù)據(jù)適配,并智能化進行方案精調和改進,并在數(shù)據(jù)治理等多個環(huán)節(jié)依托知識庫和語義理解等智能技術幫助開發(fā)者提升效率。例如,在數(shù)據(jù)治理方面,DeepMatrix 具有上萬個領域數(shù)據(jù)標準,可以智能構建數(shù)據(jù)標準和血緣,并具備零代碼數(shù)據(jù)服務。
" 過去,在單點場景的數(shù)據(jù)價值實現(xiàn)中,大家往往是依托各種半工具化產品;如今,端到端的數(shù)據(jù)價值需求趨勢明顯,需要通過集成化、工程化、服務化的數(shù)據(jù)科學基礎平臺來幫助用戶充分釋放數(shù)據(jù)要素的潛能。" 劉譯璟補充道。
無疑,對于數(shù)據(jù)科學基礎平臺的構建,百分點科技的 DeepMatrix 已經樹立了標桿。百分點科技不僅具有多年的行業(yè)實踐經驗,其數(shù)據(jù)科學基礎平臺在多種復雜場景中均得到很好淬煉;另外,百分點數(shù)據(jù)科學基礎平臺還獲得各大機構的廣泛認可,多次入圍 Forrester AI/ML(人工智能 / 機器學習)平臺報告,并且在信通院數(shù)據(jù)中臺解決方案專項評測中,以 283 個用例全部通過的方式獲得優(yōu)秀級(最高級)認證。
數(shù)據(jù)科學市場需要領頭羊
" 在數(shù)字中國建設中,釋放數(shù)據(jù)生產力是關鍵。除了東數(shù)西算等基礎設施硬件建設外,還需要構建數(shù)據(jù)文化、推動數(shù)據(jù)科學發(fā)展等‘軟實力’的建設,這樣才能把數(shù)據(jù)生產力徹底釋放出來。" 北京大學數(shù)學科學學院、光華管理學院教授,中國科學院院士陳松蹊在 2023 數(shù)據(jù)科學峰會上如是說。
據(jù)市場研究機構 MarketsandMarkets 評估,2021 年全球數(shù)據(jù)科學平臺市場規(guī)模為 953 億美元,預計 2026 年數(shù)據(jù)科學平臺市場規(guī)模將達到 3229 億美元,復合年增長率 ( CAGR ) 為 27.7%。毫無疑問,隨著中國數(shù)字經濟的快速發(fā)展,中國數(shù)據(jù)科學的市場應用前景、增長速度和未來空間更值得期待。
大數(shù)據(jù)在線認為,中國數(shù)據(jù)科學市場方興未艾,市場更加需要產業(yè)領頭羊來牽引產業(yè)良性發(fā)展、加速技術創(chuàng)新和行業(yè)實踐、普及數(shù)據(jù)科學文化和培養(yǎng)人才。相比于阿里、華為這些綜合型選手,百分點科技更像是一個數(shù)據(jù)科學領域的專業(yè)型選手,聚焦和專注數(shù)據(jù)科學領域多年,并且正在數(shù)據(jù)科學市場跑出領先身位。
首先,百分點科技多年以來致力于數(shù)據(jù)科學技術的應用探索。從國內規(guī)模最大的推薦引擎技術服務商,率先將數(shù)據(jù)科學技術服務 2000 多家互聯(lián)網電商和媒體客戶,到敏銳覺察到大數(shù)據(jù)在 To B 領域數(shù)字化轉型的重要價值,將積累下來的數(shù)據(jù)科學技術、產品和應用到下沉到金融、零售、媒體等多個行業(yè);再到將在互聯(lián)網和企業(yè)服務沉淀的數(shù)據(jù)科學產品與技術應用于政務領域,面向數(shù)字城市、公安、應急、統(tǒng)計等領域,利用數(shù)據(jù)科學助力政府治理能力提升和治理體系現(xiàn)代化。
其次,百分點科技非常注重數(shù)據(jù)科學技術的生態(tài)良性建設。以標準為例,百分點科技參與信標委大數(shù)據(jù)和人工智能標準工作組,參與制定大數(shù)據(jù)參考架構、術語等多項國家標準和應急管理、生態(tài)環(huán)境等行業(yè)標準的研制,持續(xù)將自身最佳實踐輸出給標準機構;此外,百分點科技還與華為、百度智能云、京東云等合作伙伴緊密合作,共同推動數(shù)據(jù)科學技術生態(tài)的持續(xù)發(fā)展。
第三,百分點科技一直重視數(shù)據(jù)科學文化的建設。以人才培養(yǎng)為例,針對數(shù)據(jù)科學人才培養(yǎng)與實際需求脫鉤的情況,百分點科技近年來攜手國內各大高校聯(lián)合推出了數(shù)據(jù)科學產教融合計劃,將多年的實踐經驗、軟件、工具與最新案例提供給高校,為高校學生提供實操培訓。
而針對行業(yè)用戶的數(shù)據(jù)科學能力建設,百分點科技還聯(lián)合 IDC 發(fā)布業(yè)界首份數(shù)據(jù)能力進階白皮書《用數(shù)據(jù)創(chuàng)造價值 以智能激發(fā)增長 -- 數(shù)據(jù)科學基礎平臺白皮書》,為廣大行業(yè)用戶的數(shù)據(jù)科學能力建設、數(shù)據(jù)思維形成和數(shù)據(jù)文化推廣提供了重要的參考價值。
" 未來,大數(shù)據(jù)、AI、云計算、智能交互等技術將與物理世界深度融合,將迎來數(shù)據(jù)原生時代。數(shù)據(jù)模態(tài)會更加豐富、質量更高、時效性更強,算法會更先進、算力要求會更強。百分點科技將繼續(xù)致力于以數(shù)據(jù)科學來加速數(shù)智化能力進階,用數(shù)據(jù)科學構建更智能的世界。" 蘇萌最后表示道。
免責聲明:此文內容為第三方自媒體作者發(fā)布的觀察或評論性文章,所有文字和圖片版權歸作者所有,且僅代表作者個人觀點,與極客網無關。文章僅供讀者參考,并請自行核實相關內容。投訴郵箱:editor@fromgeek.com。
免責聲明:本網站內容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網站出現(xiàn)的信息,均僅供參考。本網站將盡力確保所提供信息的準確性及可靠性,但不保證有關資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網站對有關資料所引致的錯誤、不確或遺漏,概不負任何法律責任。任何單位或個人認為本網站中的網頁或鏈接內容可能涉嫌侵犯其知識產權或存在不實內容時,應及時向本網站提出書面權利通知或不實情況說明,并提供身份證明、權屬證明及詳細侵權或不實情況證明。本網站在收到上述法律文件后,將會依法盡快聯(lián)系相關文章源頭核實,溝通刪除相關內容或斷開相關鏈接。