從“云優(yōu)先”到“數優(yōu)先”,如何用好數據要素?

來源:第一財經

2023年,AIGC徹底引爆了行業(yè)內外對于人工智能的熱情,而數據作為AI的營養(yǎng)來源,其獲取的便利性和質量直接決定了AI的性能。

以目前火熱的AI大模型為例,一方面對大量高質量數據的需求迫切,但另一方面數據采集、整理和清洗的過程復雜且耗時。此外,數據來源的多樣性、隱私保護和合規(guī)性問題也是當前面臨的挑戰(zhàn),但同時也帶來了機遇。

AIGC中對數據的調用是目前數字化發(fā)展的典型應用場景之一。在數字經濟飛速發(fā)展的當下,行業(yè)數字化轉型以數據為關鍵要素,在促進生產力發(fā)展和改進生產方式的過程中,催生了一系列的新模式、新應用、新場景,為推動經濟社會高質量發(fā)展提供新動能。

而在云基礎能力進化和提升的基礎上,生長在云上的行業(yè)智慧化應用推動了轉型的縱深發(fā)展,也讓數據價值得到了更廣泛的認可,云計算的創(chuàng)新正在從“云優(yōu)先”向“數優(yōu)先”過渡。

“從工業(yè)時代、信息時代到數字時代,數據價值認知空前提高,數據作為第五生產要素,已成為數字經濟發(fā)展的核心引擎。”新華三集團高級副總裁、紫光云與智能事業(yè)群執(zhí)行總裁陳子云在近日的一場交流活動中對記者表示,業(yè)內對數據認知的提升以及國家對數據資產的推動正在對行業(yè)的數字化改革產生深遠影響,起到了“里程碑”式的作用。

為什么要重視數據要素?

數據要素是五大生產要素之一,其他四個分別是勞動力、技術、資本和土地。勞動力、技術、資本和土地的重要性不言而喻,能跟它們歸為一類,數據要素的戰(zhàn)略地位可見一斑。

去年以來,數據要素越來越受到國家重視。在國家財政部宣布數據資源可以計入資產,為數據要素確權打基礎后,“數據二十條”在去年年底正式發(fā)布,其中對數據產權、流通交易、收益分配、安全治理等方面基礎制度作出頂層設計。

這背后是我國數字產業(yè)化和產業(yè)數字化持續(xù)推進,以數據作為“基礎要素”的數字經濟發(fā)展取得顯著成就,作為國民經濟“穩(wěn)定器”“加速器”的作用越發(fā)明顯。

2022年,我國數字經濟規(guī)模達50.2萬億元,穩(wěn)居世界第二位,繼續(xù)保持10%以上的高增長率,占GDP比重提升至41.5%。有研究表明,數字化程度每提高10%,人均GDP將增長0.5%至0.62%。

因此,業(yè)界形象地將數據稱作數字經濟時代的“石油”,數據的流動帶動技術流、物質流、人才流、資金流,就像石油的燃燒可以產生動力并帶來價值。數據要素作為生產要素后,市場空間非常大,相關數據顯示,十四五期間我國數據要素市場規(guī)模將突破1700億元。

“在這樣的背景下,百行百業(yè)對數據將有一個共同的需求,就是希望數據成為他們的資產,成為他們的生產要素,希望它能夠變現(xiàn),能夠體現(xiàn)價值。”陳子云表示,這樣一來,面對行業(yè)轉型對數據的采、存、算、管和用的能力也提出了更高要求。

在陳子云看來,對數據的要求來自于兩個維度,一個是量的維度,另一個是質的維度。

“量就是數據量,比如大模型的訓練一定是海量數據,沒有數據的地方也就沒有AI,所以對數據體量的要求會提高很多。質是對數據質量的要求會更高。因為我們通常說,垃圾進去垃圾出來,數據是錯的,結論肯定是錯的。”陳子云表示,產品一定要能反映這兩個維度,一個是海量數據的分析、處理、運營、運維,包括治理等,另外一個則是產品一定能夠保證客戶提高數據的質量,幫他們做更正確的商業(yè)的決策或者業(yè)務的決策,提高企業(yè)的運營效率,提升他們在市場的競爭能力。

新華三集團高級副總裁、紫光云與智能事業(yè)群執(zhí)行總裁 陳子云

激活數據價值,走進百行百業(yè)

面向數字經濟的持續(xù)增長,數據將在驅動行業(yè)轉型與變革的過程中發(fā)揮更大的價值。而在新華三的產品理念中,激活數據要素價值潛能,構建數字社會的核心引擎已經成為明確的方向。

“百行百業(yè)有各自的特點,對數據要素的理解也不同,而對我們而言,對百行百業(yè)客戶業(yè)務場景的理解就變成了我們最重要的一個能力,如何賦能他們智慧用數,如何把數據的價值體現(xiàn)出來,這對新華三來說可能是最重要的一環(huán)。”陳子云說。

新華三集團云與智能產品線大數據產品管理部部長李永平補充道,從方案角度講,數據要素化的落地其實是需要更懂行業(yè)、更懂業(yè)務。“所以從我們的角度來講,需要更多的行業(yè)專家去深入理解業(yè)務,才能幫助客戶實現(xiàn)數據要素發(fā)展落地。”

這就是綠洲平臺3.0推出的初衷。

前不久,新華三舉辦了以“有數·智享未來”為主題的綠洲平臺3.0新品發(fā)布會。綠洲平臺可以說既是一個技術平臺,也是一個生態(tài)平臺,能夠實現(xiàn)海量數據采集匯聚、共享打通、全域融合,從而全方位地激活數據價值,使能行業(yè)數字化轉型。

在官方介紹中,綠洲平臺3.0將基于深耕行業(yè)積累的豐富經驗,沉淀政務、水利、教育、醫(yī)療、企業(yè)五大行業(yè)數據方案,將以場景為驅動精準賦能業(yè)務創(chuàng)新。

以水利數字孿生數據中臺方案為例,該方案通過監(jiān)測數據實時接入,提高水利綜合監(jiān)管效能,降低了監(jiān)管成本。同時打破數據壁壘,增強流域水利工程協(xié)同調度能力,并通過知識和模型賦能,支撐“四預”場景更精準、更智能。

而在智慧醫(yī)院全域數據湖方案中,數據可秒級入湖、分析與共享,提升數據實效性。海量數據的分析與檢索也可以提高科研創(chuàng)新力和轉化率。同時,全域數據支撐沉淀數據資產,提高了診療效率和準確性。通過建立精益指標管理體系,提升醫(yī)療數據資源的合理調配效率。

“新華三經過這么多年的積累,我們從產品、解決方案到服務,為客戶落地了至少上千個案例,從醫(yī)療到教育再到最近比較突出的智慧水利,還有交通、金融等,基本上百行百業(yè)我們都看到了這個機會,就是幫助客戶提高利用數據的能力,用這個能力來推動數字化轉型”陳子云說。

陳子云表示,綠洲平臺3.0就是讓用數更方便、更簡捷,實現(xiàn)用數的簡單化和用戶體驗的升級,數據不管從采集、處理、傳輸或者是存儲等,在性能和速度上都有大幅度的提升。此外,數據還可以自由流動,像流水一樣自動地進來,自動地流出去。

“目前我們的工具能夠實現(xiàn)的數據入湖的效率是實現(xiàn)150兆每秒的吞吐量,相比一些傳統(tǒng)的方式或者開源的方式性能提升了100倍以上。另外,不管是在數據湖還是數據倉庫,加入了一些分布式返程的技術,實現(xiàn)了在實時數倉維度秒級的數據分析以及實現(xiàn)了智能化引擎的計算,實現(xiàn)了秒級的數據計算的能力。”

談到未來,陳子云認為,新的技術力既是機會也是挑戰(zhàn),保持樂觀的態(tài)度。“一定要想辦法抓住這個機會,理解客戶的痛點,理解他們發(fā)展的瓶頸,理解他們對未來三年、五年甚至十年的一些規(guī)劃、一些想法,只要緊貼著客戶的場景,用好這些創(chuàng)新的技術,我對未來還是很有信心。”

AIGC的火爆應用,一方面對大量高質量數據的需求迫切,另一方面也帶來了機遇。近期,新華三在2023 NAVIGATE 領航者峰會上重磅發(fā)布了私域大模型——“百業(yè)靈犀”LinSeer,為垂直行業(yè)和專屬地域的客戶提供安全、訂制、獨享、生長的智能化服務。同時,新華三也專為AIGC打造了三款重量級產品:正式推出專為大模型訓練而生的AI服務器,讓大語言模型訓練時間縮短70%;全球首發(fā)51.2T,800G硅光數據中心交換機,打造AIGC智算網絡“利器”;全面升級新華三傲飛算力平臺,定義多元異構的算力調度“最優(yōu)解”,驅動智能創(chuàng)新加速升級。

隨著數字經濟的發(fā)展,數字化變革將構建新的經濟發(fā)展格局,并在構筑國家競爭新優(yōu)勢上起到重要作用,從而釋放出更加強勁的動能。在這樣的時代背景下,作為數字化行業(yè)的領軍者之一,新華三給出了自己的答案,也給行業(yè)打了個樣,加快推進數字技術創(chuàng)新應用,構建數字關鍵核心技術。只有更多的企業(yè)主動擁抱數字經濟變革,利用好數字化產生力工具,才能讓高質量數據要素“活起來”。

(免責聲明:本網站內容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網站出現(xiàn)的信息,均僅供參考。本網站將盡力確保所提供信息的準確性及可靠性,但不保證有關資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網站對有關資料所引致的錯誤、不確或遺漏,概不負任何法律責任。
任何單位或個人認為本網站中的網頁或鏈接內容可能涉嫌侵犯其知識產權或存在不實內容時,應及時向本網站提出書面權利通知或不實情況說明,并提供身份證明、權屬證明及詳細侵權或不實情況證明。本網站在收到上述法律文件后,將會依法盡快聯(lián)系相關文章源頭核實,溝通刪除相關內容或斷開相關鏈接。 )