現(xiàn)代數(shù)據(jù)堆棧需要徹底改革
組織需要仔細(xì)審視其整個數(shù)據(jù)堆棧,并確定所有解決方案是否都提供功能、效率和準(zhǔn)確性,或者是否有空間整合為單一的可定制系統(tǒng)。
現(xiàn)代數(shù)據(jù)堆棧已崩潰。從全球范圍來看,平均每個組織使用130種不同的軟件應(yīng)用程序。由于有如此多的技術(shù)可用,數(shù)據(jù)管理很快就會變得復(fù)雜。內(nèi)部構(gòu)建數(shù)據(jù)管理工具可能成本高昂且耗時,并使組織偏離其最初的使命。外包通常更容易,但隨著組織規(guī)模的擴大,其數(shù)據(jù)也在不斷擴大。企業(yè)領(lǐng)導(dǎo)者突然發(fā)現(xiàn)自己擁有大量軟件解決方案,解決了數(shù)據(jù)管理的不同方面。但并非所有解決方案都能無縫協(xié)作。
數(shù)據(jù)管理專業(yè)人士是時候開始質(zhì)疑現(xiàn)狀,并尋求不同的數(shù)據(jù)管理方法了。當(dāng)今的組織需要一種可以輕松表示任何數(shù)據(jù)類型的通用數(shù)據(jù)結(jié)構(gòu),以及一套統(tǒng)一、一致的工具,以高效準(zhǔn)確地與這些數(shù)據(jù)進行交互。
數(shù)據(jù)管理簡史
自20世紀(jì)60年代以來,數(shù)據(jù)管理一直是企業(yè)必不可少的一部分,盡管當(dāng)時它是一項簡單得多的工作。最初的數(shù)據(jù)管理方法包括在大型機上運行的本地解決方案,在接下來的40年里,只有少數(shù)幾家主要參與者占據(jù)了市場,如Oracle、IBM 和 Microsoft。
到本世紀(jì)初,云端數(shù)據(jù)管理逐漸流行起來,同時也暴露出本地數(shù)據(jù)堆棧的缺點,包括維護成本上升、能夠訪問數(shù)據(jù)的用戶數(shù)量太少以及處理能力不足。在2000年代和2010年代,組織經(jīng)歷了數(shù)據(jù)源的多樣化和數(shù)量快速增長,以及對數(shù)據(jù)進行更多管理、分析和組織的需求。
進入現(xiàn)代數(shù)據(jù)堆棧:如今,企業(yè)通常擁有多個基于云的數(shù)據(jù)庫和管理工具來容納不斷擴大的數(shù)據(jù)集。無論他們需要擴展、提高速度還是致力于提高數(shù)據(jù)支持的洞察力的質(zhì)量,組織都可以訪問數(shù)百種解決方案來解決其想要的任何問題。隨著企業(yè)尋求更多解決方案來添加到其技術(shù)堆棧,2023年在數(shù)據(jù)即服務(wù)工具上的支出超過100 億美元。
為什么現(xiàn)代數(shù)據(jù)堆棧不再起作用
如今,世界正在進入數(shù)據(jù)管理的新時代。大型技術(shù)堆棧已不再有效——為了提高工作效率和數(shù)據(jù)質(zhì)量而不斷增加堆棧的成本越來越高,也越來越復(fù)雜。
現(xiàn)代數(shù)據(jù)堆棧過于復(fù)雜,需要使用多種工具和平臺。從編目到治理再到訪問控制,每個季度都會有幾種“新”工具進入市場,這些工具都是重新發(fā)明輪子的工具。此外,堆棧中添加的每個新工具都會增加總擁有成本,包括更多的許可費用以及雇用或重新培訓(xùn)數(shù)據(jù)工程師以使用每個新解決方案。
堆棧中的每個新添加都旨在使一切模塊化,但這導(dǎo)致了一個脫節(jié)的系統(tǒng),進一步使數(shù)據(jù)孤島化。結(jié)果,數(shù)據(jù)科學(xué)家、分析師和產(chǎn)品所有者之間的合作受到抑制。他們通常不在同一個平臺上工作,團隊之間也有不同的流程,交接缺乏背景,溝通急轉(zhuǎn)直下。如今,龐大的數(shù)據(jù)工程師和專業(yè)人員組織正在監(jiān)督企業(yè)組織中的數(shù)據(jù)計劃,但這些計劃需要數(shù)月時間,業(yè)務(wù)用戶和決策者并沒有看到所承諾的影響或突破性見解的速度。
此外,還有安全和治理問題。隨著設(shè)備的增多,團隊和孤島之間的數(shù)據(jù)傳輸也越來越多。幾乎不可能知道誰有權(quán)訪問不同的數(shù)據(jù)集,以及是否應(yīng)該訪問。
過去幾年,人工智能 (AI)、機器學(xué)習(xí) (ML) 以及生成式人工智能和大型語言模型 (LLM) 的進步不斷涌現(xiàn),這些模型依賴于大量所謂的非結(jié)構(gòu)化數(shù)據(jù)集,例如文本、文件和圖像。遺憾的是,傳統(tǒng)的數(shù)據(jù)架構(gòu)并非為處理LLM、AI和ML而設(shè)計的,因此需要投資于專業(yè)的多模式數(shù)據(jù)管理解決方案,而這些解決方案不僅僅局限于簡單的表格和表格數(shù)據(jù)庫。
表格無法提供正確構(gòu)建非傳統(tǒng)數(shù)據(jù)所需的靈活性,如圖像和ML嵌入。然而,一個意想不到的結(jié)果是,組織紛紛采用定制解決方案——一種用于圖像,另一種用于矢量,這樣的例子不勝枚舉。他們會為狹隘的性能基準(zhǔn)和優(yōu)化而沾沾自喜,但卻忽視了組織中還有另一個數(shù)據(jù)孤島,而增加的復(fù)雜性現(xiàn)在才是真正的阻礙。
隨著時間的推移,更多的解決方案被添加到堆棧中,分別解決特定問題,進一步孤立數(shù)據(jù),需要更多管理監(jiān)督,以及額外的治理和合規(guī)執(zhí)行。除了構(gòu)建和維護內(nèi)部基礎(chǔ)設(shè)施的巨額成本外,招聘和留住人才本身也是一項挑戰(zhàn)。
數(shù)據(jù)庫供應(yīng)商是時候重新想象數(shù)據(jù)庫系統(tǒng)的構(gòu)建方式,并努力按照戰(zhàn)略意圖進行構(gòu)建了。
解決方案:統(tǒng)一的數(shù)據(jù)模型
修復(fù)現(xiàn)代數(shù)據(jù)堆棧的解決方案有兩個方面:采用靈活、統(tǒng)一的數(shù)據(jù)模型來應(yīng)對當(dāng)今架構(gòu)的挑戰(zhàn),以及在單一解決方案中統(tǒng)一所有數(shù)據(jù)、計算和代碼平臺的單一平臺。
可以圍繞多維數(shù)組構(gòu)建一個可行的統(tǒng)一數(shù)據(jù)模型,這可以為組織提供一個單一系統(tǒng)來容納所有數(shù)據(jù),并只需一次即可集成首選分類、資源配置、治理等,而無需考慮用例。
其次,需要統(tǒng)一的數(shù)據(jù)平臺。例如,為了避免重建用于編碼和存儲數(shù)據(jù)的單獨基礎(chǔ)設(shè)施,組織有機會使用相同的系統(tǒng)進行編碼和存儲,這也將重復(fù)使用相同的治理和合規(guī)模型。最終,這種合并將帶來成本效益和更高的性能,因為工程師不必再為將相同的數(shù)據(jù)復(fù)制和預(yù)處理到多個系統(tǒng)中而陷入困境。
在2024年及以后,組織需要認(rèn)真審視其整個數(shù)據(jù)堆棧,并確定所有這些解決方案是否都提供了功能、效率和準(zhǔn)確性,或者是否有空間整合成一個可定制的單一系統(tǒng)。然而,這個問題不應(yīng)該落在終端用戶的肩上,而應(yīng)該落在有能力為客戶創(chuàng)建統(tǒng)一解決方案的軟件供應(yīng)商的肩上。
對于希望削減成本、提高生產(chǎn)力和簡化運營的組織來說,數(shù)據(jù)基礎(chǔ)設(shè)施不必太復(fù)雜,而且現(xiàn)有的數(shù)據(jù)管理解決方案可以讓工作變得更輕松。
- LoRaWAN協(xié)議:您需要知道的一切
- 遼寧朝陽發(fā)布行動方案,搶抓低空經(jīng)濟發(fā)展“窗口”期
- 人工智能與能源:邁向凈零世界的協(xié)同力量
- 數(shù)據(jù)分析的七大優(yōu)勢
- 物聯(lián)網(wǎng)賦能智能建筑:優(yōu)勢與用例
- 云平臺如何增強生成式AI工具和模型的功能
- 什么是建筑信息建模(BIM),與 BMS有什么區(qū)別?
- DeepSeek的AI模型如何重新定義全球技術(shù)動力學(xué)
- 光纖網(wǎng)絡(luò)連接的DCI拓?fù)洌耗鷳?yīng)該了解的內(nèi)容
- DCI架構(gòu)設(shè)計:克服現(xiàn)代數(shù)據(jù)中心互連的核心挑戰(zhàn)
免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。