伴隨著開源Apache Hadoop的采用,數(shù)據(jù)管理軟件廠商已發(fā)生巨變?,F(xiàn)在,基于Hadoop的基礎設施的前景日趨明朗,它可以關(guān)聯(lián)結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù),擴展成本低廉,并能以此獲得快速的市場洞察力。 Hadoop和其生態(tài)系統(tǒng)在彈性、安全性和易用性上會為企業(yè)提供新的能力嗎?
現(xiàn)今CIO在利用大量和多樣化的數(shù)據(jù)時,需要考慮的關(guān)鍵技術(shù)因素包括:
1、與其他數(shù)據(jù)庫和數(shù)據(jù)管理環(huán)境共存。包括標準的關(guān)系環(huán)境(甲骨文)和分析數(shù)據(jù)倉庫(Teradata)。警告:數(shù)據(jù)移動和整合是必要的,但它增加了對各種提取、轉(zhuǎn)換和加載(ETL)工具的支出,也增加了運營成本。
2、存儲和硬件。創(chuàng)新的壓縮和重復數(shù)據(jù)刪除技術(shù)是解決大數(shù)據(jù)問題的關(guān)鍵。目前在這方面已有很大的進步,我們現(xiàn)在看到的多層次壓縮在容量方面比原始數(shù)據(jù)減少40倍。然而,重要的是考慮已壓縮的數(shù)據(jù)中有多少最終需要再次膨脹,這將影響你的容量。例如,如果再次膨脹時需要增加30%的容量,那可能不值得把壓縮擺在首位。
3、查詢和分析。并不是所有的數(shù)據(jù)都是同等的,查詢和業(yè)務分析的范圍變化很大,這取決于使用情況。有合適的工作工具是必須的。在許多情況下,快速反應的SQL查詢將足以生成所需要的信息。在其他情況下,深層的分析查詢需要一個具有完整的操作界面和可視化功能的商業(yè)智能工具。正確部署專有技術(shù)和開源Hadoop,將幫助您的組織實現(xiàn)具有規(guī)模的快速分析,同時防止運營成本不斷攀升。
4、規(guī)模和管理能力。由于企業(yè)面對不同的數(shù)據(jù)庫和分析環(huán)境,因此向外和向上的擴展能力是非常重要的。簡單的向外擴展能力是Hadoop為什么會被企業(yè)迅速采用的原因。通過低成本的服務器集群進行大規(guī)模并行處理是關(guān)鍵,比其他的數(shù)據(jù)管理方式需要更少的專業(yè)技能,而這直接影響您對IT資源的投資
- 國內(nèi)首個省級旅游AI智能體“AI游貴州”發(fā)布,馬蜂窩助力貴州開啟智慧文旅新篇章
- 2024年終盤點 | 華為以“技術(shù)為根、實戰(zhàn)為魂”,助力高校,培養(yǎng)千萬數(shù)智人才
- 余承東2025年全員信:通過海量鴻蒙設備,拉動中國電子工業(yè)崛起
- 速通 NVIDIA 專業(yè)顯卡:專業(yè)顯卡有哪些優(yōu)勢?適合什么場景?
- 馬蜂窩跨年出行預測:儀式感必不可少,“跨年煙花”帶動目的地熱度上漲
- 30億元!比亞迪捐資興教推動中國科教進步
- 閉著眼睛寫代碼是一種什么樣的體驗?
- 2024世界顯示產(chǎn)業(yè)大會啟幕,4K花園自研“滿天星”獲十大創(chuàng)新應用
- 哈佛商學院:2024年全球96%代碼庫包含開源組件 Rust采用率增長500%
- 硅谷1/10程序員在摸魚?基本不干活卻能拿20-30萬美元年薪
免責聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關(guān)資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負任何法律責任。任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。