對(duì)象存儲(chǔ)BOS發(fā)布全新工具,加速自建HDFS到云端的訪問(wèn)速度

原標(biāo)題:對(duì)象存儲(chǔ)BOS發(fā)布全新工具,加速自建HDFS到云端的訪問(wèn)速度

想讓自建Hadoop擁有流暢的云端訪問(wèn)體驗(yàn)?想替老板省點(diǎn)錢(qián)?是時(shí)候升級(jí)你的裝備了!

百度智能云對(duì)象存儲(chǔ)服務(wù)BOS新推出BOS HDFS工具,支持HDFS數(shù)據(jù)在BOS中的海量存儲(chǔ),并能在上層數(shù)據(jù)運(yùn)算中使用HDFS標(biāo)準(zhǔn)接口來(lái)對(duì)數(shù)據(jù)以進(jìn)行訪問(wèn)和讀寫(xiě),可有效解決自建HDFS數(shù)據(jù)的高運(yùn)維成本和低可擴(kuò)展性問(wèn)題,讓你的Hadoop分布式文件系統(tǒng)發(fā)揮最大性能。

HDFS面臨瓶頸有哪些?

首先,來(lái)了解一下問(wèn)題的根源是什么?

眾所周知,Hadoop在分布式數(shù)據(jù)處理方面具有出色的能力,憑借其可靠、高效、可伸縮、并發(fā)處理的特點(diǎn),已發(fā)展為當(dāng)今最為主流的大數(shù)據(jù)開(kāi)源框架之一。

而作為 Hadoop 生態(tài)中最為重要的部分,HDFS(Hadoop Distributed File System)是大數(shù)據(jù)分析場(chǎng)景的存儲(chǔ)基石,具有高容錯(cuò)性的特點(diǎn),能支持應(yīng)用程序進(jìn)行大規(guī)模高吞吐訪問(wèn),為海量數(shù)據(jù)提供了可靠的存儲(chǔ)性能。

但隨著數(shù)據(jù)爆發(fā)性增長(zhǎng),原生Hadoop面臨新的挑戰(zhàn)。例如,大量數(shù)據(jù)存放在自建HDFS上增加了用戶運(yùn)維成本,HDFS namenode單臺(tái)機(jī)器內(nèi)存限制導(dǎo)致本身難以擴(kuò)展。同時(shí),本地HDFS上的海量數(shù)據(jù)不斷增長(zhǎng),也給企業(yè)帶來(lái)了巨大的硬件成本問(wèn)題。 凡此種種,迫使企業(yè)越來(lái)越多的選擇將數(shù)據(jù)存儲(chǔ)在云端,即存儲(chǔ)在對(duì)象存儲(chǔ)服務(wù)當(dāng)中。但此時(shí),由于對(duì)象存儲(chǔ)上層數(shù)據(jù)接口的限制,對(duì)象存儲(chǔ)中數(shù)據(jù)和HDFS之間的訪問(wèn)和讀寫(xiě)操作,成為了企業(yè)在大數(shù)據(jù)場(chǎng)景下新的瓶頸。 這就是BOS HDFS工具要解決的根本問(wèn)題:本地大數(shù)據(jù)場(chǎng)景中對(duì)BOS數(shù)據(jù)的讀寫(xiě)和使用。

BOS HDFS有何神奇之處?

可能有人會(huì)好奇,同類產(chǎn)品那么多,選擇BOS HDFS工具的理由是什么呢? 話不多說(shuō),BOS HDFS強(qiáng)大的功能優(yōu)勢(shì),一起來(lái)看: 百度智能云對(duì)象存儲(chǔ)服務(wù)BOS此次推出BOS HDFS工具,支持HDFS數(shù)據(jù)在BOS中的海量存儲(chǔ),并在上層數(shù)據(jù)運(yùn)算中使用HDFS標(biāo)準(zhǔn)接口來(lái)對(duì)數(shù)據(jù)進(jìn)行訪問(wèn)和讀寫(xiě),能有效解決自建HDFS數(shù)據(jù)的高運(yùn)維成本和低可擴(kuò)展性問(wèn)題。更重要的是,其具有以下三個(gè)硬核特性:

  • 框架兼容:對(duì) Hadoop 2.7+/3.1+ 實(shí)現(xiàn)全系列兼容
  • 無(wú)感調(diào)用:能實(shí)現(xiàn)本地自建 HDFS 對(duì) BOS 中數(shù)據(jù)的無(wú)感調(diào)用
  • 數(shù)據(jù)存儲(chǔ)高性價(jià)比:融合對(duì)象存儲(chǔ)服務(wù) BOS 的超低價(jià)格、超高性能、高可靠性、高可用性和高吞吐優(yōu)勢(shì)

簡(jiǎn)言之,BOS HDFS的使用能讓企業(yè)用戶以超低價(jià)格,滿足自身在大數(shù)據(jù)場(chǎng)景中對(duì)數(shù)據(jù)的讀寫(xiě)和使用需求。

如何使用BOS HDFS?

如此神奇的BOS HDFS工具,使用起來(lái)困難嗎?

答案是否定的,用戶只需下載相應(yīng)SDK包,并修改部分配置,即可使用 BOS HDFS 工具。

值得注意的是,由于自建Hadoop集群在拓展性和運(yùn)維方面的限制,使用百度MapReduce(BMR)是第一推薦選擇。BMR是全托管的Hadoop/Spark集群,可以按需部署并彈性擴(kuò)展集群,用戶只需專注于大數(shù)據(jù)處理和分析等核心工作,集群運(yùn)維則完全交由擁有多年大規(guī)模分布式計(jì)算技術(shù)積累的百度運(yùn)維團(tuán)隊(duì)。 此外,BMR原生支持通過(guò)BOS HDFS工具對(duì)存儲(chǔ)在BOS中的數(shù)據(jù)進(jìn)行高效讀寫(xiě)和管理,開(kāi)箱即用。同時(shí),BMR技術(shù)團(tuán)隊(duì)內(nèi)部針對(duì)list,rename等較為耗時(shí)的操作進(jìn)行了深度優(yōu)化,可以為用戶帶來(lái)更極致的性能體驗(yàn)。

完善的工具矩陣

多年來(lái),百度智能云對(duì)象存儲(chǔ)團(tuán)隊(duì)持續(xù)深耕云端數(shù)據(jù)存儲(chǔ)和數(shù)據(jù)處理技術(shù)架構(gòu),推出包括API、SDK和周邊工具等不同類型的產(chǎn)品形態(tài),能滿足客戶在數(shù)據(jù)上云、數(shù)據(jù)遷移、批量處理、大數(shù)據(jù)處理等多種場(chǎng)景下的業(yè)務(wù)需求。 到目前為止,BOS共推出十余款不同類型的工具,包括BOS Import、BOS CMD、BOS CLI、BOS Probe和BOS FS等,以協(xié)助客戶在不同場(chǎng)景下對(duì)數(shù)據(jù)的便捷處理。

未來(lái),百度智能云對(duì)象存儲(chǔ)服務(wù)BOS還將持續(xù)加強(qiáng)核心能力,推出更多超值且多樣化的云上對(duì)象存儲(chǔ)服務(wù)。

極客網(wǎng)企業(yè)會(huì)員

免責(zé)聲明:本網(wǎng)站內(nèi)容主要來(lái)自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁(yè)或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書(shū)面權(quán)利通知或不實(shí)情況說(shuō)明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開(kāi)相關(guān)鏈接。

2020-01-07
對(duì)象存儲(chǔ)BOS發(fā)布全新工具,加速自建HDFS到云端的訪問(wèn)速度
百度智能云對(duì)象存儲(chǔ)服務(wù)BOS新推出BOS HDFS工具,支持HDFS數(shù)據(jù)在BOS中的海量存儲(chǔ),并能在上層數(shù)據(jù)運(yùn)算中使用HDFS標(biāo)準(zhǔn)接口來(lái)對(duì)數(shù)據(jù)以進(jìn)行訪問(wèn)和讀寫(xiě),可有效解決自建HDFS數(shù)據(jù)的高運(yùn)維成本和

長(zhǎng)按掃碼 閱讀全文