原標(biāo)題:Facebook宕機事故,暴露了上云不是唯一的答案
當(dāng)國內(nèi)人民歡度假期的時候,互聯(lián)網(wǎng)巨頭Facebook卻收獲了“負面新聞大禮包”。
負面之一,就是長達6小時的全球大宕機。
據(jù)說,這是Facebook創(chuàng)辦以來最嚴重的一次網(wǎng)絡(luò)訪問事故,除了Instagram、Whatsapp、Messenger這幾大海外沖浪必備平臺,虛擬現(xiàn)實平臺Oculus的游戲,部分企業(yè)端服務(wù)以及很多需要Facebook賬號登錄的平臺都上不去了,就連Facebook公司的內(nèi)網(wǎng)也受到影響。要知道,這里可匯聚了全球最厲害、薪酬最高的一大批程序員?。?/p>
互聯(lián)網(wǎng)公司宕機,并不是一件很稀奇的事。
今年早些時候,國內(nèi)某視頻平臺就因為服務(wù)器突然故障,一度崩潰,大量用戶“流浪”到其他網(wǎng)站,巨大的流量洪峰又讓其他平臺也連鎖式癱瘓了,各廠程序員們都感受到了被宕機統(tǒng)治的恐懼,一度登上微博熱搜,被網(wǎng)友戲稱為——互聯(lián)網(wǎng)內(nèi)卷之《誰也別想睡覺》。
同樣是宕機,為什么Facebook就面臨著“非死不可”的吐槽聲,而不是一笑了之呢?
這可能是因為,F(xiàn)acebook龐大的產(chǎn)品生態(tài),已經(jīng)不再是娛樂沖浪的一部分,而成為了數(shù)字生活的基礎(chǔ)設(shè)施。
尤其是在疫情之后,許多企業(yè)服務(wù)、辦公教育等都依賴互聯(lián)網(wǎng)來完成,服務(wù)中斷會直接導(dǎo)致嚴重的經(jīng)濟損失。
在WhatsApp(Facebook旗下一款類似微信的軟件)的官網(wǎng)就顯示,巴黎的醫(yī)療人員會在WhatsApp 群組內(nèi)更新醫(yī)院病床、資源等信息;印度企業(yè)依靠WhatsApp售賣產(chǎn)品;巴西政府、醫(yī)療和教育系統(tǒng)都通過WhatsApp提供C端服務(wù),比如接收考試成績、遠程預(yù)約掛號等等。
可想而知,作為數(shù)字化底座的互聯(lián)網(wǎng)服務(wù),一旦中斷,將連帶產(chǎn)生不少次生災(zāi)害。
而面對宕機,我們第一時間總會想到云服務(wù)商,云中斷導(dǎo)致的問題,互聯(lián)網(wǎng)企業(yè)自然也是受害者。
不過,像Facebook這樣的巨頭,往往核心業(yè)務(wù)和數(shù)據(jù)都放在自家數(shù)據(jù)中心的服務(wù)器上。這次宕機之后,就有不少工程師“打飛的”到位于加州的主數(shù)據(jù)中心參與維修,科技媒體The Verge還曾爆料,因為門禁卡失效,工程師們使用切割機,鋸開了數(shù)據(jù)中心的服務(wù)器鐵籠。
Facebook面臨的挑戰(zhàn),也是許多互聯(lián)網(wǎng)巨頭的縮影:一方面,作為數(shù)字化底座,最大程度地保證基礎(chǔ)設(shè)施的穩(wěn)定性、可靠性,是巨頭們應(yīng)盡的社會責(zé)任;同時,又不能將希望全部都放在云服務(wù)上,增加了IT系統(tǒng)的復(fù)雜度和運維難度。
這次大型宕機事件也掀開了全面上云的另一面,為什么互聯(lián)網(wǎng)巨頭們都沒有把雞蛋放在一朵云上?
不是唯一的答案:云服務(wù)的另一面
互聯(lián)網(wǎng)公司,可謂是云服務(wù)的先遣部隊。在傳統(tǒng)行業(yè)還不知道什么是互聯(lián)網(wǎng)浪潮、什么是云的時候,互聯(lián)網(wǎng)公司就成了云廠商的高價值客戶。
常規(guī)情況下,互聯(lián)網(wǎng)企業(yè)會將移動應(yīng)用、電商之類前端流量業(yè)務(wù)放到云上,以節(jié)省自建機房的高昂成本。
不過,別看互聯(lián)網(wǎng)企業(yè)上云這么積極,它們可是“狡兔三窟”,一邊遷移上云,一邊也有本地數(shù)字基礎(chǔ)設(shè)施。2018年,F(xiàn)acebook斥資10億美元在新加坡打造了亞洲首個數(shù)據(jù)中心,這也是它在全世界的第15個數(shù)據(jù)中心。相當(dāng)于一邊從發(fā)電廠買商業(yè)用電,但也在造自己的發(fā)電機。
這兩年來,上云浪潮如火如荼,出現(xiàn)了一些觀點,認為云服務(wù)會徹底消除數(shù)據(jù)中心,但事實上,越來越多的企業(yè)在嘗試讓部署數(shù)據(jù)中心上的舊應(yīng)用升級,而不是將一切業(yè)務(wù)都云化。
甚至有企業(yè)IT人員告訴我,他們可能會讓自家的數(shù)據(jù)中心永遠運轉(zhuǎn)下去。
要知道,數(shù)據(jù)中心幾乎占據(jù)了企業(yè)網(wǎng)絡(luò)支出的最大組成部分,每年需要支付不小的租金和改造、維護費用,這無疑會增加額外的成本,為什么互聯(lián)網(wǎng)企業(yè)依然堅持這么做呢?
第一,傳統(tǒng)機房可能會宕機,但上云也未必完全穩(wěn)定。
云服務(wù)雖然不需要維護傳統(tǒng)機房,數(shù)據(jù)存儲、計算都在云端,但幾乎沒有哪個云服務(wù)廠商實現(xiàn)過100%的連續(xù)性,都出現(xiàn)過計劃外的停機。2017年,IBM、AWS、谷歌、蘋果等主要云服務(wù)提供商也都經(jīng)歷過云中斷,將Netflix、Quora、Reddit和 Foursquare等熱門應(yīng)用“一波帶走”,影響了大大小小的企業(yè)。
第二,成本效益很重要,但數(shù)據(jù)資產(chǎn)安全更重要。
云服務(wù)能夠避免維護機房帶來的麻煩,但除非付費搭建私有云,否則依然要與其他云用戶共享硬件資源,這就使得企業(yè)無法對遠程硬件擁有足夠的控制權(quán)。任何擁有憑據(jù)的人可以從任何有網(wǎng)絡(luò)連接的地方訪問云端數(shù)據(jù),也意味著廣泛的接入點,如果不能在每個位置都部署安全措施,那么傳輸?shù)臄?shù)據(jù)風(fēng)險也很大。
要論最安全、最可控,還是要屬自建數(shù)據(jù)中心,只允許擁有憑證和設(shè)備的人才能訪問本地網(wǎng)絡(luò),可以讓企業(yè)完全控制數(shù)據(jù),以及基礎(chǔ)硬件,更適合那些業(yè)務(wù)復(fù)雜多元的組織。
第三,多云/混合云有幫助,但無法徹底解決顧慮。
既然這樣,不把雞蛋放在一個籃子里,一次用兩個甚至兩個以上的云,不就可以在出現(xiàn)故障時快速啟動“備胎”嗎?道理雖然如此,但多云部署的成本很高,并且依然不能完全防止短期終中斷,有時還需要人工參與,并不像我們想象的那樣能夠瞬間絲滑切換。
比如Gov.uk 就在亞馬遜的 CloudFront服務(wù)上運行了備份 CDN, 但需要人工干預(yù)才能切換到備份。
而適合建設(shè)云基礎(chǔ)設(shè)施的環(huán)境也常常會出現(xiàn)扎堆的情況,從而導(dǎo)致幾家云服務(wù)商要停機就一起停的尷尬。此前,亞馬遜和微軟在愛爾蘭都柏林的云基礎(chǔ)設(shè)施,就因為遭遇雷暴天氣,讓使用亞馬遜EC2和微軟BPOS服務(wù)的客戶都宕機了。
另外,并不是所有的云都是完全開放、可互操作的,這時候為了用好每一個云平臺,企業(yè)還需要通過多個系統(tǒng)來配合,增加了額外的支出和運維難題。
所以說,只有足夠可靠的云服務(wù),才能打消客戶的顧慮,從本地容災(zāi)備份、混合云等其他方案,轉(zhuǎn)變?yōu)槿嬉蕾囋?,并且只依賴某一朵云?/p>
當(dāng)許多人呼吁著,把云看作萬能神藥的時候,必須考慮一個前提:云服務(wù)怎樣才能變得足夠穩(wěn)定和安全?而這一點,似乎跟現(xiàn)實還有點距離。
安全力Max:Facebook的冗余啟示錄
歸根結(jié)底,想要業(yè)務(wù)更可靠,每個組織都沒有“一刀切”的解決方案。
公共云、私有云、混合云或傳統(tǒng)數(shù)據(jù)中心,如何選擇應(yīng)該按照不同企業(yè)、不同數(shù)據(jù)隱私敏感度、成本預(yù)算等來綜合考量。
簡單來說,傳統(tǒng)數(shù)據(jù)中心成本高,控制強,很適合那些已經(jīng)在IT方面進行了大量投資,對數(shù)據(jù)隱私要求謹慎的組織,所以像Facebook這樣涉及到全球幾十億用戶信息的互聯(lián)網(wǎng)企業(yè),數(shù)據(jù)中心是必須配置的。
而大多數(shù)企業(yè),完全沒有必要自己搭建服務(wù)器。直接上云省心又省力,可以快速搭建起網(wǎng)絡(luò)業(yè)務(wù),但過程中必須對隱私訪問進行密切監(jiān)控。
而即擁有IT 基礎(chǔ)設(shè)施的大型組織,但也希望開始云之旅的大型企業(yè)和組織,可以同時嘗試混合云,將云平臺的所有優(yōu)勢都“一網(wǎng)打盡”。不過,跟蹤多個云可能會比較棘手,往往需要第三方儀表板等協(xié)助。
看到這里,你可能會發(fā)現(xiàn)數(shù)字時代業(yè)務(wù)安全的核心密碼:冗余思維。分別來自:
硬件的冗余,有充足的服務(wù)器保障,如果整個數(shù)據(jù)中心受到?jīng)_擊,數(shù)據(jù)可以復(fù)制到其他地理位置的數(shù)據(jù)中心上;
服務(wù)的冗余,利用多個云服務(wù)商的服務(wù)耦合,比如主要云服務(wù)商停電期間,二級供應(yīng)商的云服務(wù)可以作為補救措施,確保業(yè)務(wù)繼續(xù);
視角的冗余,更多數(shù)據(jù)源頭也被納入考量中來,比如工業(yè)部門常見的邊緣設(shè)備,傳感器、監(jiān)視器和控制/驅(qū)動設(shè)備等,就正在成為云時代的“新數(shù)據(jù)源”,需要被納入到主動管理中來,比如增加DNS(域名解析服務(wù))解決方案,避免單一DNS中斷或減速。
VMware的一些統(tǒng)計數(shù)據(jù)表明,未來五年內(nèi),許多組織的工作負載將按 30% 數(shù)據(jù)中心、40%公有云,以及 30% 的邊緣計算來分布。
從這個角度來說,云市場還有不少空間可待挖掘,廠商之間的明爭暗斗還將持續(xù)一段時間。
而企業(yè)在數(shù)字化過程中考慮云服務(wù)時,也需要重視三個基本前提。
1.將云安全作為優(yōu)先事項。互聯(lián)網(wǎng)充滿了機會,也意味著無法繼續(xù)躲在防火墻背后得到充分的保護,因此安全必須作為重中之重。
2.引入多云和混合云策略。如果對云端安全不了解,那么引入多個云供應(yīng)商可以有效降低被單一云鎖定的風(fēng)險,為云策略的后續(xù)優(yōu)化留下空間。
3.優(yōu)先將前端流量處理業(yè)務(wù)遷移上云。尤其是大量視頻和音樂流量的業(yè)務(wù),可以遷移到云上,靈活擴展帶寬,避免網(wǎng)絡(luò)使用高峰時響應(yīng)不及時的情況發(fā)生。而一些放在原本數(shù)據(jù)中心的應(yīng)用,仍然留在本地設(shè)施上。
Facebook的故事背面,是互聯(lián)網(wǎng)巨頭托舉起國家和社會服務(wù)的現(xiàn)實景象,這也使我們反思,一味強調(diào)云,是不是將數(shù)字化想得過于簡單。
云服務(wù)產(chǎn)生的變革固然讓人興奮不已,但這并不代表,云就會干掉傳統(tǒng)數(shù)據(jù)中心,或者某朵云“獨霸天下”。
容納共存,在這個基礎(chǔ)上重新定義云和網(wǎng)絡(luò)服務(wù),或許會幫我們看清新信息技術(shù)的新模式,以及云市場的新機會。
- 蜜度索驥:以跨模態(tài)檢索技術(shù)助力“企宣”向上生長
- 美媒聚焦比亞迪“副業(yè)”:電子代工助力蘋果,下個大計劃瞄準AI機器人
- 微信零錢通新政策:銀行卡轉(zhuǎn)入資金提現(xiàn)免手續(xù)費引熱議
- 消息稱塔塔集團將收購和碩印度iPhone代工廠60%股份 并接管日常運營
- 蘋果揭秘自研芯片成功之道:領(lǐng)先技術(shù)與深度整合是關(guān)鍵
- 英偉達新一代Blackwell GPU面臨過熱挑戰(zhàn),交付延期引發(fā)市場關(guān)注
- 馬斯克能否成為 AI 部部長?硅谷與白宮的聯(lián)系日益緊密
- 余承東:Mate70將在26號發(fā)布,意外泄露引發(fā)關(guān)注
- 無人機“黑科技”亮相航展:全球首臺低空重力測量系統(tǒng)引關(guān)注
- 賽力斯發(fā)布聲明:未與任何伙伴聯(lián)合開展人形機器人合作
- 賽力斯觸及漲停,汽車整車股盤初強勢拉升
免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關(guān)資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負任何法律責(zé)任。任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。