全年盤點:2017年國外的10大云故障

隨著云應(yīng)用的愈發(fā)成熟,云計算提供商也開發(fā)出了更好的維護工具來運營最大的、最先進的服務(wù)器集群,因此,災(zāi)難性的云計算故障在2017年似乎是一個不合時宜的事了。雖然所有廠商都遭遇了可能會限制特定服務(wù)的宕機時間,或者局部不可用的短時間故障,但是很多人認為,在早期出現(xiàn)的那種大規(guī)模故障,肯定是原始時代的事情了。

但是接近2月底的時候,AWS的故障事件就震動了整個行業(yè),打擊了企業(yè)客戶對采用云計算的信心,因為故障當天有數(shù)量龐大的業(yè)務(wù)受到影響,GitHub、Slack、Zendesk、Heroku、Twilio、Mailchimp、Citrix和Expedia,只是其中的一小部分。當AWS透露這次故障是由人為錯誤導(dǎo)致,人們的信心進一步降低——實際上是由于技術(shù)人員輸入不正確的單行命令導(dǎo)致。

下面是盤點出的2017年國外10大云故障,提醒人們,這個快速成熟的行業(yè),其出色運營的風(fēng)險比以往任何時候都要高。

全年盤點:2017年國外的10大云故障

IBM,1月26日

全年盤點:2017年國外的10大云故障

今年年初,IBM云的可信度受到打擊,當時客戶用于訪問Bluemix云基礎(chǔ)設(shè)施的一個管理門戶出現(xiàn)數(shù)小時的故障。

雖然底層基礎(chǔ)設(shè)施沒有發(fā)生故障,但是客戶沮喪地發(fā)現(xiàn),他們無法管理他們的應(yīng)用、無法添加或者移除為工作負載提供支持的云資源。

IBM表示,這次故障是間歇性的,是由接口的錯誤更新導(dǎo)致。

GitLab,1月31日

全年盤點:2017年國外的10大云故障

GitLab廣受歡迎的在線代碼庫GitLab.com遭遇了18個小時的服務(wù)中斷,最終還是沒有完全修復(fù)。這次故障主要原因是,一位員工在維護流程中將一個數(shù)據(jù)庫目錄從錯誤的數(shù)據(jù)庫服務(wù)器中刪除導(dǎo)致的。

GitLab事后表示,最樂觀的估計是,這次故障影響了大約5000個項目、5000條評論和700個新用戶帳戶。

Facebook,2月2日

全年盤點:2017年國外的10大云故障

在漫長而痛苦的三個小時中,全球各地的一些用戶被鎖在Facebook之外,擔(dān)心他們的帳戶被黑客入侵。

社交媒體巨頭Facebook隨后解釋說,有功能將會防范黑客發(fā)送給用戶一個恢復(fù)屏幕,讓人感覺有人登錄了他們的帳戶,受影響的用戶會被阻止立即重新登錄。

Facebook確認實際上并沒有發(fā)生安全漏洞。這是Facebook第二次出現(xiàn)故障。幾天之前,有人報告說他們看不到他們的新聞消息。

AWS,2月28日

全年盤點:2017年國外的10大云故障

這是一次震動整個業(yè)界的故障事件。一位AWS工程師試圖對位于弗吉尼亞州數(shù)據(jù)中心內(nèi)的一個S3存儲系統(tǒng)進行調(diào)試的時候,意外地輸入了一個錯誤命令行,隨后大部分互聯(lián)網(wǎng),包括Slack、Quora和Trello在內(nèi)的很多企業(yè)平臺停機了4個小時。

調(diào)查顯示,該員工使用既定的步驟,試圖關(guān)閉少量托管了計費流程子系統(tǒng)的服務(wù)器。相反,意外的命令導(dǎo)致更大范圍服務(wù)器處于脫機狀態(tài),其中包括為服務(wù)器提供特定數(shù)據(jù)存儲所需的一個子系統(tǒng),以及另一個分配新存儲的子系統(tǒng)。

這次由這樣一家?guī)缀跽紦?jù)了全球1/3云市場份額的提供商導(dǎo)致的故障,重新引發(fā)了關(guān)于公有云風(fēng)險的爭論。

微軟,3月16日

全年盤點:2017年國外的10大云故障

存儲可用性問題困擾了微軟Azure公有云超過8個小時,主要影響到美國東部的一些客戶。一些用戶無法配置新存儲或者訪問該地區(qū)的現(xiàn)有資源。隨后一個微軟工程團隊將這次故障歸咎于一個存儲集群端點并出現(xiàn)不可用的情況。

除了該問題之外,微軟還在Azure狀態(tài)頁面上列出了一個軟件錯誤,使得多個服務(wù)的存儲配置受影響超過1個小時。

微軟Office 365,3月21日

全年盤點:2017年國外的10大云故障

由于用戶身份驗證問題,導(dǎo)致多個微軟企業(yè)和消費級云服務(wù)(包括Office 365存儲和電子郵件服務(wù))無法使用。

這次受影響廣泛的故障使得客戶無法訪問OneDrive存儲、Skype協(xié)作、Outlook電子郵件、以及像Xbox Live這樣的消費級產(chǎn)品。

蘋果iCloud,6月28日

全年盤點:2017年國外的10大云故障

有多個社交媒體來源報道稱,蘋果iCloud Backup服務(wù)出現(xiàn)了可用性故障。平臺的系統(tǒng)狀態(tài)頁面顯示,iCloud Backup只影響了不到1%的用戶。

在這次故障中,受影響的用戶無法從之前的備份中恢復(fù)iOS設(shè)備,持續(xù)了至少36小時。雖然恢復(fù)過程會被掛起無法完成,但是啟動新的設(shè)備備份以保護數(shù)據(jù)是沒有問題的。

AWS,9月14日

全年盤點:2017年國外的10大云故障

雖然9月份發(fā)生的這起AWS服務(wù)遠不如2月份的那么嚴重,但事實上這次故障影響了S3存儲服務(wù),且源自于同一個US-EAST-1地區(qū),足以引起人們對半年前災(zāi)難性事件的不愉快回憶。

訪問存儲塊出現(xiàn)問題,從當天中午開始引起人們的注意,并在東部時間下午1點前得到控制。

微軟Azure,9月29日

全年盤點:2017年國外的10大云故障

當天歐洲的客戶無法使用微軟Azure公有云中的一些服務(wù)長達7個小時。這次讓北歐第二大云計算提供商出現(xiàn)故障的原因是意外啟動了滅火系統(tǒng)。微軟表示,對系統(tǒng)的日常維護工作導(dǎo)致滅火氣體釋放,自動出發(fā)空調(diào)系統(tǒng)關(guān)閉,從而讓設(shè)備溫度升高,迫使計算機系統(tǒng)自動關(guān)閉。

像Virtual Machines、Cloud Services、Azure Backup等多個重要服務(wù)都在本地時間下午1:27到8:15處于脫機狀態(tài)。

Google Docs,11月15日

全年盤點:2017年國外的10大云故障

有數(shù)千位Google Docs用戶遭遇了服務(wù)中斷,導(dǎo)致他們的業(yè)務(wù)受到影響。

這次停機是從東部時間下午4點之前開始的,持續(xù)了30分鐘到1個小時的時間。Google證實,這次故障影響了一個“重要用戶子集”,備受歡迎的文檔創(chuàng)建和編輯工具也無法訪問文件。

Google表示,在周三晚上對于大多數(shù)用戶來說Google Docs服務(wù)已經(jīng)恢復(fù)。

Google的一家合作伙伴表示,在其400家企業(yè)客戶中,有6家受到這次故障的影響。這家解決方案提供商,同時也是Google用戶,本身也受到了影響。

免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關(guān)資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負任何法律責(zé)任。任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。

2017-12-25
全年盤點:2017年國外的10大云故障
下面是盤點出的2017年國外10大云故障,提醒人們,這個快速成熟的行業(yè),其出色運營的風(fēng)險比以往任何時候都要高。

長按掃碼 閱讀全文