"崩潰"的2024:十大互聯(lián)網(wǎng)宕機(jī)事件復(fù)盤(pán)與啟示

誰(shuí)能想到,“崩”也成了一種上熱搜的新姿勢(shì)?;仡?024年,微軟、騰訊云、支付寶、美團(tuán)、阿里云、微軟、百度地圖、網(wǎng)易云音樂(lè)等多家頭部互聯(lián)網(wǎng)企業(yè)相繼發(fā)生App崩潰事件,引發(fā)網(wǎng)友熱議。

美團(tuán)崩了,外賣(mài)點(diǎn)不了;百度地圖崩了,導(dǎo)航面臨挑戰(zhàn);微軟藍(lán)屏故障,很多人工作直接受影響……不少人從這一次次的系統(tǒng)故障中深刻體會(huì)到,互聯(lián)網(wǎng)對(duì)生活工作的影響無(wú)處不在,認(rèn)清網(wǎng)絡(luò)安全之重要。

我們梳理了2024年至今影響范圍較大的十起互聯(lián)網(wǎng)宕機(jī)事件,并按照對(duì)人們的影響將它們分為五個(gè)級(jí)別,從輕到重進(jìn)行了排列。

五星:全球性事件

四星:國(guó)內(nèi),影響B(tài)端

三星:國(guó)內(nèi),影響C端,工作相關(guān)

兩星:國(guó)內(nèi),影響C端,生活必備

一星:國(guó)內(nèi),影響C端,非必須

下面,我們就一起看看這些宕機(jī)事件的“名場(chǎng)面”,以及背后的原因都是什么。

網(wǎng)易云音樂(lè)半年崩兩次 音樂(lè)播放等異常

時(shí)間:2024年8月

評(píng)級(jí):??

8月19日,不少網(wǎng)友反映,網(wǎng)易云音樂(lè)頁(yè)面出現(xiàn)“服務(wù)器發(fā)生錯(cuò)誤”,音樂(lè)播放、加載等均出現(xiàn)異常。隨后,“網(wǎng)易云音樂(lè)崩了”登上微博熱搜。
此次故障持續(xù)時(shí)間近兩個(gè)小時(shí),期間有傳言稱(chēng),故障因“網(wǎng)易云音樂(lè)開(kāi)發(fā)者刪庫(kù)跑路”。對(duì)此,網(wǎng)易云音樂(lè)官微回應(yīng)稱(chēng),沒(méi)有刪庫(kù),沒(méi)有跑路,因基礎(chǔ)設(shè)施故障,導(dǎo)致網(wǎng)易云音樂(lè)各端無(wú)法正常使用。

值得一提的是,今年3月,網(wǎng)易云音樂(lè)也曾因系統(tǒng)故障登上熱搜。彼時(shí),網(wǎng)易云音樂(lè)登陸狀態(tài)失效,需要重新登錄。網(wǎng)易云音樂(lè)客服回應(yīng)稱(chēng),登陸情況異常是網(wǎng)絡(luò)異常導(dǎo)致,與版本更新無(wú)關(guān),故障在一段時(shí)間后修復(fù)。

中國(guó)移動(dòng)系統(tǒng)故障 用戶(hù)無(wú)法登陸

時(shí)間:2024年10月

評(píng)級(jí):????

10月21日,多位中國(guó)移動(dòng)用戶(hù)反映,中國(guó)移動(dòng)客戶(hù)端和官網(wǎng)等無(wú)法登陸,充值等業(yè)務(wù)無(wú)法辦理。

當(dāng)晚,中國(guó)移動(dòng)廣東公司官微發(fā)文回應(yīng)稱(chēng),10月21日15:47起,中國(guó)移動(dòng)廣東公司陸續(xù)接到客戶(hù)反映,官方App無(wú)法登錄、充值等業(yè)務(wù)無(wú)法辦理。技術(shù)部門(mén)迅速開(kāi)展故障排查,發(fā)現(xiàn)負(fù)載均衡設(shè)備異常,導(dǎo)致業(yè)務(wù)系統(tǒng)不穩(wěn)定。經(jīng)過(guò)緊急處置,系統(tǒng)服務(wù)已于17:06全面恢復(fù)。

百度地圖短暫崩潰 定位出現(xiàn)錯(cuò)誤

時(shí)間:2024年8月

評(píng)級(jí):????

8月7日,百度地圖因?yàn)橄到y(tǒng)問(wèn)題崩上熱搜。當(dāng)天中午,有網(wǎng)友在社交平臺(tái)反映,百度地圖出現(xiàn)自駕路線無(wú)法正常規(guī)劃、定位錯(cuò)誤等問(wèn)題。緊接著,“百度地圖崩了”登上微博熱搜。

百度地圖客服對(duì)此回應(yīng)稱(chēng),目前百度地圖系統(tǒng)確實(shí)出現(xiàn)錯(cuò)誤,服務(wù)器正在緊急修復(fù)中。當(dāng)天下午,相關(guān)問(wèn)題已修復(fù)。

美團(tuán)APP因系統(tǒng)升級(jí)崩了 外賣(mài)服務(wù)無(wú)法使用

時(shí)間:2024年4月

評(píng)級(jí):????

4月26日,有網(wǎng)友在社交平臺(tái)表示,美團(tuán)APP崩了,主頁(yè)面無(wú)法加載,外賣(mài)等服務(wù)無(wú)法使用。

對(duì)此,美團(tuán)官方客服表示,目前系統(tǒng)正在升級(jí),可能導(dǎo)致部分用戶(hù)的主頁(yè)面無(wú)法加載,已在緊急處理。等系統(tǒng)升級(jí)后,就會(huì)自動(dòng)恢復(fù)正常。

雙11支付寶崩了 無(wú)法正常支付

時(shí)間:2024年11月

評(píng)級(jí):????

在雙11大促即將收官之時(shí),支付寶又崩了。11月11日,不少網(wǎng)友表示遭遇支付寶異常無(wú)法付款,付款時(shí)顯示“重復(fù)扣款”“支付失敗” “服務(wù)異?!钡取_€有網(wǎng)友稱(chēng),支付寶出現(xiàn)余額寶提現(xiàn)未到賬、花唄還款扣款成功但賬單沒(méi)清等。隨后,“支付寶崩了”登上熱搜榜第一。

支付寶官微對(duì)此很快作出回應(yīng),稱(chēng)“因系統(tǒng)消息庫(kù)出現(xiàn)局部故障,導(dǎo)致部分用戶(hù)的支付功能受到影響。該故障不會(huì)影響用戶(hù)的資金安全,截止上午10點(diǎn)50分故障已經(jīng)修復(fù)?!?/p>

4月9日,“支付寶崩了”也曾登上微博熱搜,部分網(wǎng)友反映支付寶無(wú)法使用,用不了螞蟻森林等功能。對(duì)此,支付寶客服表示,今日確有系統(tǒng)異常報(bào)錯(cuò),少量用戶(hù)訪問(wèn)部分頁(yè)面時(shí)出現(xiàn)了短暫性的訪問(wèn)不暢。這一情況已經(jīng)快速恢復(fù),用戶(hù)的資金和信息安全都不受影響,各項(xiàng)功能也都可以正常使用。

大周一 企業(yè)微信文檔崩了

時(shí)間:2024年12月

評(píng)級(jí):??????

12月2日上午,不少著急開(kāi)例會(huì)的網(wǎng)友反映,企業(yè)微信文檔崩了,頁(yè)面打不開(kāi),多項(xiàng)功能無(wú)法使用。

隨后,企業(yè)微信文檔官微發(fā)文稱(chēng),“因訪問(wèn)激增,部分企業(yè)微信文檔出現(xiàn)文檔打開(kāi)異常,目前已完成修復(fù)?!?/p>

WPS三個(gè)月崩了四次 在線文檔無(wú)法使用

時(shí)間:2024年9月

評(píng)級(jí):??????

9月6日,“WPS崩了”再度沖上熱搜。大量網(wǎng)友反饋WPS出現(xiàn)在線文檔無(wú)法打開(kāi)的故障。而這已經(jīng)是該應(yīng)用三個(gè)月內(nèi)第四次宕機(jī)。

8月21日WPS就因發(fā)生服務(wù)異常而引發(fā)熱議。當(dāng)天下午,WPS客戶(hù)服務(wù)官微回應(yīng):經(jīng)緊急修復(fù),WPS服務(wù)已恢復(fù)。作為補(bǔ)償,8月22日0點(diǎn)-24點(diǎn),所有用戶(hù)可以免費(fèi)領(lǐng)取15天會(huì)員。

7月8日上午,“WPS崩了”也曾沖上熱搜。隨后,WPS客戶(hù)服務(wù)致歉稱(chēng),“因服務(wù)異常給大家添麻煩了,大家反饋的問(wèn)題我們?cè)诨鹚倥挪椴⑿迯?fù),服務(wù)已恢復(fù)正常?!?/p>

另外,在6月28日下午,也有不少網(wǎng)友反映“WPS崩了”,金山文檔打不開(kāi)。金山辦公當(dāng)時(shí)向媒體回應(yīng)稱(chēng),崩潰原因或與云服務(wù)異常有關(guān)。

阿里云服務(wù)器故障 小紅書(shū)、B站崩上熱搜

時(shí)間:2024年7月

評(píng)級(jí):????????

在數(shù)字化時(shí)代,云服務(wù)被廣泛應(yīng)用,涉及眾多企業(yè)和個(gè)人用戶(hù)。因此,云服務(wù)宕機(jī)的影響輻射范圍往往也更廣。

7月2日,“B站崩了”“小紅書(shū)崩了”“戀與深空崩了”“酷安都崩了”等多個(gè)詞條登上微博熱搜。不少網(wǎng)友反饋稱(chēng),B站視頻評(píng)論區(qū)及個(gè)人主頁(yè)無(wú)法正常加載,瀏覽歷史、消息界面、客服界面等均出現(xiàn)訪問(wèn)故障。小紅書(shū)等應(yīng)用也都出現(xiàn)網(wǎng)絡(luò)異常問(wèn)題。隨后,有消息稱(chēng),此番連鎖故障與服務(wù)商阿里云有關(guān)。

同日,阿里云客服向媒體回應(yīng)稱(chēng),上海地域可用區(qū)N網(wǎng)絡(luò)訪問(wèn)出現(xiàn)異常,經(jīng)過(guò)處理現(xiàn)已恢復(fù),但B站服務(wù)器不是阿里云的。

據(jù)了解,阿里云在近幾年曾多次出現(xiàn)服務(wù)故障。2023年11月,阿里云產(chǎn)品控制臺(tái)訪問(wèn)及API調(diào)用出現(xiàn)使用異常,導(dǎo)致“淘寶又崩了”“閑魚(yú)崩了”“釘釘崩了”等話題相繼登上微博熱搜。2022年12月,阿里云爆發(fā)香港Region可用區(qū)C大規(guī)模服務(wù)中斷事件,導(dǎo)致多個(gè)香港及澳門(mén)站點(diǎn)受到影響。

今年以來(lái),B站也曾多次服務(wù)器崩潰,用戶(hù)無(wú)法正常訪問(wèn),此前官方解釋因服務(wù)器負(fù)載過(guò)高。

騰訊云服務(wù)器故障 1957個(gè)客戶(hù)報(bào)障

時(shí)間:2024年4月

評(píng)級(jí):????????

4月8日,“騰訊云崩了”沖上熱搜。不少網(wǎng)友反饋稱(chēng),騰訊云出現(xiàn)服務(wù)故障,網(wǎng)頁(yè)顯示504錯(cuò)誤,服務(wù)器網(wǎng)絡(luò)連接不上,控制臺(tái)無(wú)法訪問(wèn)。

當(dāng)天下午4點(diǎn)45分,騰訊云官微回應(yīng)稱(chēng),官網(wǎng)控制臺(tái)相關(guān)服務(wù)出現(xiàn)異常,工程師緊急修復(fù)中,部分地區(qū)已恢復(fù)。下午5點(diǎn)16分,騰訊云在微博稱(chēng)“整體已恢復(fù)”。

4月14日,針對(duì)此次故障,騰訊云官方發(fā)布復(fù)盤(pán)及情況說(shuō)明。說(shuō)明顯示,此次故障一共持續(xù)了近87分鐘,期間共有1957個(gè)客戶(hù)報(bào)障。云API異常導(dǎo)致控制臺(tái)登陸不上,而依賴(lài)云API提供產(chǎn)品能力的部分公有云服務(wù),也因?yàn)樵艫PI的異常出現(xiàn)了無(wú)法使用的情況,比如云函數(shù)、文字識(shí)別、微服務(wù)平臺(tái)、音頻內(nèi)容安全、驗(yàn)證碼等。

騰訊云表示,此次故障最根本的原因,是在版本變更過(guò)程中,沒(méi)有有效執(zhí)行沙箱驗(yàn)證和預(yù)案演練,暴露了在變更管理上的不足,接下來(lái)將從提升系統(tǒng)韌性、強(qiáng)化變更管理與保護(hù)措施、增強(qiáng)故障響應(yīng)與溝通能力等幾個(gè)方面快速進(jìn)行改進(jìn)和完善,以減少故障的影響范圍和影響時(shí)長(zhǎng)。

微軟藍(lán)屏,一樁全球IT災(zāi)難級(jí)事件

時(shí)間:2024年7月

評(píng)級(jí):??????????

微軟藍(lán)屏故障,可謂今年內(nèi)影響范圍最廣、損失最大的一起宕機(jī)事件,波及至少20多個(gè)國(guó)家,被認(rèn)為是一樁全球IT災(zāi)難級(jí)事件。

7月19日,全球約850萬(wàn)臺(tái)裝有Windows操作系統(tǒng)的計(jì)算機(jī)出現(xiàn)“藍(lán)屏”死機(jī)現(xiàn)象,出現(xiàn)故障的終端并不限于桌面終端,還覆蓋了大量的服務(wù)器和云節(jié)點(diǎn),而且相關(guān)主機(jī)重新啟動(dòng)后依然會(huì)自動(dòng)進(jìn)入藍(lán)屏狀態(tài),反復(fù)崩潰。緊接著,“微軟藍(lán)屏”登上微博熱搜。

由于微軟藍(lán)屏故障,美國(guó)、英國(guó)、德國(guó)、荷蘭、西班牙、波蘭、比利時(shí)等10多個(gè)國(guó)家的部分機(jī)場(chǎng)、車(chē)站、碼頭及媒體、電信、銀行等行業(yè)的運(yùn)營(yíng)受到影響。另外,多國(guó)的石油、天然氣、電力、股票、貨幣和債券交易商都在19日當(dāng)天難以正常展開(kāi)交易。

而導(dǎo)致這一歷史事件的主角是美國(guó)網(wǎng)絡(luò)安全企業(yè)CrowdStrike。CrowdStrike的一個(gè)錯(cuò)誤更新導(dǎo)致受影響的電腦和服務(wù)器無(wú)法正常啟動(dòng),迫使它們陷入了恢復(fù)啟動(dòng)循環(huán)。CrowdStrike在全球范圍內(nèi)被廣泛用于管理Windows PC和服務(wù)器的安全。

值得一提的是,在此次全球微軟藍(lán)屏事件中,國(guó)內(nèi)企業(yè)受到的沖擊很小。因?yàn)镃rowdStrike是個(gè)典型的B2B企業(yè),其安全控制軟件多部署在企業(yè)環(huán)境中,個(gè)人家庭電腦此次受影響很小,國(guó)內(nèi)受到波及的主要是少數(shù)使用CrowdStrike軟件的外企。

寫(xiě)在最后:

過(guò)去一年,互聯(lián)網(wǎng)應(yīng)用宕機(jī)事件幾乎每個(gè)月都有發(fā)生,雖然大多都在2個(gè)小時(shí)左右的時(shí)間修復(fù),但還是給用戶(hù)的生活和工作造成不便。而網(wǎng)友在吐槽應(yīng)用崩潰導(dǎo)致的糟糕使用體驗(yàn)之余,更是將宕機(jī)事件與各個(gè)大廠的裁員行為聯(lián)系了起來(lái),認(rèn)為“大廠裁員裁到大動(dòng)脈”,波及到了相關(guān)技術(shù)、運(yùn)維團(tuán)隊(duì)的正常運(yùn)作。

不過(guò),這種言論也僅僅是網(wǎng)友的調(diào)侃或猜測(cè),真實(shí)原因難以考究。理論上來(lái)說(shuō),一個(gè)成熟的互聯(lián)網(wǎng)公司,邊緣業(yè)務(wù)可能會(huì)因?yàn)槿瞬帕魇艿接绊?,核心業(yè)務(wù)基本不可能,大規(guī)模宕機(jī)事件更多是技術(shù)層面的問(wèn)題。

比如上文提到的,支付寶、百度地圖、網(wǎng)易云音樂(lè)、美團(tuán)短暫崩潰都是因?yàn)橄到y(tǒng)故障或升級(jí)引起的,阿里云服務(wù)器故障是因?yàn)樯虾5赜蚩捎脜^(qū)N網(wǎng)絡(luò)訪問(wèn)出現(xiàn)異常,微軟藍(lán)屏事件是第三方安全軟件的鍋,騰訊云崩潰則暴露了在變更管理上的不足。

隨著互聯(lián)網(wǎng)應(yīng)用發(fā)展愈加成熟,硬件安全早已不成問(wèn)題,但技術(shù)系統(tǒng)軟環(huán)境的安全仍有待完善。互聯(lián)網(wǎng)企業(yè)尤其是頭部企業(yè),除了分析總結(jié)宕機(jī)原因,還應(yīng)對(duì)系統(tǒng)架構(gòu)進(jìn)行優(yōu)化,比如增強(qiáng)服務(wù)器的冗余設(shè)計(jì),定期進(jìn)行系統(tǒng)測(cè)試和演練等。

此外,各類(lèi)應(yīng)用交替出現(xiàn)故障,考驗(yàn)平臺(tái)基礎(chǔ)設(shè)施、技術(shù)能力和修復(fù)速度的同時(shí),如何做好用戶(hù)運(yùn)營(yíng)亦受到關(guān)注。平臺(tái)通過(guò)官方渠道及時(shí)告知用戶(hù)問(wèn)題和大致恢復(fù)時(shí)間,避免用戶(hù)產(chǎn)生誤解和恐慌。像WPS、網(wǎng)易云音樂(lè)那樣給用戶(hù)補(bǔ)償會(huì)員也是一種方法。

最后,作為用戶(hù),衷心希望各大廠商能夠筑牢網(wǎng)絡(luò)安全“防火墻”,宕機(jī)事件不再頻繁上演。

極客網(wǎng)企業(yè)會(huì)員

免責(zé)聲明:本網(wǎng)站內(nèi)容主要來(lái)自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁(yè)或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書(shū)面權(quán)利通知或不實(shí)情況說(shuō)明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開(kāi)相關(guān)鏈接。

2024-12-24
"崩潰"的2024:十大互聯(lián)網(wǎng)宕機(jī)事件復(fù)盤(pán)與啟示
衷心希望各大廠商能夠筑牢網(wǎng)絡(luò)安全“防火墻”,宕機(jī)事件不再頻繁上演。

長(zhǎng)按掃碼 閱讀全文