掃碼登錄
誰能想到," 崩 " 也成了一種上熱搜的新姿勢?;仡?2024 年,微軟、騰訊云、支付寶、美團(tuán)、阿里云、微軟、百度地圖、網(wǎng)易云音樂等多家頭部互聯(lián)網(wǎng)企業(yè)相繼發(fā)生 App 崩潰事件,引發(fā)網(wǎng)友熱議。
美團(tuán)崩了,外賣點(diǎn)不了;百度地圖崩了,導(dǎo)航面臨挑戰(zhàn);微軟藍(lán)屏故障,很多人工作直接受影響……不少人從這一次次的系統(tǒng)故障中深刻體會到,互聯(lián)網(wǎng)對生活工作的影響無處不在,認(rèn)清網(wǎng)絡(luò)安全之重要。
我們梳理了 2024 年至今影響范圍較大的十起互聯(lián)網(wǎng)宕機(jī)事件,并按照對人們的影響將它們分為五個級別,從輕到重進(jìn)行了排列。
五星:全球性事件
四星:國內(nèi),影響 B 端
三星:國內(nèi),影響 C 端,工作相關(guān)
兩星:國內(nèi),影響 C 端,生活必備
一星:國內(nèi),影響 C 端,非必須
下面,我們就一起看看這些宕機(jī)事件的 " 名場面 ",以及背后的原因都是什么。
網(wǎng)易云音樂半年崩兩次 音樂播放等異常
時間:2024 年 8 月
評級:
8 月 19 日,不少網(wǎng)友反映,網(wǎng)易云音樂頁面出現(xiàn) " 服務(wù)器發(fā)生錯誤 ",音樂播放、加載等均出現(xiàn)異常。隨后," 網(wǎng)易云音樂崩了 " 登上微博熱搜。
此次故障持續(xù)時間近兩個小時,期間有傳言稱,故障因 " 網(wǎng)易云音樂開發(fā)者刪庫跑路 "。對此,網(wǎng)易云音樂官微回應(yīng)稱,沒有刪庫,沒有跑路,因基礎(chǔ)設(shè)施故障,導(dǎo)致網(wǎng)易云音樂各端無法正常使用。
值得一提的是,今年 3 月,網(wǎng)易云音樂也曾因系統(tǒng)故障登上熱搜。彼時,網(wǎng)易云音樂登陸狀態(tài)失效,需要重新登錄。網(wǎng)易云音樂客服回應(yīng)稱,登陸情況異常是網(wǎng)絡(luò)異常導(dǎo)致,與版本更新無關(guān),故障在一段時間后修復(fù)。
中國移動系統(tǒng)故障 用戶無法登陸
時間:2024 年 10 月
評級:
10 月 21 日,多位中國移動用戶反映,中國移動客戶端和官網(wǎng)等無法登陸,充值等業(yè)務(wù)無法辦理。
當(dāng)晚,中國移動廣東公司官微發(fā)文回應(yīng)稱,10 月 21 日 15:47 起,中國移動廣東公司陸續(xù)接到客戶反映,官方 App 無法登錄、充值等業(yè)務(wù)無法辦理。技術(shù)部門迅速開展故障排查,發(fā)現(xiàn)負(fù)載均衡設(shè)備異常,導(dǎo)致業(yè)務(wù)系統(tǒng)不穩(wěn)定。經(jīng)過緊急處置,系統(tǒng)服務(wù)已于 17:06 全面恢復(fù)。
百度地圖短暫崩潰 定位出現(xiàn)錯誤
8 月 7 日,百度地圖因為系統(tǒng)問題崩上熱搜。當(dāng)天中午,有網(wǎng)友在社交平臺反映,百度地圖出現(xiàn)自駕路線無法正常規(guī)劃、定位錯誤等問題。緊接著," 百度地圖崩了 " 登上微博熱搜。
百度地圖客服對此回應(yīng)稱,目前百度地圖系統(tǒng)確實出現(xiàn)錯誤,服務(wù)器正在緊急修復(fù)中。當(dāng)天下午,相關(guān)問題已修復(fù)。
美團(tuán) APP 因系統(tǒng)升級崩了 外賣服務(wù)無法使用
時間:2024 年 4 月
4 月 26 日,有網(wǎng)友在社交平臺表示,美團(tuán) APP 崩了,主頁面無法加載,外賣等服務(wù)無法使用。
對此,美團(tuán)官方客服表示,目前系統(tǒng)正在升級,可能導(dǎo)致部分用戶的主頁面無法加載,已在緊急處理。等系統(tǒng)升級后,就會自動恢復(fù)正常。
雙 11 支付寶崩了 無法正常支付
時間:2024 年 11 月
在雙 11 大促即將收官之時,支付寶又崩了。11 月 11 日,不少網(wǎng)友表示遭遇支付寶異常無法付款,付款時顯示 " 重復(fù)扣款 "" 支付失敗 " " 服務(wù)異常 " 等。還有網(wǎng)友稱,支付寶出現(xiàn)余額寶提現(xiàn)未到賬、花唄還款扣款成功但賬單沒清等。隨后," 支付寶崩了 " 登上熱搜榜第一。
支付寶官微對此很快作出回應(yīng),稱 " 因系統(tǒng)消息庫出現(xiàn)局部故障,導(dǎo)致部分用戶的支付功能受到影響。該故障不會影響用戶的資金安全,截止上午 10 點(diǎn) 50 分故障已經(jīng)修復(fù)。"
4 月 9 日," 支付寶崩了 " 也曾登上微博熱搜,部分網(wǎng)友反映支付寶無法使用,用不了螞蟻森林等功能。對此,支付寶客服表示,今日確有系統(tǒng)異常報錯,少量用戶訪問部分頁面時出現(xiàn)了短暫性的訪問不暢。這一情況已經(jīng)快速恢復(fù),用戶的資金和信息安全都不受影響,各項功能也都可以正常使用。
大周一 企業(yè)微信文檔崩了
時間:2024 年 12 月
評級:
12 月 2 日上午,不少著急開例會的網(wǎng)友反映,企業(yè)微信文檔崩了,頁面打不開,多項功能無法使用。
隨后,企業(yè)微信文檔官微發(fā)文稱," 因訪問激增,部分企業(yè)微信文檔出現(xiàn)文檔打開異常,目前已完成修復(fù)。"
WPS 三個月崩了四次 在線文檔無法使用
時間:2024 年 9 月
9 月 6 日,"WPS 崩了 " 再度沖上熱搜。大量網(wǎng)友反饋 WPS 出現(xiàn)在線文檔無法打開的故障。而這已經(jīng)是該應(yīng)用三個月內(nèi)第四次宕機(jī)。
8 月 21 日 WPS 就因發(fā)生服務(wù)異常而引發(fā)熱議。當(dāng)天下午,WPS 客戶服務(wù)官微回應(yīng):經(jīng)緊急修復(fù),WPS 服務(wù)已恢復(fù)。作為補(bǔ)償,8 月 22 日 0 點(diǎn) -24 點(diǎn),所有用戶可以免費(fèi)領(lǐng)取 15 天會員。
7 月 8 日上午,"WPS 崩了 " 也曾沖上熱搜。隨后,WPS 客戶服務(wù)致歉稱," 因服務(wù)異常給大家添麻煩了,大家反饋的問題我們在火速排查并修復(fù),服務(wù)已恢復(fù)正常。"
另外,在 6 月 28 日下午,也有不少網(wǎng)友反映 "WPS 崩了 ",金山文檔打不開。金山辦公當(dāng)時向媒體回應(yīng)稱,崩潰原因或與云服務(wù)異常有關(guān)。
阿里云服務(wù)器故障 小紅書、B 站崩上熱搜
時間:2024 年 7 月
評級:
在數(shù)字化時代,云服務(wù)被廣泛應(yīng)用,涉及眾多企業(yè)和個人用戶。因此,云服務(wù)宕機(jī)的影響輻射范圍往往也更廣。
7 月 2 日,"B 站崩了 "" 小紅書崩了 "" 戀與深空崩了 "" 酷安都崩了 " 等多個詞條登上微博熱搜。不少網(wǎng)友反饋稱,B 站視頻評論區(qū)及個人主頁無法正常加載,瀏覽歷史、消息界面、客服界面等均出現(xiàn)訪問故障。小紅書等應(yīng)用也都出現(xiàn)網(wǎng)絡(luò)異常問題。隨后,有消息稱,此番連鎖故障與服務(wù)商阿里云有關(guān)。
同日,阿里云客服向媒體回應(yīng)稱,上海地域可用區(qū) N 網(wǎng)絡(luò)訪問出現(xiàn)異常,經(jīng)過處理現(xiàn)已恢復(fù),但 B 站服務(wù)器不是阿里云的。
據(jù)了解,阿里云在近幾年曾多次出現(xiàn)服務(wù)故障。2023 年 11 月,阿里云產(chǎn)品控制臺訪問及 API 調(diào)用出現(xiàn)使用異常,導(dǎo)致 " 淘寶又崩了 "" 閑魚崩了 "" 釘釘崩了 " 等話題相繼登上微博熱搜。2022 年 12 月,阿里云爆發(fā)香港 Region 可用區(qū) C 大規(guī)模服務(wù)中斷事件,導(dǎo)致多個香港及澳門站點(diǎn)受到影響。
今年以來,B 站也曾多次服務(wù)器崩潰,用戶無法正常訪問,此前官方解釋因服務(wù)器負(fù)載過高。
騰訊云服務(wù)器故障 1957 個客戶報障
4 月 8 日," 騰訊云崩了 " 沖上熱搜。不少網(wǎng)友反饋稱,騰訊云出現(xiàn)服務(wù)故障,網(wǎng)頁顯示 504 錯誤,服務(wù)器網(wǎng)絡(luò)連接不上,控制臺無法訪問。
當(dāng)天下午 4 點(diǎn) 45 分,騰訊云官微回應(yīng)稱,官網(wǎng)控制臺相關(guān)服務(wù)出現(xiàn)異常,工程師緊急修復(fù)中,部分地區(qū)已恢復(fù)。下午 5 點(diǎn) 16 分,騰訊云在微博稱 " 整體已恢復(fù) "。
4 月 14 日,針對此次故障,騰訊云官方發(fā)布復(fù)盤及情況說明。說明顯示,此次故障一共持續(xù)了近 87 分鐘,期間共有 1957 個客戶報障。云 API 異常導(dǎo)致控制臺登陸不上,而依賴云 API 提供產(chǎn)品能力的部分公有云服務(wù),也因為云 API 的異常出現(xiàn)了無法使用的情況,比如云函數(shù)、文字識別、微服務(wù)平臺、音頻內(nèi)容安全、驗證碼等。
騰訊云表示,此次故障最根本的原因,是在版本變更過程中,沒有有效執(zhí)行沙箱驗證和預(yù)案演練,暴露了在變更管理上的不足,接下來將從提升系統(tǒng)韌性、強(qiáng)化變更管理與保護(hù)措施、增強(qiáng)故障響應(yīng)與溝通能力等幾個方面快速進(jìn)行改進(jìn)和完善,以減少故障的影響范圍和影響時長。
微軟藍(lán)屏,一樁全球 IT 災(zāi)難級事件
時間:2024 年 7 月
評級:
微軟藍(lán)屏故障,可謂今年內(nèi)影響范圍最廣、損失最大的一起宕機(jī)事件,波及至少 20 多個國家,被認(rèn)為是一樁全球 IT 災(zāi)難級事件。
7 月 19 日,全球約 850 萬臺裝有 Windows 操作系統(tǒng)的計算機(jī)出現(xiàn) " 藍(lán)屏 " 死機(jī)現(xiàn)象,出現(xiàn)故障的終端并不限于桌面終端,還覆蓋了大量的服務(wù)器和云節(jié)點(diǎn),而且相關(guān)主機(jī)重新啟動后依然會自動進(jìn)入藍(lán)屏狀態(tài),反復(fù)崩潰。緊接著," 微軟藍(lán)屏 " 登上微博熱搜。
由于微軟藍(lán)屏故障,美國、英國、德國、荷蘭、西班牙、波蘭、比利時等 10 多個國家的部分機(jī)場、車站、碼頭及媒體、電信、銀行等行業(yè)的運(yùn)營受到影響。另外,多國的石油、天然氣、電力、股票、貨幣和債券交易商都在 19 日當(dāng)天難以正常展開交易。
而導(dǎo)致這一歷史事件的主角是美國網(wǎng)絡(luò)安全企業(yè) CrowdStrike。CrowdStrike 的一個錯誤更新導(dǎo)致受影響的電腦和服務(wù)器無法正常啟動,迫使它們陷入了恢復(fù)啟動循環(huán)。CrowdStrike 在全球范圍內(nèi)被廣泛用于管理 Windows PC 和服務(wù)器的安全。
值得一提的是,在此次全球微軟藍(lán)屏事件中,國內(nèi)企業(yè)受到的沖擊很小。因為 CrowdStrike 是個典型的 B2B 企業(yè),其安全控制軟件多部署在企業(yè)環(huán)境中,個人家庭電腦此次受影響很小,國內(nèi)受到波及的主要是少數(shù)使用 CrowdStrike 軟件的外企。
寫在最后:
過去一年,互聯(lián)網(wǎng)應(yīng)用宕機(jī)事件幾乎每個月都有發(fā)生,雖然大多都在 2 個小時左右的時間修復(fù),但還是給用戶的生活和工作造成不便。而網(wǎng)友在吐槽應(yīng)用崩潰導(dǎo)致的糟糕使用體驗之余,更是將宕機(jī)事件與各個大廠的裁員行為聯(lián)系了起來,認(rèn)為 " 大廠裁員裁到大動脈 ",波及到了相關(guān)技術(shù)、運(yùn)維團(tuán)隊的正常運(yùn)作。
不過,這種言論也僅僅是網(wǎng)友的調(diào)侃或猜測,真實原因難以考究。理論上來說,一個成熟的互聯(lián)網(wǎng)公司,邊緣業(yè)務(wù)可能會因為人才流失受到影響,核心業(yè)務(wù)基本不可能,大規(guī)模宕機(jī)事件更多是技術(shù)層面的問題。
比如上文提到的,支付寶、百度地圖、網(wǎng)易云音樂、美團(tuán)短暫崩潰都是因為系統(tǒng)故障或升級引起的,阿里云服務(wù)器故障是因為上海地域可用區(qū) N 網(wǎng)絡(luò)訪問出現(xiàn)異常,微軟藍(lán)屏事件是第三方安全軟件的鍋,騰訊云崩潰則暴露了在變更管理上的不足。
隨著互聯(lián)網(wǎng)應(yīng)用發(fā)展愈加成熟,硬件安全早已不成問題,但技術(shù)系統(tǒng)軟環(huán)境的安全仍有待完善。互聯(lián)網(wǎng)企業(yè)尤其是頭部企業(yè),除了分析總結(jié)宕機(jī)原因,還應(yīng)對系統(tǒng)架構(gòu)進(jìn)行優(yōu)化,比如增強(qiáng)服務(wù)器的冗余設(shè)計,定期進(jìn)行系統(tǒng)測試和演練等。
此外,各類應(yīng)用交替出現(xiàn)故障,考驗平臺基礎(chǔ)設(shè)施、技術(shù)能力和修復(fù)速度的同時,如何做好用戶運(yùn)營亦受到關(guān)注。平臺通過官方渠道及時告知用戶問題和大致恢復(fù)時間,避免用戶產(chǎn)生誤解和恐慌。像 WPS、網(wǎng)易云音樂那樣給用戶補(bǔ)償會員也是一種方法。
最后,作為用戶,衷心希望各大廠商能夠筑牢網(wǎng)絡(luò)安全 " 防火墻 ",宕機(jī)事件不再頻繁上演。