更新时间:2024-07-20 14:31:06
北京时间2024年7月19日下午,全球大量微软Windows用户在社交媒体上晒出电脑蓝屏画面,出现了大量 Windows 10电脑崩溃、显示蓝屏死机、无法重新启动的情况。在国内“微软蓝屏”迅速登顶微博热搜第一,成为全网热议话题。
随后,蓝屏问题被确认与第三方杀毒软件CrowdStrike的更新有关,导致新西兰、澳大利亚、日本、印度等Windows用户地区均出现了蓝屏现象。CrowdStrike目前正在全球范围内撤销该更新。
在海外,航空、能源、金融等多个行业被波及,美国联合航空、美国航空和达美航空甚至对所有航班发出地面停飞指令。除航空业之外,伦敦和新加坡的几家主要石油/天然气交易部门因网络故障而难以执行交易。澳大利亚的网站Downdetector显示,澳大利亚国民银行、电信公司Telstra、谷歌等都报告了问题,导致客户无法登录或交易,广播公司也遭到被迫停播。受此事影响,网络安全公司Crowdstrike美股跌超11%,微软股价也出现小幅下跌。
从国内所受影响来看,奇安信网络安全事件响应专家、威胁情报中心负责人汪列军分析,国内受影响的主要应该是外企及其在中国的分支机构,相关办公电脑可能默认装载了CrowdStrike,国内党政机关、央企、大型民企等受影响较小。另据媒体报道,中国国航、东航、南航等三大航司均表示航班未受微软故障影响,北京首都机场和大兴机场出发的国际航班也运行正常。
汪列军认为,此次微软服务的大规模中断事件提醒了业界和广大用户,即使是非常成熟的技术平台也可能遭遇意外故障。业务稳定和网络安全不仅是技术问题,更是管理和战略问题,正所谓“能力越大责任也越大”,涉及系统稳定性的软件厂商需要对自己的软件有更严格的质量管理。否则,这种意外故障导致的业务连续性问题比恶意的网络攻击还要大。
他提醒软件厂商,要注意做好升级策略。在产品升级时要控制影响范围(俗称“爆炸半径”),要控制升级的放量节奏,逐步测试、逐步增加覆盖范围。在出现事故时,平台厂商和安全厂商,都需要本着客户至上原则,最短时间给出客户相应的解决方案,并积极与公众沟通,避免因为信息差等导致的恐慌。
汪列军还提醒道,在云计算时代,业务系统稳定性面临的挑战将比以往更加严峻,企业迫切需要加强自身安全意识,合理应对技术故障,提前做好紧急事故预案,并重新评估其业务稳定保障、灾难恢复计划以及技术依赖的风险。例如,对业务有高稳定性要求的用户,可采用多供应商互为备份,以避免出现供应商单点故障,还可进行故障应急演习,对此类场景有应对预案和回退措施。