刚刚过去的这事件震撼了技术格局,凸显了现代数字基础设施之间至关重要的相互依赖性。
尽管微软 Windows 也参与其中,但有必要澄清的是,微软公司的操作系统并不是该问题的直接责任。
该事件源于第三方更新CrowdStrike,导致操作系统崩溃,让我们再次反思技术供应链的漏洞(不仅仅是安全)。
群体罢工事件
网络安全解决方案领域的领导者 CrowdStrike 最近面临与 Windows 主机更新缺陷相关的危机。
此问题已导致大量 Windows 设备出现中断、关键服务阻塞并导致可怕的“蓝屏死机”(BSOD) 。
需要强调的是,这一故障不是由网络攻击(因此是恶意的)引起的,最重要的是由 Microsoft Windows 的固有缺陷引起的。
CrowdStrike 报告称:该问题已被识别、隔离,并且已部署修复程序。
我们会向客户推荐支持门户以获取最新更新,并将继续在我们的网站上提供全面且持续的更新。
该公司还道歉说:我们了解情况的严重性,并对给您带来的不便和干扰深表歉意。
导致全球电脑蓝屏的 CrowdStrike 发布官方新闻稿:“我们深感抱歉”
我们正在与所有受影响的客户合作,确保系统恢复正常运行,并能够提供客户所信赖的服务。
但我们怎样才能防止这一切再次发生呢?
技术供应链
这种情况凸显了现代技术是如何相互依赖和相互脆弱的。
单个故障组件可能会产生连锁反应,凸显了对供应链持续保持警惕和仔细管理的必要性。
在处理高度流行的技术时,尤其是对于低级别的安全解决方案,大规模严格的测试和监控的需求至关重要。
这些组件通常包括非常流行的安全软件,例如防病毒软件和端点检测和响应 (EDR),与操作系统紧密互连。
这些情况下的故障可能会导致不可预测和毁灭性的级联效应。
因此,必须实施广泛的测试程序,包括实际的使用场景和压力条件,以确保任何更新或添加都不会损害操作系统的稳定性。
例如,在操作系统的关键上下文中运行的解决方案涉及高风险,因为这些解决方案可以直接访问系统的基本资源。
这些组件中的错误或缺陷可能会导致严重的服务中断、数据丢失和安全漏洞或无法访问网络。
因此,组织必须对流行技术采取严格、有条理的测试和验证实践,包括回归测试、攻击模拟和负载下的行为分析。
高风险和最大扩散解决方案的编目
必须创建这些解决方案的详细目录,对广泛使用的关键技术进行普查。
该目录应识别在集成级别上可能损害系统功能的解决方案,然后围绕这些解决方案定义流程,以强化其控制活动。
为了确保最大程度的可靠性和安全性,可以想象,这些检查是由两家相关公司执行的:开发操作系统的公司和提供安全软件的公司。
这种集成和协作的方法应确保顶级控制,进一步降低风险并确保低级解决方案在发布到生产之前得到充分的测试和验证。
这是一个可行的解决方案吗?
我们不知道,但不言而喻的是,我们需要重新考虑对操作系统中“非系统”但广泛存在的组件进行大规模检查/测试,以便我们今天看到的情况不会再次发生。
与往常一样,每次失败都可以创造新的机会来改进解决方案并提高其安全性,特别是当存在诸如现代数字基础设施中存在的微妙平衡时。
虽然 Microsoft Windows 不直接负责,但该问题揭示了软件技术供应链中固有的漏洞,我们已经熟悉这些漏洞,但从未像本例那样产生具体影响。
时刻牢记“零风险”并不存在这一点必须明确,为防止今后发生类似事件,企业应采取更严格的预防措施,确保时刻保持警惕,并促进与供应商的及时沟通。
一如既往,协作会带来回报,尤其是在危机情况下。
此外,我们必须支持对这些事件采取更加批判性的态度,通过超越直接判断的更深入的反思。
知名网络安全公司蓝屏死机事件提醒我们深入反思超越立即判断的重要性
标签:操作系统,Windows,死机,解决方案,蓝屏,CrowdStrike From: https://blog.csdn.net/qq_29607687/article/details/140606636