微软报告称,其全球蓝屏事件(Windows蓝屏)被发现与软件更新有关。此次事件导致了大约43万台电脑无法正常启动,严重影响了用户的工作和生活。
本月早些时候,由于在线安全解决方案提供商CrowdStrike的软件更新出现问题,全球约有850万台Windows电脑出现蓝屏死亡故障,引起了全球用户的关注。
近日,CrowdStrike在官网发布了此次大规模蓝屏事件的初步审查报告。
根据评测报告给出的信息,世界协调时2024年7月19日04:09(北京时间7月19日12:09),CrowdStrike发布了Windows sensor的内容配置更新,作为其例行操作的一部分。
此次更新是猎鹰平台动态保护机制的例行部分,其目的是收集关于可能出现的新威胁技术的遥测数据。
但是,此内容配置更新存在一个问题。当传感器接收并将其加载到内容解释器中时,有问题的内容会导致内存越界读取,从而触发异常并导致Windows操作系统崩溃(BSOD)。
有问题的快速响应内容配置更新会直接影响运行传感器版本7.11及更高版本的所有Windows主机。
CrowdStrike表示,将从三个部分进行补救:
1.软件弹性和测试
通过使用以下测试类型来改进快速响应内容测试:
本地开发人员测试内容更新和回滚测试压力测试、模糊测试和故障注入稳定性测试内容接口测试
向内容验证器添加其他验证检查,以便快速响应内容。正在进行新的检查,以防止将来部署此类有问题的内容。
增强内容解释器中现有的错误处理。
2.快速响应内容部署
对快速响应内容实施交错部署策略,其中更新逐渐部署到传感器库的较大部分,从Canary部署开始。改进对传感器和系统性能的监控,在快速响应内容部署期间收集反馈,以指导分阶段推出。通过允许精细选择部署这些更新的时间和位置,使客户能够更好地控制快速响应内容更新的交付。通过发行说明提供内容更新详细信息,客户可以订阅这些说明。
3.第三方验证
进行多个独立的第三方安全代码审查。对从开发到部署的端到端质量流程进行独立审查。
此外,CrowdStrike承诺将在调查完成后公开发布根本原因分析。