天天头条：因拼写错误，17个数据库被删除，微软 Azure DevOps 罢工十小时

当前位置： 首页 >综合 > 正文

天天头条：因拼写错误，17个数据库被删除，微软 Azure DevOps 罢工十小时

2023-06-05 18:02:48 来源：https://www.theregister.com/2023/06/03/microsoft_azure_outage_brazil/ 责任编辑：赵宁宁

(相关资料图)

The register 网站披露，巴西南部地区部署的 Microsoft Azure DevOps 服务”罢工“了约十个小时。随后，微软首席软件工程经理 Eric Mattingly 为本次中断事件公开道歉，并透露中断原因是一个简单拼写错误致使 17 个生产数据库被删除。

Mattingly 表示 Azure DevOps 工程师会定期对生产数据库进行快照（Snapshot）处理，以便及时调查报告上来的问题或测试性能是否改进，这些举动都依赖一个每天运行的后台系统，该系统会在特定时间删除旧的快照。

在 Azure DevOps 工程师近期进行的一次代码升级中，用支持的 Azure.ResourceManager.*NuGet 包取代了弃用的 Microsoft.Azure.Management.*包，此举引起一个大型的拉取请求，其中更换了旧包和新包中的 API 调用。

然而拉取请求中却出现了拼写错误，误将删除快照数据库的调用改成了删除托管数据库的 Azure SQL Server 的调用，导致后台快照删除作业删除了整个服务器。

事故原因

Mattingly指出 Azure DevOps有专门的测试来捕捉此类问题，但是错误的代码只在某些特定条件下才得以运行，因此在现有的测试中没有很好的覆盖到。（据推测，这些条件需要存在于一个足够“老”的数据库快照，以便被删除脚本所捕获。）

Mattingly 进一步指出由于没有任何快照数据库，Sprint 222 的内部部署（第0环）没有发生任何意外，几天后，软件变更被部署到客户环境（第1环）被用于南巴西规模单位（一个特定角色的服务器集群）。该环境中有一个快照数据库，其年龄“老”到足以触发该错误，最终导致后台工作删除了该规模单位的“整个Azure SQL服务器和所有17个生产数据库”。

经过十多个小时的努力，微软方面已经全部恢复了数据库，为防止此类问题再次发生，微软已经采取各种修复和重新配置措施。花费如此长时间的原因如下：

第一：由于客户自己无法恢复 Azure SQL Server，必须由 Azure 工程师来处理这一问题，这一过程大约需要一个小时：第二：数据库具有不同的备份配置，一些数据库被配置为区域冗余备份，另一些数据库被设置为最近的地理区域冗余备份，协调这种不匹配的冗余备份，需要花费几个小时；最后一个原因：在数据库开始恢复在线后，由于自身网络服务器存在一系列复杂问题，使用这些数据库的客户也无法立刻访问整个规模单元。

据悉，这些问题由服务器预热任务引起，该任务通过测试调用在可用数据库列表中反复进行，恢复过程中的数据库出现了一个错误，就会触发预热测试执行指数回退重试，导致预热平均需要 90 分钟，在正常情况下此操作只需要几秒钟。

更为复杂的是，整个恢复过程交错进行，一旦有一两台服务器开始接受客户流量，就会出现过载现象，然后停机。因此，恢复服务需要阻断所有到巴西南部规模单位的流量，直到一切都充分准备好后，才重新加入负载平衡器并处理流量。

文章来源：https://www.theregister.com/2023/06/03/microsoft_azure_outage_brazil/

标签：

上一篇： Zyxel 防火墙曝出高危安全漏洞，现已修复！

上一篇：最后一页

天天头条：因拼写错误，17个数据库被删除，微软 Azure DevOps 罢工十小时

资讯

热点

燃料短缺孟加拉国大面积停电或再持续两周|环球简讯

天天简讯:【618战报】辛巴开启618辛选“巅峰战” 生鲜食品类产品销售额2.7亿元

对话三个小马创始人张文强、张宏达：智能健身镜价格未来将逐步平民化_天天热议

减肥食谱一周瘦10斤的方法视频（减肥食谱一周瘦10斤的方法）每日视点

数字技术发力苍山洱海生态保护筑起“智能屏障”

新消息丨国内用户或无缘！曝iOS 17开放第三方应用商店

关注

2023年Q1全球5G手出货量同比增长3.9%，苹果、三星、小米位居前三每日热闻

华为6月7日将发布国内首个软硬协同全栈自主的数据库

大量安卓用户逃离换iphone，苹果手机究竟有什么魅力？|短讯

外媒：苹果或在WWDC23上宣布更换“嘿‌Siri”-环球最资讯

华为大模型“盘古 Chat”已申请相关商标，即将发布

苹果或将在WWDC23上更新Siri，可直接唤醒|速读

聚焦

话题

天天头条：因拼写错误，17个数据库被删除，微软 Azure DevOps 罢工十小时

资讯

热点

燃料短缺 孟加拉国大面积停电或再持续两周|环球简讯

天天简讯:【618战报】辛巴开启618辛选“巅峰战” 生鲜食品类产品销售额2.7亿元

对话三个小马创始人张文强、张宏达：智能健身镜价格未来将逐步平民化_天天热议

减肥食谱一周瘦10斤的方法视频（减肥食谱一周瘦10斤的方法） 每日视点

数字技术发力 苍山洱海生态保护筑起“智能屏障”

新消息丨国内用户或无缘！曝iOS 17开放第三方应用商店

关注

2023年Q1全球5G手出货量同比增长3.9%，苹果、三星、小米位居前三 每日热闻

华为6月7日将发布国内首个软硬协同全栈自主的数据库

大量安卓用户逃离换iphone，苹果手机究竟有什么魅力？|短讯

外媒：苹果或在WWDC23上宣布更换“嘿‌Siri”-环球最资讯

华为大模型“盘古 Chat”已申请相关商标，即将发布

苹果或将在WWDC23上更新Siri，可直接唤醒|速读

聚焦

话题

燃料短缺孟加拉国大面积停电或再持续两周|环球简讯

减肥食谱一周瘦10斤的方法视频（减肥食谱一周瘦10斤的方法）每日视点

数字技术发力苍山洱海生态保护筑起“智能屏障”

2023年Q1全球5G手出货量同比增长3.9%，苹果、三星、小米位居前三每日热闻