随着 GPT-5.3 和 Claude-4.6 的发布,OpenClaw 的风行,智能运维似乎终于要到达某种“奇点”。从日志异常检测、根因分析,甚至故障自愈,AI SRE 智能体替代日常运维工作看起来已成定局。但我发现,SigNoz 公司上周发表了一篇观察(AI Isn’t Replacing SREs. It’s Deskilling Them),同时还有另一份相似的科研论文(How AI Impacts Skill Formation),二者共同论证了一个概念:AI 不是在赋能 SRE,而是让 SRE “技能退化”。
文中引用了 Bainbridge 在 1983 年提出的“自动化铁律”(Ironies of Automation)作为核心依据。其定义指出:“自动化系统越先进、越可靠,人类操作员需要做的事情就越少,他们熟练处理故障的可能性就越小。”
为解决技能退化的风险,SigNoz 的博客提出了一个跨行业类比:航空业对自动驾驶系统的处理方式。现代客机早就能实现全自动飞行。然而,航空公司会强制执行“手动操控时间”政策。要求飞行员在气象条件允许、系统完全可以自动运行的情况下,故意脱离自动系统,低效地亲手操控飞机。
这种实战练习的核心价值在于:维持飞行员的“肌肉记忆”和“情境感知”。它确保在自动化系统失效的极端危机时刻,人类机组人员可以即刻接管飞行系统,而不是从头翻手册。
将这一原则应用于运维领域,意味着我们必须在 AI SRE 的设计中,引入防御性“故意低效”的人工时刻:
参考资料: