平台工程的尽头是什么?
平台工程火了,但很多人理解错了。它不是把DevOps团队换个名字。
我见过太多平台工程做成工具展厅的。Jenkins、GitLab、ArgoCD、Kubernetes,工具买了一堆,开发者却更累了。为什么?因为从一开始,方向就错了。
平台工程的尽头,不是更多的工具,而是让工具消失。
三个阶段
平台工程的发展,大致经历三个阶段。
第一阶段,工具堆砌期。
每个团队自己选型。A组用Jenkins,B组用GitLab CI,C组用CircleCI。各自为战,各显神通。看起来是赋能,其实是混乱。运维要维护十套CI系统,开发者要学十个不同的配置语法。
第二阶段,标准化期。
公司看不下去了,成立平台团队,统一工具链。全部迁移到GitLab,全部用Helm部署,全部接入统一的监控。效率确实提升了,但怨声载道。开发者被强迫改变习惯,平台团队成了”中央集权”的坏人。
第三阶段,能力赋能期。
这是尽头。平台不再说”你必须用这个工具”,而是说”你需要的能力都在这里”。开发者自主选择,平台提供保障。工具只是实现方式,能力才是交付物。
IDP的本质
很多人把IDP理解为Internal Developer Platform,内部开发者平台。这名字本身就有问题。
平台不是目的,能力是目的。IDP应该是Internal Developer Capability Center,内部开发者能力中心。
开发者需要的不是平台,他们需要的能力是:
- 写一段代码,能在几分钟内部署到测试环境
- 发布到生产时,有自动化的质量检查
- 出问题时有清晰的日志和追踪
- 不需要理解底层基础设施的复杂度
平台团队应该度量的是Developer Productivity,不是Adoption Rate。 Adoption高不代表成功,开发者效率高才是成功。
终极形态
平台团队的终极形态,是成为一个产品团队。只不过用户不是外部客户,是内部开发者。
产品化思维。 有Product Manager,有User Research,有Roadmap,有Feedback Loop。开发者是你的用户,他们的痛点是你的需求来源。
自服务。 开发者自助完成,不需要给平台团队开ticket等排期。开ticket的那一刻,平台就已经失败了。
可扩展。 平台提供基础能力,但团队可以在此基础上定制。标准化和灵活性之间要有平衡,不能一刀切。
度量。 用DORA指标说话。部署频率、变更前置时间、失败率、恢复时间。这些才是平台工程的价值证明。
AI时代的平台工程
现在有了Cursor、Windsurf、GitHub Copilot,开发者写代码的方式变了。平台工程该做什么?
不是去造一个AI Coding Assistant,那是OpenAI和Anthropic的事。平台团队该做的是:
- 制定AI辅助开发的规范和治理
- 确保AI生成的代码符合安全标准
- 建立AI时代的新流程和新检查点
- 保护公司的知识产权和数据安全
AI Coding Assistant成了新的基础设施,平台团队要负责的是这个基础设施之上的工程体系和治理框架。
最后
平台的尽头是无感。开发者感受不到平台的存在,但一切都顺畅运行。就像用电的人不需要理解电网,用水的人不需要理解水厂。
好的平台团队,是让自己隐形的团队。当开发者不再抱怨工具,不再找你开ticket,不再讨论平台好不好用时,你就成功了。
因为那时候,他们只关注一件事:创造价值。
平台工程的终极KPI,是开发者忘记平台的存在。