告别"氛围编程":基于 Harness 治理和 SDD 的团队级 AI 研发范式演进与实践
- 来源:微信公众号(阿里技术)
- 原文链接:https://mp.weixin.qq.com/s?__biz=MzIzOTU0NTQ0MA==&mid=2247559876&idx=1&sn=d36019602fa9c07b1595a5f3f25c169a
- 作者:王树新(高德大模型应用平台)
- 日期:2026-05-07
核心观点
文章基于阿里高德团队在 Qoder 平台上的 AI 编程实践,揭示了"出码率提升≠真正提效"的悖论,并提出 SDD(规范驱动开发)+ Harness Engineering 的解法。
三大核心问题
1. 自由发挥问题:AI 生成代码天马行空,业务理解不足、规范缺失,与现有架构不兼容 2. 效率降低问题:指令不够清晰时,多轮对话反复拉扯,不如自己写 3. 关键信息丢失问题:多轮对话中 AI "忘记"重要约束,任务粒度过大时顾此失彼
出码率 80-90% 但提效不明显的三个原因
1. 研发是全链路过程,编码只是其中一环,优化单个环节整体提效有限 2. 存量应用中 Vibe Coding 风险极高——隐式依赖、历史包袱、AI 生成的代码可能与现有系统完全不兼容 3. 大型项目超出单次 AI 对话能力边界
SDD(规范驱动开发)
核心思想:规范不再是散文式的 PRD,而是结构化的"意图代码",成为唯一真实来源。
工作流四阶段:
- Specify:定义结构化规范(用户故事、验收标准、系统约束)
- Plan:AI 将规范"编译"成技术方案和任务拆解
- Implement:AI Agent 逐个执行任务,自动生成代码
- Validate:根据规范自动生成测试用例并执行
Harness Engineering(驾驭工程)
四大支柱: 1. 上下文工程:结构化信息投喂,维护"单一事实来源" 2. 架构约束:通过物理手段强制 AI 遵守规则(如 UI 层禁止直接访问数据库) 3. 反馈回路与熵管理:Agent 写代码→自动测试→失败→自我修正,将人类经验固化为规则 4. 人类监督:从"写代码的人"变为"审核员"和"环境设计师"
全流程自动化
基于 Qoder 平台的四步实践: 1. 设计知识库(项目层/技术层/资产层三层结构) 2. Quest Spec 模式处理需求 PRD(HITL 人在回路) 3. 专家团模式(Experts Mode)执行任务 4. 通过 MCP 工具完成部署
总结
从"氛围编程"到"规范驱动、工程治理"的范式转变:开发者从被动的代码编写者变为主动的需求定义者、规范审核者、结果验证者。