AI 编程 3.0 · 值得看 2026-04-01 · 论文

SWE-Bench Mobile: Can Large Language Model Agents Develop Industry-Level Mobile Applications?

当前最强的 LLM 编码 Agent 能否胜任工业级移动应用开发?它们在真实产品需求、多模态输入、大规模代码库上表现如何?

回到归档

当前最强的 LLM 编码 Agent 能否胜任工业级移动应用开发?它们在真实产品需求、多模态输入、大规模代码库上表现如何?