当前最强的 LLM 编码 Agent 能否胜任工业级移动应用开发?它们在真实产品需求、多模态输入、大规模代码库上表现如何?
AI 编程
3.0 · 值得看
SWE-Bench Mobile: Can Large Language Model Agents Develop Industry-Level Mobile Applications?
当前最强的 LLM 编码 Agent 能否胜任工业级移动应用开发?它们在真实产品需求、多模态输入、大规模代码库上表现如何?