Agent 与自动化 3.0 · 值得看 2026-03-14 · 论文

SkillRL 智能体进化

Q1:这项研究要解决什么问题? 核心问题:LLM 智能体无法从历史经验中学习 记忆效率低下:存储原始轨迹 Token 消耗大(15K+ tokens/episode) 缺乏抽象能力:无法从具体案例中提取通用规则 无法持续改进:每次任务从零开始,重复犯错 Q2:为什么这个问题重要?...

回到归档

Q1:这项研究要解决什么问题? 核心问题:LLM 智能体无法从历史经验中学习 记忆效率低下:存储原始轨迹 Token 消耗大(15K+ tokens/episode) 缺乏抽象能力:无法从具体案例中提取通用规则 无法持续改进:每次任务从零开始,重复犯错 Q2:为什么这个问题重要?...