Agent 与自动化 3.0 · 值得看 2026-03-14 · 论文

SkillRL 智能体进化

Q1：这项研究要解决什么问题？核心问题：LLM 智能体无法从历史经验中学习记忆效率低下：存储原始轨迹 Token 消耗大（15K+ tokens/episode）缺乏抽象能力：无法从具体案例中提取通用规则无法持续改进：每次任务从零开始，重复犯错 Q2：为什么这个问题重要？...

回到归档

继续阅读

Agents 3.0 · 值得看

Trace2Skill

LLM Agent 需要领域特定技能（skills）才能高效处理复杂任务。但技能创建面临三重困境：人工编写不可扩展：每个领域都需要专家花大量时间写详细的操作指南，随着 Agent 应用场景扩展，这个瓶颈越来越严重纯 LLM 生成效果差：直接让 LLM 凭参数化知识写技能，缺乏对目标领域具体操作和常见陷阱的了解，收益有限在线顺序更新导致碎片化：现有在线范式（如 ExpeL、Skill-Gen）按顺序处理每条轨迹，一条轨迹学一个教训就更新一次技能，导致技能碎片化且容易过拟合

2026-04-07 · 论文

Agents 5.0 · 必读

Dr. MAMR：解决多智能体 LLM 推理中的惰性智能体问题

问题来源：多轮 GRPO 引入归一化项 1/Ti 以避免偏向更长轨迹。然而，这引入了结构性偏差：定理 1 的直觉：给定相同上下文，如果两个行动产生：轨迹 τS：TS 轮，最终奖励 R 轨迹 τL：TL 轮（TL > TS），最终奖励 R 模型会偏向 τS（更少轮次）。为什么？梯度更新中，除非 τL 的聚合贡献至少是 τS 的 TL/TS 倍，否则 ∥gt(τL)∥ > ∥gt(τS)∥。...

2026-03-12 · 论文 · ：**

Agents 4.0 · 优秀

论证型人机决策（Deliberative Human-AI Decision Making）

论文试图解决什么问题？ AI 系统的黑箱问题：LLMs 的推理过程不透明，难以验证和信任计算论证的可扩展性问题：传统 CA 依赖手工知识工程，难以应用于开放域人机协作的失衡：当前 AI 要么完全自动化决策，要么只是提供解释，缺乏真正的协作高风险领域的可信度：在医学、法律等领域，AI 必须提供可争议、可审查的推理核心洞察：计算论证（CA）与大语言模型（LLMs）的融合可以实现一个新范式——论证型人机决策制定，其中 AI 与人类共同推理，而不是为人类推理。

2026-03-22 · 论文 · **：Stylianos Loukas Vasileiou, Antonio Rago, Francesca Toni, William Yeoh

Agents 4.0 · 优秀

LLM Agent推理必要性

Exploring the Necessity of Reasoning in LLM-based Agent Scenarios 论文链接：阅读日期：2026-03-15 论文类型：智能体框架 / 推理评估一、核心问题（Core Problem） 1.1 研究背景大型推理模型（LRMs，如DeepSeek-R1, Claude3.7-sonnet）的兴起，对传统基于大型语言模型（LLMs）的智能体框架带来了范式转变。这些新一代模型在逻辑演绎上更强大，但也带…

2026-03-15 · 论文