Agent3 天前·arXiv

arXiv:SAAS 自感知强化学习框架,缓解 Agent 搜索过度问题

SAAS 框架使用自感知强化学习缓解 AI Agent 搜索任务中的过度搜索问题,通过自我感知机制让 Agent 学会判断何时停止搜索。

SAAS:让 Agent 学会适可而止

2026 年 5 月 29 日,arXiv 收录 Agent 搜索优化研究。

问题背景

  • Agentic Search 中 Agent 容易过度搜索,浪费计算资源
  • 无意义的循环查询降低了整体任务完成效率

SAAS 框架

  • 自感知机制: Agent 实时监控自身搜索行为的有效性
  • 强化学习: 通过奖励信号训练 Agent 在适当时机停止搜索
  • 效率提升: 减少冗余查询,提高任务完成率

来源: arXiv
链接: https://arxiv.org/abs/2605.29796