agent-skills-eval:AI Agent 技能的标准化度量
2026 年 5 月 6 日,darkrishabh 在 GitHub 开源。
核心价值
- 标准化评估:为 agentskills.io 风格的 AI Agent 技能提供统一测试运行器
- 可比较基准:让不同 Agent 框架的能力有可比较的量化指标
- 开源社区:推动 Agent 能力评估的透明化和社区共建
为什么重要
随着 AI Agent 框架的爆发式增长(Claude Code Skills、OpenClaw superpowers 等),如何标准化地评估 Agent 的能力成为一个关键问题。agent-skills-eval 提供了解决这一问题的基础设施。
来源: GitHub
链接: https://github.com/darkrishabh/agent-skills-eval