同一工具在不同场景应有不同权限，工具权限控制如何分层设计？

Question 1

Accepted Answer

同一个工具在不同场景的风险完全不同——比如「执行 SQL」在只读分析场景安全，在生产库写场景就极危险。所以权限不能挂在工具上一刀切，要分层授权 + 最小权限 + 运行时拦截 + 审计。

分层维度

这四层逐级求交集，最终权限是各层的最小交集，天然贴合最小权限原则——默认拒绝，只显式开放必要项。

白/黑名单与配置化策略

用配置化的策略表描述「哪个主体（用户/角色/Agent）+ 在哪个渠道/会话 + 能调用哪个工具的哪些动作」，以白名单为主、黑名单兜底敏感项。策略与代码解耦，支持热更新、灰度和回滚，便于审计和合规。

危险操作二次确认与审计

对写入、删除、对外发送、支付等高危动作，即便有权限也要走二次确认（human-in-the-loop 或显式确认令牌），并把每次工具调用的主体、参数、结果、时间全程审计留痕，做到可追溯、可回放、可问责。

运行时鉴权拦截

所有工具调用前统一经过一个策略引擎/拦截器校验，模型只是「请求」调用工具，是否放行由系统决定，绝不把鉴权交给提示词去自觉遵守。校验失败直接拦截并返回安全提示，防止提示注入绕过权限。

Question 2

权限校验应该放在哪一层，能交给模型自己判断吗？

Accepted Answer

不能。模型只负责「请求」调用某工具及参数，是否放行必须由系统在工具执行前的策略引擎/拦截器强制校验。把鉴权写进提示词会被提示注入绕过。正确分层是：模型产出调用意图 → 拦截器按配置策略鉴权 → 通过才真正执行，失败则拦截并返回安全提示。

Question 3

同一个工具如何做到读安全、写受限、危险动作严管？

Accepted Answer

把工具的能力按动作拆分并分别授权：只读动作（查询、列举）默认放开；写动作（新增、修改）需要对应角色/场景授权；删除、转账、对外发送等危险动作即使有权限也要二次确认并审计。可以在工具定义里声明每个动作的风险级别，策略引擎据此施加不同强度的管控。

Question 4

怎么设计审计日志才能既可追溯又不泄露敏感信息？

Accepted Answer

记录主体（用户/Agent/角色）、渠道会话、工具名与动作、入参摘要、结果状态、时间戳和决策依据（命中哪条策略）。对参数中的密钥、个人隐私做脱敏或哈希，仅保留可追溯所需的最小信息；日志独立存储、只追加不可改、设访问权限，并支持按消息/会话 ID 串联回放整条调用链。

核心要点