如何校验与约束 LLM 的输出（结构 / 安全 / 事实）？

Question 1

Accepted Answer

三个维度（独占一行） LLM 输出的可靠性要从结构、安全、事实三方面用模型之外的确定性手段来保障，而不能只靠提示词「请求模型自觉」。 结构校验 优先从源头约束：用函数调用 / JSON mode / 约束解码（按 grammar/Schema 强制采样）让输出天然合法；再叠加 JSON Schema、正则、类型校验做兜底解析。失败时把校验错误信息回灌给模型让它修复，并限定重试次数，避免死循环。 安全与合规校验 对输出做敏感/违规内容过滤、越界话题拦截、PII 检测与脱敏；可用规则、分类器或审核模型，命中则拦截、改写或返回降级回复，并记录审计日志。 事实校验 RAG 场景检查输出是否有检索依据、引用是否对应原文（接地检查）；用自一致（多次采样取多数）或独立校验器判断是否编造，无据则拒绝或重生成（参考 结构化输出实践，框架层面可用 LangChain 的输出解析器）。

Question 2

约束解码和「校验后重试」哪个更好？

Accepted Answer

约束解码从生成源头保证格式合法，省去重试、延迟稳定，但需后端支持且灵活性受限；校验+重试通用、易实现但有失败开销。实践常组合：能用约束解码就用，再叠加 Schema 校验兜底。

Question 3

如何防止重试陷入死循环？

Accepted Answer

设置最大重试次数，每次把具体校验错误回灌帮助模型修正；超过上限则返回降级/兜底结果或转人工，并记录失败样本用于改进提示词与 Schema 设计。

Question 4

安全过滤放在模型前还是后？

Accepted Answer

两侧都要：输入侧过滤越界请求、Prompt 注入与 PII；输出侧再过滤违规内容与 PII 泄露。仅靠单侧会被绕过，输入输出双向校验才完整。

如何校验与约束 LLM 的输出（结构 / 安全 / 事实）？

核心要点

标准回答

常见误区

追问

延伸学习