标准回答
三个维度(独占一行)
LLM 输出的可靠性要从结构、安全、事实三方面用模型之外的确定性手段来保障,而不能只靠提示词「请求模型自觉」。
结构校验
优先从源头约束:用函数调用 / JSON mode / 约束解码(按 grammar/Schema 强制采样)让输出天然合法;再叠加 JSON Schema、正则、类型校验做兜底解析。失败时把校验错误信息回灌给模型让它修复,并限定重试次数,避免死循环。
安全与合规校验
对输出做敏感/违规内容过滤、越界话题拦截、PII 检测与脱敏;可用规则、分类器或审核模型,命中则拦截、改写或返回降级回复,并记录审计日志。
事实校验
RAG 场景检查输出是否有检索依据、引用是否对应原文(接地检查);用自一致(多次采样取多数)或独立校验器判断是否编造,无据则拒绝或重生成(参考 结构化输出实践,框架层面可用 LangChain 的输出解析器)。
常见误区
⚠️ 常见踩坑
别只在 prompt 里写「只输出 JSON」就当校验——模型可能加解释、截断或越界;必须有程序化解析 + 失败重试,且结构、安全、事实三类校验各有侧重,不能互相替代。
延伸学习
与本题相关的知识库文章、术语、工具与行业资讯。
🛠️ AI 工具
- LangChain
最流行的 LLM 应用开发框架,137K+ stars。提供链式编排、RAG 检索增强生成、Agent 构建等核心能力,覆盖 Python 和 JavaScript 双语言生态,是构建 LLM 应用的基础设施