Hallucination Rate（幻觉率）

就是模型在一本正经地胡说八道的比例嘛——说的越像真的，反而越危险。

亦作、亦称：幻觉率 · Hallucination Score · Factual Inconsistency Rate · 幻觉评分

幻觉率是评估 LLM 可靠性的核心指标，衡量模型生成虚假或无依据内容的频率。在医疗、法律、金融等高风险领域，精确控制幻觉率是 LLM 落地部署的前提条件。

概述

幻觉率是量化 LLM「可信度」的基础指标，直接影响模型能否在生产环境中安全使用。

幻觉（Hallucination）：模型生成的内容在事实上不正确或无法被来源支持
幻觉率计算：幻觉样本数 ÷ 总样本数 × 100%
两大子类型：事实性幻觉（与世界知识冲突）和忠实性幻觉（与输入上下文冲突）
研究现状：GPT-4 在部分任务上幻觉率约 28%，GPT-3.5 约 40%，部分专用场景模型可低至 1% 以下
重要性：幻觉率是 LLMOps 可观测性体系和模型评测的核心维度之一

工作原理与测量方法

幻觉率的测量需结合任务类型选择合适的评估策略。

基准对比法：使用 TruthfulQA、HaluEval 等标准化数据集，将模型输出与标准答案比对
自动化检测（SelfCheckGPT）：对同一输入多次采样，通过跨输出一致性判断是否存在幻觉，无需参考答案
事实核查管道：将输出分解为若干原子性断言，逐一通过知识库或搜索引擎核实
人工标注：由专业标注员判定输出是否包含虚假信息，准确度最高但成本最大
LLM-as-Judge：使用更强的模型（如 GPT-4）作为裁判对输出打分，效率与质量兼顾

幻觉类型与分类

根据产生机制和表现形式，幻觉可细分为多种类型，对应不同的缓解策略。

内在幻觉（Intrinsic Hallucination）：输出内容与给定文档/上下文直接矛盾
外在幻觉（Extrinsic Hallucination）：输出内容无法在给定上下文中得到验证，可能正确也可能错误
事实型幻觉：模型捏造不存在的引用、人名、日期、统计数字等
推理型幻觉：逻辑链条中某步骤错误导致最终结论偏差
RAG 幻觉：检索增强场景下，模型忽略检索到的正确文档，仍然依赖参数记忆生成错误内容

应用场景与行业标准

幻觉率在不同行业有截然不同的容忍阈值，直接决定部署方案设计。

医疗健康：要求幻觉率极低（目标 <2%），临床摘要、诊断建议中的幻觉可能危及患者安全
法律合规：合同审查、法规解读场景需要近零幻觉，错误引用法条代价极高
金融分析：财报摘要、风险评估中的数字幻觉直接影响投资决策
客户服务：产品信息、政策问答的幻觉导致用户信任度下降和投诉增加
代码生成：代码幻觉（如调用不存在的 API）会导致运行时错误，可通过执行验证检测

局限与误区

幻觉率作为指标存在固有局限，实践中需警惕多种误用。

无统一标准：不同论文对「幻觉」的定义差异较大，跨研究横向比较结论要谨慎
评估本身存在误差：自动化工具（如 SelfCheckGPT）本身并非完美，可能漏报或误报
任务相关性强：同一模型在不同任务上的幻觉率差异可能超过 50 个百分点，单一数字无法代表模型全貌
「低幻觉率 = 安全」的误区：模型可能通过拒绝回答或极度保守的输出降低幻觉率，但实用性同步下降
RAG 并非万能：检索增强能降低幻觉率，但若检索文档本身错误或模型忽略检索结果，幻觉依然发生

发展脉络

幻觉率的研究随大语言模型的演进而系统化，逐步从现象描述走向可量化工程实践。

2021 年前：NLP 领域已观察到 seq2seq 模型的忠实性问题，但尚无「幻觉率」的系统定义
2022 年：TruthfulQA 发布，首次通过 817 个精心设计问题系统评测 LLM 的事实性；ChatGPT 爆发使幻觉问题进入大众视野
2023 年：HaluEval 发布（35,000 样本），覆盖 QA、对话、摘要；SelfCheckGPT 提出无参考幻觉检测框架；幻觉率正式进入 LLMOps 评测体系
2024 年：RAG 成为降低幻觉率的主流工程方案；Arize Phoenix、LangSmith 等可观测性平台将幻觉率纳入实时监控
2025-2026 年：HalluLens 等新型综合基准发布；LLM-as-Judge 方法成熟；各行业开始制定幻觉率的行业准入阈值标准

常见误解

日常交流中容易听到的简化说法，未必准确，但能帮助理解误解从何而来。

「就是模型在一本正经地胡说八道的比例嘛——说的越像真的，反而越危险。」
「幻觉率高的模型就像一个自信满满但经常记错事实的同事，你不能直接信任它的每一句话。」
「在医疗、法律等高风险场景，哪怕 1% 的幻觉率都可能造成严重后果。」

延伸阅读

从知识库精选 3 篇文章，帮助深入理解该术语。

外部参考

维基百科：查看「Hallucination Rate」词条

本页内容为本站原创撰写；维基百科链接仅作延伸参考。

Hallucination Rate（幻觉率）

概述

工作原理与测量方法

幻觉类型与分类

应用场景与行业标准

局限与误区

发展脉络

常见误解

相关术语

延伸阅读

LLM 评测：基准测试与对齐评估

LLMOps 可观测性工程：从 LangSmith 到 Arize Phoenix 的全链路监控体系

AI 可观测性与可靠性工程

外部参考

概述

工作原理与测量方法

幻觉类型与分类

应用场景与行业标准

与相邻概念的区别

局限与误区

发展脉络

常见误解

相关术语

延伸阅读

LLM 评测：基准测试与对齐评估

LLMOps 可观测性工程：从 LangSmith 到 Arize Phoenix 的全链路监控体系

AI 可观测性与可靠性工程

外部参考