核心要点

  • 不能盲信:模型会"一本正经地胡说"(幻觉),知识还有截止时间,也不擅长精确计算

  • 判断技巧:看有没有出处、能不能核查;让它给来源/引用,自己再点开验证

  • 提可信度:用 RAG 把权威资料喂给它作答、交叉验证多个来源

  • 关键信息(数字、日期、法律医疗)必须人工确认,把它当聪明但会犯错的助手

标准回答

为什么不能盲信

大模型本质是"预测下一个词",它追求"读起来像对的",不一定"是对的"。所以会出现幻觉——一本正经地编造看似可信的内容,比如不存在的论文、错误的数字。而且它的知识有截止时间,不知道最新的事;做精确计算也常出错。

怎么判断它有没有胡说

几招结合:让它给出处和引用,你点开核对,没有来源或来源对不上就警惕;对关键事实交叉问几个来源或换个问法看是否一致;常识和数字自己复核一遍;越是具体的人名、数据、日期,越要查。

怎么让它更靠谱

用 RAG:先检索权威资料,把相关内容喂给模型让它"看着材料答"(接地),并要求标注引用,这样答案有据可查、幻觉大幅减少。

心态

把它当成"聪明但会犯错的助手"——可以帮你起草、检索、归纳,但关键信息(法律、医疗、财务、对外发布)一定人工把关。

常见误区

⚠️ 常见踩坑

看到答得流畅、自信就信以为真——语气自信 ≠ 内容正确;也别以为联网/给了来源就万无一失,它可能引错或曲解,仍需自己核对。

追问

追问 1RAG 为什么能减少幻觉?是不是就不会胡说了?

RAG 先检索真实资料再让模型基于资料作答,等于给它一份"开卷材料",有据可依就少瞎编。但不是万能:如果检索没召回对的内容、或模型没严格依据材料(仍自行发挥),照样会错。所以还要要求标引用、做校验,并保证检索质量。

追问 2哪些场景模型最容易出错,要格外当心?

精确计算和统计、最新发生的事(超出知识截止)、冷门细节(具体人名/编号/条款)、需要专业判断的法律医疗财务,以及让它"找证据支持某结论"时容易迎合编造。这些场景务必核查或转专业人士。

延伸学习

与本题相关的知识库文章、术语、工具与行业资讯。