核心要点

  • 一句话定义:LLM 是基于 Transformer、在海量文本上预训练自回归模型,核心动作是逐个预测下一个 Token

  • 能力来自规模:数十亿到上千亿参数 + 大语料,使模型涌现出语法、常识与 In-Context Learning 能力,无需逐任务训练。

  • 能边界要说清:擅长「文本进、文本出」类任务(生成/问答/翻译/摘要/代码/抽取);不擅长精确算术、训练截止后的实时信息、需可靠事实依据的回答。

  • 幻觉的根因要点出:目标是「最可能的下一个 Token」而非「事实正确」,缺乏 grounding 时会自信编造,靠 RAG工具调用补救。

标准回答

什么是 LLM

语言模型(LLM)是一类基于 Transformer 架构、在海量文本上经过预训练的语言模型。它的核心机制是「自回归」:根据已有的上文,逐个预测下一个 Token(词或子词片段)。把这个过程不断重复,就生成了连贯的文本。

参数规模通常达到数十亿到上千亿,配合大规模语料,使模型学会了语法、常识和一定的推理能力。完整训练流程可参考 大语言模型训练全流程

它能做什么

  • 文本生成、续写、改写
  • 问答、对话
  • 翻译、摘要
  • 代码生成与解释
  • 信息抽取、分类

本质上,凡是能转化为「输入文本 → 输出文本」的任务,LLM 大多能胜任。

它不能(或不擅长)做什么

  • 精确计算:本质是预测概率最高的 Token,而非真正执行算术,多位数乘法等容易出错。
  • 实时信息:知识截止于训练数据,不知道训练之后发生的事。
  • 可靠事实依据:没有外部知识 grounding 时,会「一本正经地编造」,即幻觉。

工程上常用 RAG(检索增强生成)、工具调用等手段为模型补充实时、可核查的信息。

常见误区

⚠️ 常见踩坑

初学者常以为 LLM「懂」答案或在「查数据库」。实际上它只是按概率预测下一个 Token,没有事实核查机制,所以会自信地说错——这正是幻觉的来源。

追问

追问 1为什么 LLM 会产生幻觉?

因为它的训练目标是预测「最可能的下一个 Token」,而非「事实正确的内容」。当缺乏相关知识或没有外部信息 grounding 时,模型仍会生成流畅但可能虚构的内容。缓解手段包括 RAG、工具调用、引用来源、降低 temperature 等。

追问 2LLM 和传统 NLP 模型最大的区别是什么?

传统 NLP 多为针对单一任务训练的专用模型(如情感分类器)。LLM 通过大规模预训练获得通用语言能力,无需为每个任务单独训练,靠提示词(Prompt)或少量微调即可适配多种任务,并表现出 In-Context Learning 等涌现能力

延伸学习

与本题相关的知识库文章、术语、工具与行业资讯。