什么是大语言模型（LLM）？它能做什么、不能做什么？

Question 1

Accepted Answer

什么是 LLM 大语言模型（LLM）是一类基于 Transformer 架构、在海量文本上经过预训练的语言模型。它的核心机制是「自回归」：根据已有的上文，逐个预测下一个 Token（词或子词片段）。把这个过程不断重复，就生成了连贯的文本。 参数规模通常达到数十亿到上千亿，配合大规模语料，使模型学会了语法、常识和一定的推理能力。完整训练流程可参考 大语言模型训练全流程。 它能做什么 - 文本生成、续写、改写 - 问答、对话 - 翻译、摘要 - 代码生成与解释 - 信息抽取、分类 本质上，凡是能转化为「输入文本 → 输出文本」的任务，LLM 大多能胜任。 它不能（或不擅长）做什么 - 精确计算：本质是预测概率最高的 Token，而非真正执行算术，多位数乘法等容易出错。 - 实时信息：知识截止于训练数据，不知道训练之后发生的事。 - 可靠事实依据：没有外部知识 grounding 时，会「一本正经地编造」，即幻觉。 工程上常用 RAG（检索增强生成）、工具调用等手段为模型补充实时、可核查的信息。

Question 2

为什么 LLM 会产生幻觉？

Accepted Answer

因为它的训练目标是预测「最可能的下一个 Token」，而非「事实正确的内容」。当缺乏相关知识或没有外部信息 grounding 时，模型仍会生成流畅但可能虚构的内容。缓解手段包括 RAG、工具调用、引用来源、降低 temperature 等。

Question 3

LLM 和传统 NLP 模型最大的区别是什么？

Accepted Answer

传统 NLP 多为针对单一任务训练的专用模型（如情感分类器）。LLM 通过大规模预训练获得通用语言能力，无需为每个任务单独训练，靠提示词（Prompt）或少量微调即可适配多种任务，并表现出 In-Context Learning 等涌现能力。

什么是大语言模型（LLM）？它能做什么、不能做什么？

核心要点

标准回答

常见误区

追问

延伸学习