小语言模型（SLM，如 Phi / Gemma）适合什么场景？

Question 1

Accepted Answer

SLM 的优势 小语言模型（如 Phi、Gemma 小尺寸、Qwen 小模型）参数量小，能在手机/边缘设备本地运行。带来三点价值：推理成本低、延迟低（无网络往返）、数据不出设备从而保护隐私。 适合的场景 范围明确的特定任务最契合：意图识别、文本分类、实体/结构化信息抽取、设备端助手、固定流程的工具调用等。这类任务对世界知识广度要求不高，靠领域数据微调就能达到可用甚至优于通用大模型的效果。 配套手段 SLM 通常配合知识蒸馏（用大模型当老师）与领域微调，把目标能力压进小模型；知识时效性问题交给 RAG。 局限 复杂的多步推理、长链路规划、需要广博知识的开放问答仍是短板，应通过 RAG 补知识、或在置信度低时回落到云端大模型。

Question 2

SLM 为什么能在特定任务上接近甚至超过大模型？

Accepted Answer

因为任务被收窄后，模型只需覆盖有限分布。通过高质量领域数据微调（或大模型蒸馏出的数据），SLM 能把容量集中用在该任务上，去掉了通用大模型的冗余能力，于是在该窄域上达到高准确率，同时延迟和成本远低于大模型。

Question 3

SLM 知识过时或不足时如何补救？

Accepted Answer

主要靠 RAG：把最新或私有知识放入外部知识库，检索后拼进上下文，无需重训即可更新知识，也便于溯源。对超出能力的复杂查询，可按置信度路由回落到云端大模型，形成端云协同。

小语言模型（SLM，如 Phi / Gemma）适合什么场景？

核心要点

标准回答

常见误区

追问

延伸学习