核心要点

  • 提示工程:通过精心设计输入(提示词、示例、指令)来引导模型,不改变模型权重。

  • 微调:用一批自己的数据继续训练模型,会改变模型的权重,让能力「内化」进模型。

  • 提示工程几乎零成本、改起来快、迭代灵活,适合快速验证和大多数通用场景。

  • 微调成本更高、需要数据和算力,但能稳定地获得专有能力或固定风格、减少每次的提示长度。

标准回答

提示工程:改「怎么问」

不动模型本身,只在输入上下功夫——把指令写清楚、给几个示例(few-shot)、规定输出格式等,引导模型给出更好的答案。优点是零成本、即改即生效、迭代飞快;缺点是效果受限于模型本身能力,复杂或专有的任务靠提示不一定稳定,且每次都要带上长提示。

微调:改「模型本身」

用一批带标注的数据继续训练模型,真正改变它的权重,把某种能力或风格「写进」模型里。优点是能稳定掌握专有领域知识、固定输出风格,推理时提示可以更短;缺点是要准备数据、花算力训练、有一定门槛,迭代也比改提示慢。

怎么选

先用提示工程,几乎能覆盖大部分需求且最省事。当你发现:任务很专、对风格一致性要求高、提示太长太复杂或效果不稳定时,再考虑微调(实践中常用 LoRA 等轻量微调降低成本)。

常见误区

⚠️ 常见踩坑

初学者常一上来就想微调。其实多数问题靠把提示写好就能解决;微调更贵更慢,应在提示工程确实不够用时再上,而且微调也需要足够且高质量的数据才有效。

追问

追问 1微调能让模型学到最新知识吗?

可以注入一些领域知识,但用微调来「记事实」并不高效,还可能引入遗忘和幻觉。如果只是想让模型用到最新或私有的资料,更常用的是 RAG(检索增强生成)——把资料检索出来放进提示里,比微调更新更灵活、成本更低。

追问 2few-shot 算提示工程还是微调?

算提示工程。few-shot 是在提示里给模型几个输入输出示例,让它照着模仿,模型权重完全不变,属于「在输入上引导」。它和微调的根本区别就在于是否改动了模型权重。

延伸学习

与本题相关的知识库文章、术语、工具与行业资讯。