Chat API 的 system / user / assistant 角色如何正确使用？

Question 1

Accepted Answer

三种角色的职责 - system：放全局性的设定——角色/人设、任务目标、行为规则、输出格式与边界。它优先级最高、贯穿整段对话，适合写一次就长期生效的指令，是约束模型行为的主要手段。 - user：每一轮真实的用户输入，包括问题、待处理数据、具体任务。模型每次生成都是针对最新 user 消息（结合历史与 system）。 - assistant：模型之前生成的回复。在多轮里把它一并回传，模型才能「记住」上下文、保持连贯。也可手动写 assistant 消息来做 few-shot 示范或引导风格。 多轮对话的正确做法 Chat API 本身是无状态的：要维持上下文，必须把历史 user / assistant 消息按时间顺序随每次请求一起发送。随着轮次增多，要关注上下文窗口上限与 Token 成本，必要时对早期历史做截断或摘要。 更多应用层用法见 LangChain：LLM 应用开发框架。

Question 2

如果 system 和 user 指令冲突，模型听谁的？

Accepted Answer

通常 system 优先级更高，模型倾向遵循 system 设定的全局规则与边界。但这并非绝对，措辞强烈或精心构造的 user 输入仍可能产生干扰甚至越权，因此关键约束要写在 system，并配合护栏校验，不能只靠角色优先级。

Question 3

多轮对话太长超出上下文窗口怎么办？

Accepted Answer

常见策略：对较早的历史做摘要后回传、只保留最近 N 轮、用检索把相关历史片段动态拼回，或对长文档单独做 RAG。目标是在窗口和成本受限下，保留对当前回答最关键的上下文。

Chat API 的 system / user / assistant 角色如何正确使用？

核心要点

标准回答

常见误区

追问

延伸学习