什么是 Chain-of-Thought（CoT）提示？

Question 1

Accepted Answer

两种形式 - Zero-shot CoT：只需在指令后加一句「Let us think step by step（请一步步思考）」，即可激发模型输出推理链。 - Few-shot CoT：在示例中给出 question → reasoning → answer 的完整链条，让模型模仿这种「先推理后作答」的格式。 为什么有效 把多步推理外化成可见的中间 token，相当于给模型更多「思考算力」，减少一步到位时的跳跃错误；大模型预训练中已有大量推理模式可被激活。 局限 - 增加输出 token，带来成本与延迟。 - 简单任务可能过度思考，反而出错。 - 推理链本身也可能幻觉，看似有理实则错误。 进阶变体：Self-Consistency 采样多条推理路径再对答案投票；Tree-of-Thought 把推理组织成可搜索/回溯的树结构。

Question 2

CoT 对小模型有效吗？

Accepted Answer

7B 以下小模型 CoT 收益有限，易出现错误推理链；需足够参数量与指令跟随能力。可试 few-shot CoT 或改用工具/检索补足，而非强推长链推理。

Question 3

什么是 Self-Consistency？

Accepted Answer

对同一问题采样多条 CoT 推理路径，对最终答案投票取众。可提升数学/推理准确率，代价是多次推理的成本与延迟，适合高价值、低 QPS 场景。

什么是 Chain-of-Thought（CoT）提示？

核心要点

简要回答

标准回答

常见误区

追问

延伸学习