自洽性（Self-Consistency）如何提升 CoT 推理效果？

Question 1

Accepted Answer

动机

普通 CoT 用贪心解码只走一条推理链，一旦中间某步出错，错误会传导到最终答案。Self-Consistency 的洞见是：通向正确答案的推理路径往往不止一条，而错误路径彼此各异。

做法

为什么有效

多条路径构成同一模型的隐式集成：正确答案因被多条不同路径共同导向而高频出现，零散的错误答案被票数稀释，从而在数学、常识等推理基准上稳定优于单链 CoT。

代价

准确率提升以 N 倍推理成本和延迟为代价，需在收益饱和点上权衡采样数。

Question 2

什么任务适合用 Self-Consistency？

Accepted Answer

适合有唯一可比对的离散最终答案、且存在多条有效推理路径的任务，如算术、数学应用题、多步常识与逻辑推理。对开放式生成（写作、摘要）不适用，因为答案无法直接多数投票。

Question 3

采样数 N 怎么选？

Accepted Answer

准确率随 N 上升但边际收益递减、很快饱和，常见取 5–40。需结合成本/延迟预算选在收益拐点附近；任务越难、模型越不确定，受益于更大 N 的空间越大。

核心要点