如何用 Fisher-Yates 实现均匀随机洗牌？

Question 1

Accepted Answer

Fisher-Yates（又称 Knuth Shuffle）原地生成均匀随机排列。从数组末尾开始：对 i = n-1, n-2, ..., 1，从区间 [0, i]（闭区间，包含 i 本身）中等概率选一个下标 j，交换 a[i] 与 a[j]。这样位置 i 就被「定下来」，之后不再改动；下一轮在更短的前缀 [0, i-1] 上重复。

正确性证明：某元素最终落在最后一格（位置 n-1）的概率是 1/n；在它没被选到的前提下落到位置 n-2 的概率是 (1-1/n)·(1/(n-1)) = 1/n；以此类推，任一元素落到任一位置的概率都是 1/n，且各位置独立地构成一个排列，于是每个具体排列出现的概率为 1/n × 1/(n-1) × ... × 1 = 1/n!，即严格均匀。

时间复杂度 O(n)，空间 O(1) 原地完成。下方代码给出标准实现并附频率验证。

Question 2

为什么 j 的上界必须是 i 而不是 n-1？

Accepted Answer

因为只有 [0,i] 范围内各 i+1 个选择等概率，才能让总路径数恰为 n!，每种排列对应唯一一条路径。若用 [0,n-1]，路径总数 n^n 不被 n! 整除，必然有排列出现概率偏高（如 n=3 时某些排列概率 4/27、某些 5/27）。

Question 3

如何在数据流/未知长度下做洗牌（inside-out 变体）？

Accepted Answer

用 inside-out 算法：遍历输入第 i 个元素时，j=randint(0,i)，令 out[i]=out[j]，out[j]=输入[i]。它不需要预先知道 n，可边读边构造，同样保证 1/n! 均匀，且不修改原数组。

如何用 Fisher-Yates 实现均匀随机洗牌？

核心要点

标准回答

常见误区

追问

延伸学习