自动提示优化（APE / DSPy）是怎么做的？

Question 1

Accepted Answer

核心思想 自动提示优化把「人工调提示」变成「用程序+LLM 搜索提示」。它依赖三个要素：能批量产出候选提示的生成器、一个可量化的评分指标（准确率、格式合规率等），以及在候选集合上迭代择优的搜索策略。 APE（Automatic Prompt Engineer） APE 让一个 LLM 根据少量示范或任务描述生成多个候选指令，再在验证集上对每个候选打分，保留高分者，并对其做变异/改写继续迭代，最终选出表现最好的提示。本质是「LLM 生成 + 评分 + 迭代」的黑盒搜索。 DSPy DSPy 把提示当作可优化的模块来工程化：开发者用 signature 声明每步的输入与输出，把流程写成可组合的程序；再交给优化器（如自动挑选 few-shot 示例、改写指令），按给定指标在数据上「编译」出最优的提示与示例组合。相比手写提示，它让提示随数据和指标自动调整，更易维护与迁移。 生产级提示的量化测试与改进可参考 Prompt 优化与评估。

Question 2

APE 和 DSPy 的优化器在做的事有何不同？

Accepted Answer

APE 偏向直接搜索「指令文本」，靠 LLM 生成候选再按分数择优；DSPy 把流程拆成带 signature 的模块，优化器既能改写指令，也能自动挑选/生成 few-shot 示例，并支持多步程序的联合优化，更工程化、可组合。

Question 3

自动提示优化容易过拟合，怎么缓解？

Accepted Answer

用独立的训练/验证/测试集划分，避免在用于搜索的同一份数据上报告效果；指标尽量贴近真实目标并包含多样样本；限制候选搜索的轮数与复杂度，必要时引入正则（如偏好更短、更通用的提示）以提升泛化。

自动提示优化（APE / DSPy）是怎么做的？

核心要点

标准回答

常见误区

追问

延伸学习