LangChain 的 OutputParser 有什么作用？常见类型有哪些？

Question 1

Accepted Answer

OutputParser 解决什么 LLM 的原始输出是非结构化文本，但下游代码往往需要确定的字段（如订单号、情感标签、实体列表）。OutputParser 做两件事：一是 get_format_instructions 生成格式说明，拼进提示词告诉模型按什么结构输出；二是 parse 把返回文本转成结构化对象，必要时做类型校验。 常见类型 - StructuredOutputParser：用 ResponseSchema 声明若干字段，解析成 dict，适合简单平铺结构。 - PydanticOutputParser：绑定一个 Pydantic 模型，解析后得到带类型校验的对象，字段缺失或类型错误会报错，适合复杂嵌套与强约束。 - JsonOutputParser：把输出当 JSON 解析，常配合 Pydantic 模型，且支持流式（边生成边产出部分 JSON）。 - CommaSeparatedListOutputParser：把逗号分隔文本切成 Python 列表，适合「列出 5 个关键词」这类任务。 容错与纠错 - OutputFixingParser：包在某个 parser 外层，解析失败时把错误信息和原输出再发给 LLM 让它修成合法格式。 - RetryOutputParser：连同原始提示一起重试，适合输出缺信息而非仅格式错的情况。 2026 的推荐做法 现在主流模型都支持原生结构化输出，更推荐 structured_llm = model.with_structured_output(MySchema) 直接拿到对象，或开启 JSON mode / 用工具调用约束 schema。这类方式由模型端保证格式，比「提示词约束 + 文本解析」更可靠，传统 OutputParser 更多用于不支持原生结构化输出的模型或需要自定义后处理的场景。

Question 2

PydanticOutputParser 和 with_structured_output 有什么区别？该怎么选？

Accepted Answer

实现层不同：PydanticOutputParser 走「提示词注入 schema 说明 + 模型输出文本 + 客户端解析校验」，约束在提示侧，模型本身不保证格式；with_structured_output 把 schema 下推到模型端，通过原生 JSON mode 或工具调用让模型直接产出结构化结果。 可靠性：原生结构化输出由模型保证 schema，失败率更低、无需额外纠错；纯 parser 方式在弱模型上容易格式跑偏。 选型：模型支持原生结构化输出就优先 with_structured_output；只有面对老旧/本地不支持的模型，或需要在解析阶段做自定义清洗时，才用 PydanticOutputParser，并叠加 OutputFixingParser 兜底。

Question 3

解析经常失败，工程上怎么提升结构化输出的成功率？

Accepted Answer

优先原生能力：能用 with_structured_output / JSON mode / 工具调用就别靠提示词，模型端约束最稳。 收紧 schema：字段尽量扁平、加清晰描述和枚举值，复杂结构拆成多步，减少模型自由发挥空间。 降随机性：结构化任务把 temperature 调低，减少格式漂移。 兜底链路：外层包 OutputFixingParser/RetryOutputParser 自动纠错；仍失败则记录原始输出、走人工或降级分支，避免脏数据进库。 可观测：用 LangSmith 等追踪解析失败样本，反向优化提示与 schema。

Question 4

JsonOutputParser 的流式解析是怎么回事？什么场景用得上？

Accepted Answer

机制：JsonOutputParser 支持在模型逐 token 生成时做增量解析，边收边产出当前已完整的部分 JSON（partial JSON），而不必等整段输出结束。

场景：前端要做「打字机式」展示结构化结果，比如逐字段渲染一张正在生成的卡片、表单或列表，提升交互即时感。

注意：流式过程中拿到的是中间态、可能字段不全，要在 UI 上处理未完成状态；最终仍以流结束时的完整对象为准，并对结果做校验。

LangChain 的 OutputParser 有什么作用？常见类型有哪些？

核心要点

标准回答

常见误区

追问

🔗 相似问题

延伸学习

核心术语

AI 工具