LangChain 的 Callback 回调机制是什么？有什么用？

Question 1

Accepted Answer

机制本质 LangChain 运行一条链时，内部组件（LLM、Chain、Tool、Retriever、Agent）会在关键节点发出事件。Callback 机制就是让你注册一组 handler，在这些事件触发时执行自定义代码，从而把「可观测性、流式、副作用」与核心业务逻辑解耦。 主要事件 - LLM 级：on_llm_start、on_llm_new_token（流式逐 token）、on_llm_end、on_llm_error。 - Chain 级：on_chain_start、on_chain_end、on_chain_error。 - Tool 级：on_tool_start、on_tool_end、on_tool_error。 - Agent / Retriever 级：on_agent_action、on_agent_finish、on_retriever_start 等。 典型用途 - 流式输出：在 on_llm_new_token 把 token 推给前端或 SSE，实现打字机效果。 - 日志与调试：记录每步输入输出、耗时，定位链路问题。 - 监控与追踪：挂 LangSmith 的追踪 handler，自动可视化整条调用树。 - 成本统计：在 on_llm_end 累加 prompt/completion token，估算调用成本。 - 自定义副作用：异常时告警、命中策略时写审计日志等。 实现与挂载 自定义时继承 BaseCallbackHandler 并重写需要的事件方法。挂载有两种粒度：构造组件时传 callbacks（对该组件生效），或在调用时通过 config={"callbacks": [handler]} 传入（仅本次运行生效，更灵活）。 2026 的实践 LCEL 普及后，流式更多直接用 stream/astream，而要细粒度消费各阶段事件可用 astream_events（统一的事件流 API）；可观测性则普遍交给 LangSmith 托管追踪。Callback 仍是这些能力的底层机制，但日常开发中直接手写 handler 的场景减少，多见于自定义副作用和接入自有监控系统。

Question 2

用 Callback 做流式输出和直接用 stream/astream 有什么区别？

Accepted Answer

抽象层级：on_llm_new_token 回调是底层 token 事件钩子，需要自己写 handler 把 token 推出去；stream/astream 是 LCEL 的高层接口，直接以迭代器形式产出增量结果，代码更简洁。 适用面：只想把最终输出流式给前端，用 stream/astream 即可；要同时观测中间各组件事件、做成本统计或自定义副作用，Callback（或 astream_events）更合适。 关系：stream 底层其实也依赖回调事件，两者并不互斥，常组合使用——用 stream 拿输出，用 callback/LangSmith 做追踪。

Question 3

怎么用 Callback 统计一次调用的 token 用量和成本？

Accepted Answer

取数：在 on_llm_end 事件里，从返回的 LLMResult.llm_output（或 usage_metadata）读 prompt_tokens、completion_tokens，按模型单价换算成本并累加。

现成工具：OpenAI 系可用 get_openai_callback() 上下文管理器，块内自动汇总 token 数与美元成本，省去手写 handler。

落地：把每次调用的 token 与成本写进日志/数据库，按用户或会话聚合，用于配额限流和成本看板；多模型混用时按模型分别记单价。

Question 4

BaseCallbackHandler 和 LangSmith 追踪是什么关系？生产上怎么取舍？

Accepted Answer

关系：LangSmith 的自动追踪本质就是内置的一组 callback handler，挂在运行上把每一步事件上报到平台，形成可视化调用树；BaseCallbackHandler 则是让你写自定义 handler 的基类。

取舍：通用可观测性（链路、耗时、token、错误）优先用 LangSmith，配置环境变量即开箱即用，省去自研监控；自定义 handler 留给平台覆盖不到的需求，如写入自有数据仓库、触发业务告警、对接公司内部 APM。

实践：二者并存，LangSmith 兜底全链路追踪，手写 handler 补充特定副作用，注意控制 handler 开销避免影响主链路。

LangChain 的 Callback 回调机制是什么？有什么用？

核心要点

标准回答

常见误区

追问

🔗 相似问题

延伸学习

核心术语

AI 工具