Helicone

开源推理 & 评测5.8k↑+2

开源 LLM 可观测性平台,一行代码即可监控、评估和实验。YC W23 孵化,支持 LangChain、LlamaIndex 等主流框架的追踪与成本分析。5.7K+ stars。

🎯适用场景:LLM 应用可观测性、成本追踪、A/B 实验评估

#ai-observability#llm-evaluation#analytics#langchain

📥 收录于 2026/6/3

📊 仓库数据

Stars5,774
Forks593
语言TypeScript
更新2026/6/3

📈 上次抓取以来 ↑+2

优点

  • YC 孵化项目成熟度高
  • 一行代码集成
  • 实验评估一体化

⚠️ 限制

  • 依赖云端服务部署
  • 高级功能需付费

🔗 相关工具

langfuse

开源28k↑+10

github.com/langfuse/langfuse

🪢 开源 LLM 工程平台,28K+ stars。提供 LLM 可观测性、指标监控、评估、提示词管理、playground 等功能,是 LLM 应用开发和调试的基础设施

🎯LLM 应用链路追踪、Prompt 调试与评估、生产环境可观测性

#analytics#autogen#evaluation#langchain+1
语言TypeScript
🍴 Forks2,940
🔄 更新2026/6/3
📥 收录2026/5/7

Ragas

开源14k↑+1

github.com/vibrantlabsai/ragas

LLM 应用评估框架,提供 RAG 管道的自动化评测能力,支持答案相关性、上下文忠实度、幻觉检测等关键指标,帮助开发者量化和优化 LLM 应用质量。(14K+ stars)

🎯LLM 应用质量评估、RAG 管道评测、AI 产品验收测试

#llm-evaluation#rag#llmops#metrics+1
语言Python
🍴 Forks1,456
🔄 更新2026/6/3
📥 收录2026/5/24

gateway

开源12k↑+4

github.com/portkey-ai/gateway

AI 网关,12K+ stars。集成防护栏的高速 AI 网关,支持路由到 200+ LLM 和 50+ AI 基础设施,提供负载均衡和成本优化

🎯多模型 API 统一接入与路由

#ai-gateway#gateway#generative-ai#hacktoberfest+1
语言TypeScript
🍴 Forks1,104
🔄 更新2026/6/3
📥 收录2026/5/7

phoenix

开源10.0k

github.com/arize-ai/phoenix

AI 可观测性与评估平台,9750 stars。提供 LLM 应用的可观测性、评估和调试能力,帮助监控 AI 系统性能

🎯LLM/RAG 链路追踪、Embedding 质量评估、生产监控

#agents#ai-monitoring#ai-observability#aiengineering+1
语言Python
🍴 Forks906
🔄 更新2026/6/3
📥 收录2026/5/7

Logfire

开源4.3k

github.com/pydantic/logfire

Pydantic 团队打造的 AI 可观测性平台。面向生产环境 LLM 和 Agent 系统的监控与追踪,支持 FastAPI 原生集成、日志与指标采集。4.2K+ stars。

🎯生产环境 LLM/Agent 监控、Pydantic 生态集成可观测性

#ai-observability#pydantic#fastapi#llm-observability
语言Python
🍴 Forks244
🔄 更新2026/6/3
📥 收录2026/6/3

Laminar

开源3.0k

github.com/lmnr-ai/lmnr

YC S24 孵化的 AI Agent 可观测性平台——专为 AI Agent 设计的开源观测和分析工具,支持 LLM 评估、Agent 追踪和自托管部署,是 Agent 可观测性领域的新星。

🎯AI Agent 可观测性、LLM 评估追踪和自托管部署

#ai-observability#evaluation#agent-tracing#YC
语言TypeScript
🔄 更新2026/6/3
📥 收录2026/6/4