文章摘要
学会用大语言模型构建实际应用。从 API 调用到 RAG 系统搭建,再到微调实战,这是从 Prompt Engineering 到 AI Agent 的关键桥梁。
4📍 推荐学习路径
本分类共 31 篇文章,以下是推荐的系统性学习路径:
第一阶段:LLM 应用基础(选读 5 篇)
- LLM Token 经济学 → 理解 Token、上下文窗口、成本
- RAG 检索增强生成架构指南 → 搭建私有知识问答系统
- LangChain:LLM 应用开发框架 → 快速原型开发
- LLM 部署实践:vLLM, TGI, Ollama → 生产环境部署
- LLM 微调技术全景 → LoRA、QLoRA 参数高效微调
第二阶段:深入理解(选读核心)
- LLM 推理加速实战 → KV Cache 优化、推测解码
- LLM 评测体系 → 从 MMLU 到 LMSYS Arena
- LLM 生产环境可观测性 → 监控与调试
- Anthropic Claude 生态系统 → Claude 全家桶
第三阶段:高级专题(按需选读)
⚡ 速成建议:第一阶段 5 篇 = LLM 应用开发核心知识。学完即可独立搭建 AI 应用。
| 阶段 | 文章数 | 预计时间 | 目标 |
|---|---|---|---|
第一阶段:应用基础 | 5 篇 | 1-2 周 | 能用 API + RAG 搭建完整 AI 应用 |
第二阶段:深入理解 | 选读 4-6 篇 | 1-2 周 | 掌握推理优化、评测、部署 |
第三阶段:高级专题 | 按需选读 | 按需 | 理解训练、RLHF、MoE 等底层原理 |
学习路线图
LLM 应用架构
🎯 相关面试题
巩固本篇知识点,备战 AI 岗位面试。
- 初级场景高频查看详解 →
如何调用大模型 API 完成一个任务?需要关注哪些参数?
讲清 messages/temperature/max_tokens 等关键参数,以及超时重试、限流、token 计费的工程处理。
- 中级场景查看详解 →
如何收集用户反馈来持续改进 AI 功能?
显式反馈+隐式信号一起收,回流成评测集与 badcase,驱动迭代形成数据飞轮。
- 中级场景高频查看详解 →
实际项目里如何降低大模型 API 的调用成本?
从模型路由、缩短 prompt、语义缓存、限制输出、监控 token 等多管齐下降本。
- 中级场景查看详解 →
如何设计 AI 功能的「兜底」体验(模型答不出时怎么办)?
低置信时优雅降级:明确说不确定、给替代路径、设拒答阈值、留人工通道。