文章摘要
全面掌握大语言模型的核心知识:从 Transformer 架构、预训练流程,到 SFT、RLHF 微调和推理部署。这是从 Prompt Engineering 到 AI Agent 的关键桥梁。
1学习全景图
LLM 学习分为四个层次:
基础原理 → Transformer 架构、Attention 机制、位置编码
预训练 → 数据准备、分布式训练、训练稳定性
对齐与微调 → SFT、RLHF、LoRA、QLoRA
应用与部署 → RAG、Agent、量化部署、推理优化
我们按「先懂原理 → 再会微调 → 最后能部署」的顺序展开。
4学习建议
不要一上来就搞预训练——先理解 Transformer 架构,再学微调技术,最后才碰预训练。
动手优先——用 HuggingFace Transformers 跑通一个微调 demo,比读十篇论文有用。
🎯 相关面试题
巩固本篇知识点,备战 AI 岗位面试。
- 初级概念高频查看详解 →
什么是大语言模型(LLM)?它能做什么、不能做什么?
LLM 是基于 Transformer、在海量文本上预训练的自回归语言模型,擅长语言任务,但不擅长精确计算、实时信息,且会产生幻觉。
- 初级场景高频查看详解 →
大模型说的话能信吗?怎么判断它有没有在胡说?
不能盲信,它会一本正经胡说;看出处、能否核查、用 RAG 给依据、关键信息人工确认。
- 初级概念高频查看详解 →
Token 是什么?为什么大模型按 token 计费?
token 是模型处理文本的最小单位,按处理量算算力,所以按输入+输出 token 收费。
- 初级概念高频查看详解 →
为什么同样的问题,大模型每次回答都不一样?
采样有随机性,temperature>0 时按概率挑词;想可复现就把温度调低并固定 seed。