AI 面试题库
覆盖大语言模型、AI Agent、机器学习等方向的高频面试题,每题配有核心要点、标准答案、常见误区与追问。
当前收录 179 道题 · 与知识库文章、术语表深度关联
共 179 道题
RAG 中的文档切分(Chunking)策略如何影响检索质量?
块太大稀释语义、引入噪声;块太小割裂上下文。好的切分要兼顾语义完整与块内信息密度,并配合重叠与父子块。
混合检索(向量 + 关键词 BM25)解决了什么问题?
向量检索懂语义但对专有名词/数字/缩写不敏感;BM25 精确匹配关键词但不懂同义。混合检索用 RRF 融合两者取长补短。
什么是 MCP(Model Context Protocol)?解决什么问题?
Anthropic 提出的开放协议,标准化 LLM 与外部工具/数据源连接,类似 AI 应用的 USB 接口。
AI Agent 的记忆系统如何设计?
分短期(上下文窗口)、长期(向量库/知识图谱)和工作记忆,按重要性检索注入 prompt。
多 Agent 系统有哪些协作模式?
常见模式包括层级(Manager-Worker)、对等辩论、流水线分工;需解决通信协议、状态同步与冲突消解。
AI Agent 的任务规划(Planning)有哪些方法?
从简单 CoT 到 Plan-and-Execute、ReWOO、Tree of Thoughts,核心是把复杂任务分解为可执行子步骤并动态调整。
RAG 和微调(Fine-tuning)各适合什么场景?如何选型?
RAG 适合知识频繁更新、需溯源的场景;微调适合固化行为模式、风格、领域语言;生产环境常组合使用。
如何评估一个 RAG / Agent 系统的效果?
分层评估:检索层(Recall/Precision/MRR)、生成层(Faithfulness/Answer Relevance,可用 RAGAS)、端到端任务成功率与人工标注。
一个完整的 RAG 系统包含哪些模块?数据如何流动?
RAG = 离线索引(切分→嵌入→入库)+ 在线问答(检索→重排→拼上下文→生成带引用),两条数据流缺一不可。
什么是 ReAct 模式?它如何解决 Agent 的推理与行动问题?
ReAct 交替生成推理(Thought)和行动(Action),观察结果(Observation)后继续,把链式推理与工具使用融为一体。
为什么 RAG 检索后还需要重排序(Rerank)?
向量召回是 bi-encoder 近似匹配,精度有限;rerank 用 cross-encoder 对候选精排,把真正相关的片段提到前列。
Function Calling / Tool Use 的实现原理是什么?
模型输出结构化 JSON 描述要调用的函数及参数,应用层执行后把结果回传,模型继续推理。
什么是 Prompt Injection?如何防御?
攻击者在输入中嵌入恶意指令劫持模型行为;防御靠输入过滤、权限隔离、输出校验与人机确认。
什么是越狱(Jailbreak)攻击?如何防御?
越狱通过角色扮演、前缀注入、编码绕过等手段诱导模型突破安全对齐输出违规内容;防御靠系统提示加固、输入输出过滤、对齐训练与红队。
向量数据库在 RAG 中的作用是什么?如何选型?
存储文档 Embedding,支持毫秒级相似度检索,是 RAG 召回层的核心;选型看规模、延迟、过滤、运维成本。
如何处理系统设计面试题?
先澄清功能与非功能需求并估算 QPS/存储;再给高层架构;然后深入关键路径(数据模型、缓存、一致性);全程沟通 trade-off 与扩展方案。
卷积神经网络(CNN)为什么适合图像任务?
局部连接、权值共享、平移等变性,参数量远小于全连接,能高效提取从边缘到语义的空间层次特征。
计算机视觉系统包含哪些关键组件?
完整 CV 系统含:**传感采集**(相机标定)→ **预处理**(去噪、resize)→ **模型推理**(CNN/检测器)→ **后处理**(NMS、跟踪、融合)→ **业务逻辑**(告警、可视化)→ **部署监控**(TensorRT、延迟、漂移)。