AI 面试题库

RAG 中的文档切分（Chunking）策略如何影响检索质量？

块太大稀释语义、引入噪声；块太小割裂上下文。好的切分要兼顾语义完整与块内信息密度，并配合重叠与父子块。

🦾 AI AgentChunkingRAG

🦾 AI AgentHybrid SearchBM25

混合检索（向量 + 关键词 BM25）解决了什么问题？

向量检索懂语义但对专有名词/数字/缩写不敏感；BM25 精确匹配关键词但不懂同义。混合检索用 RRF 融合两者取长补短。

什么是 MCP（Model Context Protocol）？解决什么问题？

Anthropic 提出的开放协议，标准化 LLM 与外部工具/数据源连接，类似 AI 应用的 USB 接口。

🦾 AI AgentMCP工具协议

高级🏗️ 系统设计高频

AI Agent 的记忆系统如何设计？

分短期（上下文窗口）、长期（向量库/知识图谱）和工作记忆，按重要性检索注入 prompt。

🦾 AI AgentAgent 记忆向量库

🦾 AI AgentMulti-AgentAgent 协作

高级🏗️ 系统设计高频

多 Agent 系统有哪些协作模式？

常见模式包括层级（Manager-Worker）、对等辩论、流水线分工；需解决通信协议、状态同步与冲突消解。

高级💡 概念题高频

AI Agent 的任务规划（Planning）有哪些方法？

从简单 CoT 到 Plan-and-Execute、ReWOO、Tree of Thoughts，核心是把复杂任务分解为可执行子步骤并动态调整。

🦾 AI AgentAgent 规划任务分解

中级🎯 场景题高频

RAG 和微调（Fine-tuning）各适合什么场景？如何选型？

RAG 适合知识频繁更新、需溯源的场景；微调适合固化行为模式、风格、领域语言；生产环境常组合使用。

🦾 AI AgentRAG微调

高级🏗️ 系统设计

如何评估一个 RAG / Agent 系统的效果？

分层评估：检索层（Recall/Precision/MRR）、生成层（Faithfulness/Answer Relevance，可用 RAGAS）、端到端任务成功率与人工标注。

🦾 AI AgentRAG 评估Agent 评测

中级🏗️ 系统设计高频

一个完整的 RAG 系统包含哪些模块？数据如何流动？

RAG = 离线索引（切分→嵌入→入库）+ 在线问答（检索→重排→拼上下文→生成带引用），两条数据流缺一不可。

🦾 AI AgentRAG系统设计

什么是 ReAct 模式？它如何解决 Agent 的推理与行动问题？

ReAct 交替生成推理（Thought）和行动（Action），观察结果（Observation）后继续，把链式推理与工具使用融为一体。

🦾 AI AgentReActAgent 推理

为什么 RAG 检索后还需要重排序（Rerank）？

向量召回是 bi-encoder 近似匹配，精度有限；rerank 用 cross-encoder 对候选精排，把真正相关的片段提到前列。

🦾 AI AgentRerankRAG

🦾 AI AgentFunction Calling工具调用

Function Calling / Tool Use 的实现原理是什么？

模型输出结构化 JSON 描述要调用的函数及参数，应用层执行后把结果回传，模型继续推理。

高级🎯 场景题高频

什么是 Prompt Injection？如何防御？

攻击者在输入中嵌入恶意指令劫持模型行为；防御靠输入过滤、权限隔离、输出校验与人机确认。

Prompt InjectionAI 安全

什么是越狱（Jailbreak）攻击？如何防御？

越狱通过角色扮演、前缀注入、编码绕过等手段诱导模型突破安全对齐输出违规内容；防御靠系统提示加固、输入输出过滤、对齐训练与红队。

Jailbreak越狱攻击

中级🎯 场景题高频

向量数据库在 RAG 中的作用是什么？如何选型？

存储文档 Embedding，支持毫秒级相似度检索，是 RAG 召回层的核心；选型看规模、延迟、过滤、运维成本。

🔧 AI 工程化向量数据库RAG

初级🏗️ 系统设计

如何处理系统设计面试题？

先澄清功能与非功能需求并估算 QPS/存储；再给高层架构；然后深入关键路径（数据模型、缓存、一致性）；全程沟通 trade-off 与扩展方案。

🔧 AI 工程化系统设计架构设计

初级💡 概念题高频

卷积神经网络（CNN）为什么适合图像任务？

局部连接、权值共享、平移等变性，参数量远小于全连接，能高效提取从边缘到语义的空间层次特征。

👁️ 计算机视觉CNN卷积神经网络

计算机视觉系统包含哪些关键组件？

完整 CV 系统含：**传感采集**（相机标定）→ **预处理**（去噪、resize）→ **模型推理**（CNN/检测器）→ **后处理**（NMS、跟踪、融合）→ **业务逻辑**（告警、可视化）→ **部署监控**（TensorRT、延迟、漂移）。

👁️ 计算机视觉计算机视觉系统CV流水线