如何让大模型用上公司的私有 / 实时数据？

Question 1

Accepted Answer

根据数据是「静态文档」还是「实时变化」分两种做法。 私有文档用 RAG（最常用） 把文档（手册、Wiki、合同）切成小块 → 用 embedding 模型把每块转成向量、存进向量库 → 用户提问时把问题也转向量、检索出最相关的几段 → 把这几段拼进 prompt，让模型「只根据这些资料回答，并标注出处」。好处是文档更新只需重新入库，无需训练，且能溯源。 实时数据用 function calling 库存、天气、订单状态这类实时数据不该进向量库。给模型注册工具（如 queryStock(sku)），模型判断需要时返回要调用的函数和参数，你的代码去查真实接口，把结果回传给模型生成回答。 关键提醒 这两种都不是「重新训练模型」。微调改的是行为风格，不适合灌入易变的事实知识；私有/实时数据应靠检索和工具实时注入。

Question 2

什么数据用 RAG，什么数据用 function calling？

Accepted Answer

相对稳定、文本型、量大的知识（产品手册、政策、FAQ）用 RAG，提前切块入库；实时变化、结构化、要精确值的数据（余额、库存、当前价格）用 function calling 现查接口。两者也能结合：先 RAG 找到上下文，再调工具补实时字段。

Question 3

私有数据有隐私顾虑，不想出公网怎么办？

Accepted Answer

敏感场景选可私有部署的开源模型或企业内网 API，embedding 和向量库都放内网；调公网 API 前对 PII 脱敏、最小化传输内容；和供应商签数据不留存/不训练协议，并做访问审计。

如何让大模型用上公司的私有 / 实时数据？

核心要点

标准回答

常见误区

追问

延伸学习