哪些场景不适合用大模型？为什么？

Question 1

哪些场景不适合用大模型？为什么？

Accepted Answer

总思路 LLM 强在理解和生成自然语言，但它是概率模型、会幻觉、有延迟和成本。凡是和这些短板冲突的场景就要慎用，或只让它做辅助 + 人审。 不适合的几类场景 1. 要求 100% 准确、可审计：医疗诊断、财务/税务计算、法律判决等直接决策，错误代价大且需可解释可追溯，LLM 的不确定性不可接受。 2. 强实时、低延迟、低成本：高并发、毫秒级响应或预算极紧的链路，LLM 推理慢又贵，不划算。 3. 简单规则可解：表单校验、固定流程判断，写 if-else、正则或用传统模型既稳定又便宜，杀鸡不用宰牛刀。 4. 精确数学 / 确定性输出：纯计算、严格排序、必须每次结果一致的任务，应交给代码或计算器，LLM 易算错。 5. 数据缺乏或隐私极敏感：没有可用语料、或数据不能外传的场景，需评估本地部署或干脆不用。 更稳的做法 这些场景优先用规则、传统模型或检索；确实需要 LLM 时，让它只做辅助（草稿/解释），关键结果由确定性逻辑或人工把关。参考 RAG 架构指南。

Question 2

如果业务确实要在高风险场景用 LLM，怎么降低风险？

Accepted Answer

让 LLM 只做辅助而非最终决策：用 RAG 接权威数据减少幻觉、关键计算交给确定性代码、输出加约束和校验、保留人工复核（human-in-the-loop），并记录可审计日志，把它定位成「提效助手」而非「拍板者」。

Question 3

怎么判断一个需求该用 LLM 还是传统方案？

Accepted Answer

先看任务是否需要理解/生成自然语言或处理开放性输入——是才考虑 LLM；再评估准确性要求、延迟与成本预算、数据与隐私约束。如果规则或传统模型就能稳定满足，优先用它们，LLM 留给真正发挥语言理解优势的部分。

哪些场景不适合用大模型？为什么？

核心要点

标准回答

常见误区

追问

延伸学习