标准回答
总思路
LLM 强在理解和生成自然语言,但它是概率模型、会幻觉、有延迟和成本。凡是和这些短板冲突的场景就要慎用,或只让它做辅助 + 人审。
不适合的几类场景
- 要求 100% 准确、可审计:医疗诊断、财务/税务计算、法律判决等直接决策,错误代价大且需可解释可追溯,LLM 的不确定性不可接受。
- 强实时、低延迟、低成本:高并发、毫秒级响应或预算极紧的链路,LLM 推理慢又贵,不划算。
- 简单规则可解:表单校验、固定流程判断,写 if-else、正则或用传统模型既稳定又便宜,杀鸡不用宰牛刀。
- 精确数学 / 确定性输出:纯计算、严格排序、必须每次结果一致的任务,应交给代码或计算器,LLM 易算错。
- 数据缺乏或隐私极敏感:没有可用语料、或数据不能外传的场景,需评估本地部署或干脆不用。
更稳的做法
这些场景优先用规则、传统模型或检索;确实需要 LLM 时,让它只做辅助(草稿/解释),关键结果由确定性逻辑或人工把关。参考 RAG 架构指南。
常见误区
⚠️ 常见踩坑
把 LLM 当万能锤,什么需求都套大模型,结果在简单/高频/高精度场景上既贵又慢还不稳定;以及在高风险决策里让 LLM 直接拍板而不加人工复核。
延伸学习
与本题相关的知识库文章、术语、工具与行业资讯。