标准回答
一句话判断标准
电商功能要不要直接交给大模型,关键看任务是偏创意/理解还是偏精确/交易。前者容错、看的是"好不好、像不像",大模型擅长;后者要求结果绝对正确、可追溯、不能编,必须靠工程系统兜底。把这条线分清,选型就不会跑偏。
适合直接用大模型的功能
这些是大模型的主场:商品描述与营销文案生成,根据卖点批量产出标题、详情、活动文案;智能客服问答,结合知识库回答售前售后咨询;评论摘要与情感分析,把成千上万条评价浓缩成优缺点概览、判断情绪倾向;导购对话,像真人一样理解需求、推荐搭配、解释差异;搜索 query 理解,把口语化、含错别字的搜索词解析成结构化意图。它们的共同点是创意生成或自然语言理解,允许一定弹性,正好发挥大模型的语言能力,出点小偏差也不致命。
需要结合工程化手段的功能
另一类功能大模型只能"参与",不能"主导"。精准推荐与搜索排序本质是基于海量用户行为、商品特征的大规模检索与排序问题,仍要靠成熟的召回-粗排-精排系统和特征工程来保证效果与时效,大模型适合做 query/商品的语义理解、或在排序末端做少量重排辅助,但替代不了整套召回排序架构。价格、库存、优惠计算、下单与交易这类是确定性逻辑,一分钱、一件库存都不能错,必须由规则引擎和数据库精确执行,绝不能让可能产生幻觉的大模型去"算"或"承诺"。风控同理,需要规则、特征模型与策略系统结合,大模型只能作为辅助信号。
核心原则:增强而非唯一决策
总结成一条原则:创意与理解类任务用大模型,精确与交易类任务靠工程,大模型做增强而不做唯一决策。落地时通常是组合拳——大模型负责理解用户、生成内容、提升体验,把结构化的、需要精确和可靠的部分交给传统系统执行,并对大模型的输出做校验和约束。这样既享受了大模型带来的体验提升,又守住了电商最不能出错的交易底线。
常见误区
⚠️ 常见踩坑
最危险的误区是让大模型直接决定价格、库存或下单结果——它会一本正经地编出不存在的优惠或承诺缺货商品,造成真实资损和投诉,这类确定性逻辑必须由规则和数据库裁决。另一个误区是以为有了大模型就能扔掉推荐和搜索排序系统:大规模个性化排序依赖行为特征和工程架构,大模型只能做理解和辅助重排,替代不了召回排序全链路。记住大模型是增强,不是唯一决策者。
追问
追问 1:导购对话里大模型推荐了商品,怎么保证推荐的商品真实可买、价格正确?
把"理解推荐"和"取数下单"分层。大模型负责理解用户需求、生成对话和候选方向,但具体推哪些商品要走真实的商品检索/推荐接口拿到在售、有库存的 SKU,价格、优惠、库存一律实时查数据库或交易系统,由系统返回而非模型编造。展示给用户的价格和可购状态以系统数据为准,模型只做表达包装,从而避免幻觉导致的虚假承诺。
追问 2:搜索场景里,大模型做 query 理解和传统召回排序如何配合?
典型做法是大模型在前端做 query 理解——纠错、改写、扩展同义词、识别意图与属性,把模糊口语化的搜索词转成结构化条件,喂给召回系统提升召回质量。中间的召回和粗排、精排仍由成熟的检索与排序模型基于特征和行为数据完成,保证规模和时效。大模型还可在结果末端对少量头部结果做语义重排或解释,但不替代整条排序链路,定位是理解和增强。
追问 3:用大模型批量生成商品文案,如何避免夸大宣传或违规内容?
在生成前后都要加约束。生成时用提示限定事实来源(只能基于给定的真实卖点和参数),禁止绝对化用语和违规承诺;生成后过一道合规校验,用规则词表加分类模型检测违禁词、虚假宣传、敏感内容,命中则拦截或回退人工。重要类目可先人工抽检建立信任,再逐步放量,并保留生成记录便于追溯,确保文案既有吸引力又不踩合规红线。
🔗 相似问题
同一考点的不同问法,面试官可能换着问,一起刷更稳
没找到想看的面试题?把你想看的告诉我们 →
延伸学习
按主题分类的相关资源,便于系统复习