核心要点

  • Prompt 里明确目标语言、风格(正式/口语)、受众,比通用模型默认翻译更准

  • 传入术语表(glossary)强制统一品牌名、专有名词、行业术语的译法

  • 保留变量占位符(如 {name}、 标签)原样不译,并在指令里强调

  • 关键文案用回译(back-translation)或人工 + BLEU 抽检质量

标准回答

为什么用 LLM 翻译

相比传统机翻,LLM 能理解上下文、把握语气,对长句、俚语、一词多义处理更自然,还能按指令做风格调整。

实战要点

  1. 明确指令:在 system/prompt 写清「把以下中文翻译成正式的日语,面向企业客户」,给出风格与受众,效果远好于「翻译一下」。
  2. 术语表约束:把品牌名、产品名、专业术语整理成对照表放进上下文,要求模型严格遵守,保证全站译法一致。
  3. 保护格式:UI 文案常含 {count}、%s、HTML 标签、Markdown,要明确「占位符与标签原样保留,只译可见文字」,否则会破坏程序。
  4. 文化本地化:不只是翻译,要本地化日期/货币格式、敬语、计量单位、习惯表达,避免直译生硬。
  5. 长文本分段:超上下文窗口的内容要分块翻译,并保持术语和语气跨块一致。
  6. 质量评估:核心文案做回译检查语义是否走样,配合人工抽检或 BLEU 等指标。

参考 机器翻译

常见误区

⚠️ 常见踩坑

直接「翻译这段话」而不给目标语言风格和术语约束,导致译法不统一、占位符被翻译破坏程序;以及对法律/医疗等高风险文案盲目信任不做人工复核。

追问

追问 1如何保证整个产品里同一个术语翻译一致?

维护一份术语表(源语→目标语对照),每次翻译都把相关术语注入上下文并要求严格遵守;也可在后处理阶段用脚本对照术语表做强制替换/校验,避免模型偶发不一致。

追问 2怎么防止模型把代码变量或 HTML 标签也翻译了?

在指令中明确「{xxx}、%s、 等占位符和标签必须原样保留,只翻译自然语言文本」,并给一个示例;上线前用正则校验占位符在译文中是否完整存在,不一致则报警或回退。

延伸学习

与本题相关的知识库文章、术语、工具与行业资讯。