如何用大模型做多语言翻译 / 本地化？要注意什么？

Question 1

Accepted Answer

为什么用 LLM 翻译 相比传统机翻，LLM 能理解上下文、把握语气，对长句、俚语、一词多义处理更自然，还能按指令做风格调整。 实战要点 1. 明确指令：在 system/prompt 写清「把以下中文翻译成正式的日语，面向企业客户」，给出风格与受众，效果远好于「翻译一下」。 2. 术语表约束：把品牌名、产品名、专业术语整理成对照表放进上下文，要求模型严格遵守，保证全站译法一致。 3. 保护格式：UI 文案常含 {count}、%s、HTML 标签、Markdown，要明确「占位符与标签原样保留，只译可见文字」，否则会破坏程序。 4. 文化本地化：不只是翻译，要本地化日期/货币格式、敬语、计量单位、习惯表达，避免直译生硬。 5. 长文本分段：超上下文窗口的内容要分块翻译，并保持术语和语气跨块一致。 6. 质量评估：核心文案做回译检查语义是否走样，配合人工抽检或 BLEU 等指标。 参考 机器翻译。

Question 2

如何保证整个产品里同一个术语翻译一致？

Accepted Answer

维护一份术语表（源语→目标语对照），每次翻译都把相关术语注入上下文并要求严格遵守；也可在后处理阶段用脚本对照术语表做强制替换/校验，避免模型偶发不一致。

Question 3

怎么防止模型把代码变量或 HTML 标签也翻译了？

Accepted Answer

在指令中明确「{xxx}、%s、<tag> 等占位符和标签必须原样保留，只翻译自然语言文本」，并给一个示例；上线前用正则校验占位符在译文中是否完整存在，不一致则报警或回退。

如何用大模型做多语言翻译 / 本地化？要注意什么？

核心要点

标准回答

常见误区

追问

延伸学习