开源权重（Open Weights）

模型代码和数据都公开

亦作、亦称：Open Weights

开放权重（Open Weights）指将训练完成的神经网络参数文件公开发布，允许任何人下载、本地部署与微调，但通常不包含完整训练数据或训练代码。它与「完全开源」有本质区别：开源软件倡议（OSI）定义的开源 AI 还要求公开训练数据和训练流程代码，而绝大多数当前流行「开源」模型仅达到开放权重这一层级。

概述

开放权重模型将训练好的神经网络参数以文件形式公开发布，用户下载后可在自有硬件上运行或继续微调。

权重文件：通常以 .safetensors 或 .bin 格式存储，包含模型全部可学习参数
不等于完全开源：多数「开放权重」模型并不公开训练数据集或完整训练代码，与 OSI 定义的开源 AI 标准不同
许可证多样：从商用友好（如 Apache 2.0）到严格限制（如 LLaMA Community License）不等，使用前须逐条核查
代表模型：LLaMA 3（Meta）、Qwen 2.5（阿里巴巴）、DeepSeek-V3（深度求索）、Mistral 系列（Mistral AI）

与完全开源的核心区别

「开放权重」与「开源 AI」是两个不同层级的概念，混淆两者是当前业界最常见的误区之一。

OSI 开源 AI 定义：要求同时公开模型权重、训练数据（尽可能）以及训练与评估的完整源代码
开放权重缺口：LLaMA、Qwen、DeepSeek 等主流模型仅发布推理代码，不含训练代码，也未完整公开训练数据，因此不符合 OSI 开源 AI 标准
争议来源：Meta 最初将 LLaMA 系列描述为「开源」，引发 OSI 和学术界的公开争议，「开放权重」一词随之被明确采用以作区分
透明度谱系：从「完全闭源 API」→「开放权重」→「开放权重+部分数据」→「完全开源（OSI 合规，如 OLMo）」形成连续谱
真正完全开源案例：Allen AI 发布的 OLMo 系列同时开放权重、训练数据和训练代码，是目前最接近完全开源的大模型

工作原理

用户获取开放权重后，可通过推理框架直接加载并运行，无需重新训练。

权重加载：推理框架（如 Hugging Face transformers、llama.cpp）读取权重文件并映射到对应网络层，即可执行推理
量化压缩：原始权重常为 BF16/FP16，可通过 GPTQ、AWQ 等方法量化为 4-bit，大幅降低显存需求
本地推理：借助 Ollama、vLLM、SGLang 等工具，个人 GPU 或 CPU 即可运行 7B–70B 量级模型
微调：基于开放权重，用 LoRA / QLoRA 等参数高效方法可在领域数据上继续训练，成本远低于从头预训练

常见许可证类型

使用开放权重模型前，必须仔细核对许可证条款，「开放权重」并不等于「免费商用」。

Apache 2.0：最宽松之一，允许商业使用与修改，如 Mistral 7B、部分 Qwen 版本
Meta LLaMA Community License：允许商业使用，但月活超 7 亿用户需额外授权；禁止用于训练竞争性 Meta 产品的替代品
研究限定许可：仅允许学术与非商业用途，如早期 LLaMA 1
MIT 许可：允许几乎所有使用场景，是最宽松的许可形式之一
自定义许可：DeepSeek 等使用自定义条款，须逐条核查再分发和衍生品限制

应用场景

开放权重的最大价值在于让模型可在受控环境中部署，适合数据敏感或需要定制化的场景。

私有化部署：金融、医疗等行业将模型部署在内网，数据不出境，满足合规要求
垂直领域微调：在法律、代码、医学等专业语料上继续训练，打造领域专属助手
成本优化：相比 API 调用，本地推理在高并发下边际成本更低，适合大规模内部应用
学术研究：研究者可直接分析权重，进行 机械可解释性 研究或安全红队测试
边缘部署：量化后的小模型（如 Qwen2.5-0.5B）可运行于手机或嵌入式设备，实现端侧 AI

风险与争议

开放权重在带来灵活性的同时，也引发了安全与治理层面的关切。

安全护栏可被绕过：权重一旦公开，针对有害用途的微调（Jailbreak fine-tuning）更易实施，原厂无法远程干预或撤销
许可证滥用：部分使用者在未经授权情况下将模型用于商业产品，引发法律纠纷
监管压力：美国 NTIA 等机构正在评估是否对高能力开放权重模型实施额外管控
选择性透明度：仅公开权重而不开放数据和训练流程，被批评者视为「洗白开源」，无法真正审计模型偏见或数据来源

发展脉络

开放权重生态在 2023 年后迅速成熟，形成与闭源 API 并立的重要力量。

2018：BERT（Google）开放权重，推动 NLP 迁移学习普及，规模约 3.4 亿参数
2019：GPT-2（OpenAI）以「延迟发布」策略开放权重，引发关于大模型开放安全性的早期讨论
2022：BLOOM（BigScience）以 176B 参数开放权重与训练代码，是早期大规模开放尝试
2023 年 2 月：Meta 发布 LLaMA 1（7B–65B），最初仅限研究，权重外泄后迅速催生大量社区微调版本，开放权重生态爆发
2023 年 7 月：Meta 发布 LLaMA 2，正式支持商业使用，「开放权重」术语被行业广泛规范采用
2024 年：LLaMA 3、Gemma（Google）、DeepSeek-V2、Qwen2 相继发布，与闭源前沿的性能差距持续缩小
2025 年：OSI 正式发布「开源 AI 定义 1.0」；DeepSeek-R1 开放权重引发全球关注，推动开放权重进入政策主流讨论

常见误解

日常交流中容易听到的简化说法，未必准确，但能帮助理解误解从何而来。

「模型代码和数据都公开」
「大模型圈高频词」
「跟开源权重是一回事吗」

延伸阅读

从知识库精选 2 篇文章，帮助深入理解该术语。

外部参考

维基百科：查看「开源权重」词条

本页内容为本站原创撰写；维基百科链接仅作延伸参考。