核心要点
Model Card:用一页式文档说明模型的预期用途、训练数据概况、分群性能、已知局限与风险。
Datasheet for Datasets:记录数据集的动机、采集方式、构成、清洗、授权与已知偏见。
目的:提升透明度与可问责性,帮助使用者判断模型是否适用于自己的场景。
应给出「不该用于」的反向用途说明,并随版本更新、记录评估条件以便复现。
标准回答
两类文档
- Model Card(模型卡):随模型发布的结构化说明,覆盖预期用途、不当用途、训练/评测数据概况、按子群体(如性别、语言)拆分的性能、已知局限与伦理风险。
- Datasheet for Datasets(数据集说明书):随数据集发布,记录采集动机、来源与方式、样本构成、标注与清洗流程、授权/许可、隐私与偏见等已知问题。
为什么需要
- 透明度:让下游使用者了解模型「在什么条件下、对谁、表现如何」,而非只看一个总分。
- 问责性:明确责任边界与适用范围,出问题时可追溯设计与数据决策。
- 降低误用:写清「不该用于」的场景(如高风险医疗、执法决策),减少超范围部署。
多方视角与局限
监管(如透明度要求)和社区都在推动其标准化。但文档是自述性的,质量参差、可能避重就轻,需配合独立审计与第三方评测才更可信。
常见误区
⚠️ 常见踩坑
别把 Model Card 当营销材料只写优点。它的价值恰在于诚实披露局限、失败模式和不当用途;缺了「不该用于哪些场景」和分群性能,文档就失去了问责意义。
追问
追问 1:Model Card 和 Datasheet 的关注点有何不同?
Model Card 聚焦「模型」——用途、分群性能、局限与风险;Datasheet 聚焦「数据集」——来源、构成、采集与标注流程、授权和偏见。前者帮助判断模型是否适用,后者帮助判断数据是否合规、是否会把偏见带入模型。二者互补,共同支撑全链路透明。
追问 2:只靠厂商自述的 Model Card 够可信吗?
不够。Model Card 是自述文档,存在选择性披露、口径不一、更新滞后等问题。要提升可信度,需配合可复现的评测条件、独立第三方审计、外部红队结果,以及监管要求的透明度报告,让披露可被验证而非仅凭自说自话。
延伸学习
与本题相关的知识库文章、术语、工具与行业资讯。