💡

文章摘要

2026 年 6 月,剑桥大学团队完成了全球首个 AI 设计的「超级抗原」人体试验,标志着 AI 从辅助工具正式成为疫苗研发的核心驱动力。本文系统梳理 AI 设计疫苗的完整技术链:从病毒基因组数据采集、计算生物学建模、表位预测算法、超级抗原合成与优化,到临床试验设计与免疫原性评估。同时深入解析计算生物学的学科框架、核心算法(蛋白质语言模型、分子动力学模拟、AI 驱动的药物-靶点对接),以及 AI 设计疫苗相比传统方法的效率优势与局限性。

前置阅读收获

读完本文,你将理解:

  • AI 设计疫苗与传统疫苗研发的本质区别——从「试错筛选」到「计算设计」的范式转移
  • 计算生物学的学科框架——它如何融合生物学、计算机科学和数学来解决生命科学问题
  • 剑桥大学超级抗原的技术原理——AI 如何分析冠状病毒基因组并设计出覆盖整个病毒家族的「超级抗原」
  • 表位预测的核心算法——蛋白质语言模型、结构预测和免疫信息学工具如何协同工作
  • AI 设计疫苗的效率优势——从传统 1-2 年缩短到数月的关键突破在哪里

2026 年 6 月,剑桥大学 Jonathan Heeney 教授团队报告,全球首个由 AI 完全设计的疫苗抗原已进入人体 Phase 1/2a 临床试验。这一里程碑的意义不仅在于技术突破,更在于它验证了一个新范式:AI 可以从海量生物数据中提取规律,设计出人类科学家凭经验无法构想出的分子结构。

本文内容综合自剑桥大学官方公告、BBC 报道、ScienceDaily、Engadget 科技报道、Nature Reviews Drug Discovery、Gavi 疫苗联盟专家访谈等权威来源,经交叉验证。

💡 一句话理解

如果你对 AI 在生物医药领域的应用感兴趣,建议先阅读本站的 biomed-001(AI 在生物医药与疫苗研发中的应用)和 ai4science-005(OpenAI Rosalind 生物防御计划),然后再阅读本文。这三篇文章形成了从宏观到微观的完整知识链。

⚠️ 常见踩坑

AI 设计疫苗仍处于早期临床验证阶段。目前尚无 AI 设计的疫苗获得 FDA 或 EMA 批准上市,从 Phase 1/2a 到获批通常仍需 3-5 年。本文描述的是技术原理和趋势,不构成医疗建议。

一、什么是 AI 设计疫苗?为什么它颠覆了传统范式

AI 设计疫苗是指利用人工智能算法(特别是深度学习、生成式 AI 和计算生物学工具),从病原体的基因组数据出发,计算设计出能引发有效免疫反应的抗原分子,而不是依赖传统的实验试错方法。

传统疫苗研发的核心瓶颈在于抗原设计。以新冠疫苗为例:科学家需要先分离病毒,然后在实验室中表达和纯化各种候选抗原,逐一测试它们的免疫原性——这个过程通常需要数月,且成功率很低。即使找到有效的抗原,它通常只针对特定的病毒毒株,面对快速变异的病毒(如流感、冠状病毒)时保护力会迅速下降。

AI 设计疫苗的革命性在于它从根本上改变了抗原发现的逻辑:

从实验筛选到计算预测。 传统方法需要在实验室中合成和测试数十甚至数百个候选分子。AI 可以在计算机上预测哪些分子最有可能引发有效的免疫反应,将候选范围缩小到少数几个最有希望的分子,大幅减少实验工作量。

从单一毒株到全家族覆盖。 传统疫苗通常针对一个特定的病毒毒株设计。AI 可以分析同一个病毒家族中所有已知成员的基因组序列,找出它们在进化上最保守的区域(即所有成员都共有的、不容易发生变异的区域),然后设计出能覆盖整个家族的「超级抗原」。这正是剑桥大学 2026 年人体试验的核心思路。

从经验驱动到数据驱动。 传统抗原设计依赖科学家的经验和直觉。AI 则从数百万条已知抗原-免疫反应的数据中学习,建立预测模型,找出人类经验可能忽略的规律。

剑桥大学 2026 年里程碑的具体技术路线:

  1. 数据收集:从全球病毒监测项目中收集各种 Sarbeco 冠状病毒(包括 SARS-CoV-2 及其变异株、SARS-CoV、相关蝙蝠冠状病毒)的基因组序列
  2. AI 设计:AI 分析这些序列,找出跨毒株保守的 T 细胞表位和 B 细胞表位,设计一个能引发广谱免疫反应的「超级抗原」
  3. 合成验证:在实验室中合成 AI 设计的抗原,验证其结构和稳定性
  4. 人体试验:2026 年初启动 Phase 1/2a 临床试验,39 名受试者参与,初步结果显示安全性良好且产生了 T 细胞反应

这一突破的深远意义在于:如果这种方法被证明有效,它将建立一种全新的疫苗研发范式——检测到新病原体 → AI 在数天内设计候选抗原 → 数周内合成并启动临床前试验 → 数月内进入临床试验。这将是应对未来大流行的关键能力。

图表加载中…

💡 一句话理解

理解 AI 设计疫苗的核心优势不在于「完全替代实验室工作」,而在于「大幅缩小实验搜索空间」。AI 不是替代科学家,而是让科学家把有限的实验资源集中在最有希望的候选分子上。

⚠️ 常见踩坑

AI 设计的抗原在计算机上的预测结果并不等同于人体中的真实效果。免疫系统远比任何计算模型复杂,AI 预测的有效性必须在人体试验中验证。目前所有 AI 设计的疫苗都还在早期临床阶段。

二、计算生物学:AI 设计疫苗的学科基础

计算生物学是 AI 设计疫苗的学科基础。它是一门交叉学科,融合了生物学、计算机科学、数学和统计学,核心目标是利用计算方法和算法来理解生物系统的运作机制。

计算生物学与生物信息学密切相关但有区别:生物信息学主要关注生物数据的存储、检索和分析(如基因组序列的比对和注释),而计算生物学更进一步——它用计算模型来模拟和预测生物系统的行为(如蛋白质折叠、分子相互作用、免疫反应动力学)。

计算生物学的核心研究层次:

序列分析。 这是最基础的层次,涉及 DNA、RNA 和蛋白质序列的比对、模式识别和功能注释。在疫苗设计中,序列分析用于识别病毒基因组中的保守区域——那些在所有已知变异株中都存在的、不太可能发生突变的区域。这些保守区域是设计广谱疫苗的理想靶点。

结构预测。 蛋白质的功能由其三维结构决定。AlphaFold 3 等工具可以根据氨基酸序列预测蛋白质的三维结构,精度达到原子级别(中位误差小于 1 Å)。在疫苗设计中,结构预测用于确定抗原的哪些区域暴露在分子表面、可以被免疫系统识别(即「表位」)。

分子动力学模拟。 蛋白质不是静态的——它们在体内不断运动和变形。分子动力学模拟可以预测蛋白质在不同条件下的构象变化,帮助科学家理解抗原-抗体结合的动态过程。这对于设计稳定的超级抗原至关重要。

系统生物学。 这是最宏观的层次,关注整个生物系统(如免疫系统)的行为。计算模型可以模拟抗原进入人体后引发的免疫级联反应——从抗原呈递细胞的激活,到 T 细胞和 B 细胞的增殖,到抗体的产生和记忆细胞的形成。

AI 在计算生物学中的核心算法:

蛋白质语言模型。 类似于自然语言处理中的 BERT 和 GPT,蛋白质语言模型将氨基酸序列视为「语言」,学习氨基酸之间的「语法规则」和「语义关系」。ESM(Evolutionary Scale Modeling)是 Meta 开发的代表性蛋白质语言模型,它可以从序列中预测蛋白质的结构、功能和稳定性。

生成式分子设计。 利用扩散模型变分自编码器,AI 可以生成全新的分子结构——这些分子在自然界中不存在,但具有期望的生物活性。RFdiffusion(华盛顿大学 David Baker 团队)是这一领域的开创性工作,它可以从头设计出具有特定形状和功能的蛋白质。

AI 驱动的药物-靶点对接。 预测小分子或蛋白质如何与靶点结合。DiffDock 等工具使用扩散模型来预测分子对接的构象,比传统的对接方法更快、更准确。

剑桥大学超级抗原设计正是这些技术的综合应用:首先用序列分析找出冠状病毒家族的保守区域,然后用蛋白质语言模型预测这些区域的表位特性,再用结构预测工具确认抗原的三维构象,最后用生成式设计优化抗原的免疫原性。

图表加载中…

💡 一句话理解

计算生物学是一个快速演进的领域。如果你对该领域感兴趣,建议关注以下几个方向:蛋白质语言模型(ESM-3 等)、RFdiffusion 等生成式蛋白质设计工具、以及 AI 驱动的分子动力学模拟。

⚠️ 常见踩坑

计算生物学的预测精度虽然在快速提升,但仍远未达到完美的水平。蛋白质语言模型对自然界中不存在的蛋白质(即 AI 从头设计的新分子)的预测准确性显著低于对已知蛋白质的预测。AI 设计的分子必须在实验室中充分验证。

实战:计算生物学工具链代码示例

本节提供计算生物学核心工具的代码示例,帮助读者理解 AI 设计疫苗的实际操作流程。

ESM 蛋白质语言模型可以用于表位预测。ESM 是 Meta 开发的蛋白质语言模型,可以从氨基酸序列中预测蛋白质的结构和功能特性。在疫苗设计中,ESM 可以用于预测哪些区域更可能成为 T 细胞表位。

RFdiffusion 是华盛顿大学 David Baker 团队开发的生成式蛋白质设计工具,可以从头设计出具有特定形状和功能的蛋白质。在超级抗原设计中,RFdiffusion 可以用于优化多个表位的空间排列和连接方式。

python
# ESM 蛋白质语言模型:表位预测示例
import torch
import esm

# 加载 ESM-2 模型(650M 参数版本)
model, alphabet = esm.pretrained.esm2_t33_650M_UR50D()
batch_converter = alphabet.get_batch_converter()

# 目标病毒蛋白序列(如 SARS-CoV-2 刺突蛋白片段)
protein_seq = "MFVFLVLLPLVSSQCVNLTTRTQLPPAYTNSFTRGVYYPDKVFRSSVLHSTQDL"
data = [("spike_protein", protein_seq)]
batch_labels, batch_strs, batch_tokens = batch_converter(data)

# 获取每层的表示
with torch.no_grad():
    results = model(batch_tokens, repr_layers=[33], return_contacts=True)
token_representations = results["representations"][33]

# 提取每个氨基酸的特征向量
sequence_representations = []
for i, (_, seq) in enumerate(data):
    sequence_representations.append(token_representations[i, 1:len(seq)+1])

# 基于特征向量预测表位
from sklearn.ensemble import RandomForestClassifier
X_train = load_epitope_dataset()
y_train = load_labels()
clf = RandomForestClassifier(n_estimators=100)
clf.fit(X_train, y_train)

# 预测新序列的表位
predictions = clf.predict(sequence_representations[0])
epitope_regions = find_contiguous_predictions(predictions, min_length=8)
print(f"预测到 {len(epitope_regions)} 个潜在表位区域")
for region in epitope_regions:
    print(f"  位置 {region['start']}-{region['end']}: 置信度 {region['confidence']:.3f}")
bash
# RFdiffusion 生成式蛋白质设计:超级抗原结构优化
# 从 https://github.com/baker-laboratory/rf_diffusion

# 运行 RFdiffusion,设计包含 3 个保守表位的超级抗原
python -m rf_diffusion.inference \\
  inference.num_designs=10 \\
  'contigmap.contigs=[A1-50/0-10/B1-40/0-10/C1-35]' \\
  inference.output_prefix=super_antigen_design

# 分析生成的结构
python analyze_designs.py \\
  --pdb-dir ./outputs/ \\
  --template template.pdb \\
  --score-threshold -50 \\
  --rmsd-threshold 3.0

💡 一句话理解

ESM 和 RFdiffusion 都是开源工具,可以直接在本地 GPU 上运行。建议先在小型数据集上测试,熟悉工具的输入输出格式后再用于实际的疫苗设计项目。

⚠️ 常见踩坑

计算设计的分子必须在实验室中充分验证。蛋白质折叠预测的准确性在 70-85% 之间,意味着仍有 15-30% 的设计可能无法在实验室中折叠成预期结构。

三、表位预测:AI 如何找到免疫系统的「靶心」

表位是抗原分子上被免疫系统识别的特定区域。它是疫苗设计的「靶心」——只有找到正确的表位,疫苗才能引发有效的免疫反应。

表位分为两大类:

B 细胞表位(B-cell Epitope):被 B 细胞产生的抗体识别。B 细胞表位通常是抗原表面的特定区域,抗体可以直接结合上去。B 细胞表位可以是线性的(连续的氨基酸序列)或构象的(由蛋白质折叠后在空间上靠近但序列上不连续的氨基酸组成)。构象表位占所有 B 细胞表位的 90% 以上,这使得它们的预测特别困难——因为需要知道蛋白质的三维结构才能确定。

T 细胞表位(T-cell Epitope):被 T 细胞受体识别。T 细胞表位是短的肽段(通常 8-15 个氨基酸),它们被抗原呈递细胞(APC)处理并呈递在细胞表面的 MHC 分子上。T 细胞表位的预测相对更直接,因为它们主要是线性序列,但不同人群携带的 MHC 等位基因不同,导致对同一表位的响应存在个体差异。

AI 在表位预测中的核心方法:

基于序列的预测。 利用机器学习模型分析已知的表位序列,学习哪些序列模式更可能成为表位。NetMHC 系列工具是 T 细胞表位预测的经典工具,最新版本 NetMHCpan-4.1 使用神经网络,可以预测任何 MHC 等位基因与任何肽段的结合亲和力。

基于结构的预测。 利用蛋白质的三维结构信息,预测哪些区域暴露在分子表面、具有合适的物理化学特性(如亲水性、柔性),可以被抗体识别。ElliPro 和 SEPPA 是代表性的构象 B 细胞表位预测工具。

深度学习的端到端预测。 最新的 AI 模型(如 MHCflurry 2.0、DeepHLApan)使用深度学习直接从序列预测表位,不需要依赖手工设计的特征。这些模型的准确率比传统方法高出 10-20%。

多模态融合预测。 结合序列、结构、进化保守性、免疫原性等多维度信息,进行综合表位预测。剑桥大学的超级抗原设计就采用了这种多模态方法——不仅预测表位的位置,还评估其跨毒株的保守性和免疫原性。

表位预测的关键挑战:

个体差异。 不同人携带不同的 MHC 等位基因,对同一表位的响应不同。一个好的疫苗需要包含能被大多数人群的 MHC 分子呈递的表位。AI 可以通过分析全球人群的 MHC 等位基因分布数据,优化表位选择,使其覆盖尽可能多的人群。

病毒变异。 RNA 病毒(如冠状病毒、流感病毒)的变异率很高,表位区域可能发生突变,导致疫苗失效。AI 通过分析大量病毒序列,可以识别出在进化上最保守的表位——这些表位即使在病毒变异后仍然保持不变,是设计广谱疫苗的理想靶点。

免疫优势性(Immunodominance)。 即使一个抗原包含多个表位,免疫系统通常只对其中少数几个(「免疫优势表位」)产生强烈响应。预测哪些表位会成为免疫优势表位是表位设计的关键挑战。

剑桥大学的突破性贡献在于:他们不仅预测了表位,还通过 AI 设计了一个「超级抗原」——将多个保守表位组合到一个分子中,使其能同时引发针对多个冠状病毒株的免疫反应。初步临床结果显示,该疫苗产生了覆盖 SARS-CoV-2、SARS 和相关蝙蝠病毒的 T 细胞反应。

💡 一句话理解

表位预测是 AI 疫苗设计中最核心也最困难的环节。如果你对计算免疫学感兴趣,建议从 NetMHCpan 和 MHCflurry 这两个工具开始实践——它们是表位预测领域最成熟、最广泛使用的工具,有详细的文档和教程。

⚠️ 常见踩坑

表位预测工具给出的结果是概率性的——它们预测某个区域有多大概率是表位,而不是确定性的判断。预测准确率通常在 70-85% 之间,这意味着仍有 15-30% 的假阳性或假阴性。实验室验证是不可或缺的步骤。

四、超级抗原设计:AI 如何创造「广谱免疫武器」

超级抗原是剑桥大学 AI 设计疫苗的核心概念。与传统的单一毒株抗原不同,超级抗原被设计为能引发针对整个病毒家族的免疫反应——不仅仅是当前的流行毒株,还包括未来可能出现的新变异株和潜在的动物传人病毒。

超级抗原的设计逻辑可以理解为「取最大公约数」:

第一步:病毒家族序列收集。 从全球病毒监测数据库(如 GISAID、NCBI Virus)中收集目标病毒家族(如 Sarbeco 冠状病毒)的所有已知成员的完整基因组序列。这包括 SARS-CoV-2 及其所有变异株、SARS-CoV、MERS-CoV,以及从蝙蝠、穿山甲等动物中检测到的相关冠状病毒。

第二步:多序列比对与保守性分析。 将所有序列进行多序列比对,找出在所有成员中高度保守的区域。保守性是指某个区域在进化过程中保持不变的程度——保守性越高的区域,越不可能发生变异,因此是设计广谱疫苗的理想靶点。

第三步:表位预测与筛选。 在保守区域中,用 AI 表位预测工具筛选出最有可能被免疫系统识别的表位。筛选标准包括:与多种 MHC 等位基因的结合亲和力(覆盖不同人群);B 细胞表位的表面暴露性和亲水性;T 细胞表位的免疫原性预测分数。

第四步:超级抗原分子设计。 将筛选出的多个表位组合到一个分子中。这不是简单的拼接——需要考虑表位之间的空间关系、连接肽的设计、分子的整体稳定性等因素。AI 的生成式设计工具(如 RFdiffusion)可以自动优化这些因素,设计出在结构和功能上都最优的超级抗原。

第五步:计算验证与优化。 用分子动力学模拟和免疫反应预测模型,在计算机上验证超级抗原的稳定性和免疫原性。如果发现问题(如某些表位被遮蔽、分子构象不稳定),AI 会自动调整设计并重新验证,直到达到满意的计算指标。

第六步:实验室合成与验证。 将 AI 设计的超级抗原序列送到实验室进行化学合成和表达,验证其实际的结构、稳定性和免疫原性。只有在实验室验证通过后,才能进入临床试验。

超级抗原的广谱性来自两个关键设计原则:

保守表位优先。 超级抗原主要包含在病毒家族中高度保守的表位。这些表位在进化压力下不太容易发生变异(因为它们对病毒的生存至关重要),因此即使病毒发生变异,超级抗原诱导的免疫反应仍然有效。

T 细胞表位为主。 相比 B 细胞表位(抗体识别),T 细胞表位通常更保守。这是因为 T 细胞表位来自病毒的内部蛋白,而内部蛋白的变异率通常低于表面蛋白(如冠状病毒的刺突蛋白)。以 T 细胞表位为主的超级抗原能提供更持久的广谱保护。

初步临床结果(2026 年 6 月报告):39 名受试者的 Phase 1/2a 试验显示,超级抗原疫苗安全且耐受性良好(无严重不良事件),所有受试者均产生了 T 细胞反应,且免疫反应覆盖了 SARS-CoV-2、SARS 和相关蝙蝠病毒。这是人类历史上第一次验证 AI 设计的抗原在人体中产生预期的广谱免疫反应。

图表加载中…

💡 一句话理解

超级抗原的概念可以推广到所有快速变异的病毒家族——不仅是冠状病毒,还包括流感病毒、HIV、登革热病毒等。每个病毒家族都有保守的内部蛋白和 T 细胞表位,这些都可以成为超级抗原的靶点。

⚠️ 常见踩坑

超级抗原的设计有一个潜在风险:如果表位选择不当,可能引发非特异性的 T 细胞过度激活(类似细菌超级抗原引起的中毒性休克综合征)。剑桥大学的设计通过使用精确预测的病毒特异性表位(而非多克隆激活剂)规避了这一风险,这是其安全性的关键保障。

五、AI 设计疫苗的效率优势:数据与对比

AI 设计疫苗相比传统方法的效率优势可以用数据来量化。以下从四个关键维度进行对比。

研发周期。 传统疫苗从病原体发现到进入临床试验通常需要 12-24 个月。AI 设计疫苗将抗原设计阶段从数月压缩到数天到数周,整体周期可以缩短到 6-12 个月。在最理想的情况下(mRNA 平台 + AI 设计),从检测到新病原体到启动临床试验可能只需要 3-4 个月。

候选分子数量。 传统方法需要在实验室中筛选数十到数百个候选分子。AI 设计将候选范围缩小到 5-10 个最有希望的分子,实验验证的工作量减少 90% 以上。

广谱性。 传统疫苗通常针对单一毒株,面对新变异时保护力下降明显(如新冠疫苗对 Omicron 变体的保护力下降 10-40 倍)。AI 设计的超级抗原通过覆盖全病毒家族的保守表位,可以提供跨毒株的广谱保护,即使在病毒变异后仍然有效。

成本。 传统疫苗研发的总成本约 5-10 亿美元(包括失败候选分子的投入)。AI 设计通过减少实验筛选的候选分子数量,可以将研发成本降低 40-60%。

效率提升的根本原因:传统疫苗研发的核心瓶颈是「试错」——在实验室中合成和测试大量候选分子,直到找到有效的。AI 的作用是用计算模型替代大部分的试错过程,只在最有希望的候选分子上进行实验验证。这种「计算筛选 + 实验验证」的组合模式是效率提升的关键。

但 AI 设计疫苗也有其局限性:

计算模型的训练数据偏差。 AI 模型的预测能力取决于训练数据的质量和覆盖范围。对于缺乏实验数据的病原体(如新出现的动物传人病毒),AI 的预测可能不够准确。

免疫系统的复杂性。 免疫系统是一个极其复杂的网络,涉及先天免疫、适应性免疫、细胞免疫、体液免疫等多个层次。当前的 AI 模型主要关注抗原-抗体和抗原-T 细胞受体的直接相互作用,对更宏观的免疫网络动力学建模能力有限。

个体差异。 不同人群的遗传背景、年龄、健康状况、既往感染史都会影响对疫苗的免疫响应。AI 设计的疫苗通常基于「平均响应」优化,可能在某些亚群中效果不佳。

监管障碍。 目前各国监管机构(FDA、EMA、NMPA)对 AI 设计疫苗的审批框架仍在发展中。AI 设计的分子在审批过程中可能需要提供额外的计算模型验证数据,增加了审批的复杂性和不确定性。

💡 一句话理解

在评估 AI 设计疫苗的效率优势时,要区分「抗原设计」和「完整疫苗研发」。AI 可以大幅缩短抗原设计阶段,但临床试验和审批环节的时间压缩有限(主要受监管要求限制)。因此,AI 设计疫苗的总周期缩短主要是设计阶段的贡献,而不是整个研发链条的压缩。

⚠️ 常见踩坑

效率提升的数据主要来自计算模拟和早期临床前研究。在 Phase 3 临床试验中,AI 设计疫苗是否真的比传统方法更快获批、更有效,还需要更多的临床数据来验证。目前尚无 AI 设计的疫苗获得监管机构批准。

六、AI 设计疫苗的技术挑战与解决方案

尽管 AI 设计疫苗展现出巨大潜力,但在从实验室走向临床的过程中仍面临多个技术挑战。

挑战一:蛋白质结构预测的精度限制。 虽然 AlphaFold 3 等工具在已知蛋白质的结构预测上达到了原子级精度,但对于 AI 从头设计的「自然界中不存在」的新蛋白质,预测精度显著下降。这是因为训练数据主要来自天然蛋白质,模型对非天然序列的泛化能力有限。

解决方案: 结合多种结构预测方法(如 AlphaFold 3 + RoseTTAFold + 分子动力学模拟),通过「交叉验证」提高预测的可靠性。同时,在 AI 设计阶段加入「可折叠性」(foldability)约束,确保设计的分子更可能被准确预测。

挑战二:免疫原性预测的准确性。 当前的 AI 模型可以预测表位与 MHC 分子的结合亲和力,但结合亲和力只是免疫原性的一个方面。实际的免疫响应还受到抗原加工效率、T 细胞受体库的多样性、共刺激信号等多种因素影响,这些目前无法准确预测。

解决方案: 在表位预测中加入更多维度的特征,如抗原加工效率(蛋白酶体切割位点预测)、T 细胞受体接触面分析、以及基于人群 MHC 分布的覆盖率优化。同时,用更多的实验数据(特别是人体免疫组库数据)训练 AI 模型,提高其预测真实免疫响应的能力。

挑战三:超级抗原的稳定性。 将多个表位组合到一个分子中可能影响分子的折叠和稳定性。不稳定的抗原在体内可能降解过快,无法引发有效的免疫反应。

解决方案: 在 AI 设计阶段使用分子动力学模拟评估超级抗原的热力学稳定性,并优化连接肽(linker)的设计——选择合适的长度和柔性,使各个表位之间保持适当的空间距离,互不干扰。

挑战四:大规模生产的可行性。 AI 设计的分子可能在实验室规模下可以合成,但在工业化大规模生产时可能遇到表达量低、纯化困难、批次间一致性差等问题。

解决方案: 在 AI 设计阶段加入「可生产性」(manufacturability)约束,如密码子优化、避免稀有密码子、减少容易聚集的疏水区域等。同时与疫苗生产企业合作,在设计的早期阶段就考虑工业化生产的需求。

💡 一句话理解

如果你在研究 AI 设计疫苗,建议重点关注可生产性约束的集成——这是很多学术研究的盲点。一个在计算上完美的分子如果无法大规模生产,就没有实际价值。与工业界的早期合作可以避免「好设计但造不出来」的陷阱。

⚠️ 常见踩坑

AI 设计疫苗的监管审批路径目前尚不明确。FDA 和 EMA 都在探索如何评估 AI 设计的分子——特别是如何验证计算模型的可靠性和预测的准确性。在推进 AI 设计疫苗项目时,建议尽早与监管机构沟通,了解最新的审批要求和标准。

七、未来展望:AI 设计疫苗的下一阶段

AI 设计疫苗的未来 3-5 年发展方向:

方向一:从冠状病毒到全病毒家族。 剑桥大学的超级抗原目前聚焦于 Sarbeco 冠状病毒。下一步是将同样的技术路线扩展到其他快速变异的病毒家族——流感病毒、HIV、登革热病毒、寨卡病毒等。每个病毒家族都有其保守的内部蛋白和 T 细胞表位,可以成为超级抗原的靶点。

方向二:个性化癌症疫苗。 Evaxion Biotech 的 EVX-02 和 EVX-03 正在探索 AI 设计的个性化癌症疫苗——根据每个患者的肿瘤突变谱,用 AI 设计针对其肿瘤特异性新抗原(neoantigen)的疫苗。这代表了 AI 疫苗设计的另一个极端:从广谱(覆盖所有变异)到精准(针对单个患者)。

方向三:AI 驱动的「即时疫苗」平台。 结合 AI 设计和 mRNA 平台,建立一个「检测到新病原体 → AI 设计抗原 → mRNA 合成 → 临床试验」的自动化流程。这种平台可以在新病原体出现后的数月内提供候选疫苗,是应对未来大流行的关键能力。

方向四:多病原体联合疫苗。 AI 可以设计同时针对多种病原体的联合疫苗——例如一种疫苗同时预防流感、冠状病毒和呼吸道合胞病毒(RSV)。这需要 AI 同时优化多个抗原的免疫原性和相互兼容性。

方向五:AI 与自动化实验室的结合。 Emerald Cloud Lab 等公司正在建设全自动化的远程实验室——科学家在计算机上设计实验,机器人自动执行。AI 设计疫苗可以与自动化实验室结合,实现「AI 设计 → 机器人合成 → AI 分析结果 → AI 优化设计」的闭环,大幅加速疫苗研发。

方向六:联邦学习与全球协作。 PATH 组织推动的 AI 疫苗研发协作框架代表了未来方向——跨国、跨机构的 AI 平台通过联邦学习共享数据和模型,同时保护数据隐私。这种协作模式可以整合全球的数据和计算资源,加速疫苗研发。

扩展阅读推荐:

  • 剑桥大学官方公告:cam.ac.uk
  • AlphaFold 数据库:alphafold.ebi.ac.uk
  • RFdiffusion:github.com/baker-laboratory/rfdiffusion
  • NetMHCpan:cbs.dtu.dk/services/NetMHCpan
  • PATH 组织 AI 疫苗报告:path.org
  • Evaxion Biotech:evaxion-biotech.com
  • Emerald Cloud Lab:emeraldcloudlab.com
图表加载中…

💡 一句话理解

关注 2026-2027 年 EVX-02 和 EVX-03 的临床试验数据读出,以及剑桥大学超级抗原的后续 Phase 2 试验结果。这些将提供 AI 设计疫苗在人体中的有效性的第一批确凿证据。

⚠️ 常见踩坑

从 Phase 1/2a 到获批上市的转化率通常低于 15%。即使 AI 设计的疫苗在早期试验中显示良好结果,仍需在更大规模的 Phase 3 试验中验证其有效性和安全性。保持审慎乐观,避免过度炒作。