扩散模型训练稳定,但默认 1000 步逆向采样使推理成本成为部署瓶颈;生物 design 任务还要求对二级结构、结合位点、对称性等条件精确控制。DDIM 提供跳步确定性采样;**分类器引导(Classifier Guidance)与无分类器引导(Classifier-free Guidance,CFG)**通过调节条件得分,在样本质量与条件服从度之间权衡——RFdiffusion 等蛋白质生成器 heavily 依赖 CFG 式条件化。
段末注释:CFG 在训练时随机丢弃条件,推理时用有条件与无条件得分差做外推;DDIM 为 Denoising Diffusion Implicit Models 的缩写。
前置阅读:5003.大模型-架构-Diffusion-2.得分匹配与随机微分方程、Diffusion-Math-0 概率与扩散数学基础
1. 采样加速的需求
设单次网络前向耗时 (c),步数 (T) 则生成一个蛋白质骨架约需 (T \cdot c)。若 (T=1000)、(c=50,\mathrm{ms}),单样本约 50 s——高通量 design 不可接受。目标:在 (T’ \ll T) 步内保持可接受的 designability / RMSD。
加速路线概览:
| 方法 | 思路 | 典型加速比 |
|---|---|---|
| DDIM | 非马尔可夫、确定性子序列 | 10–50× |
| 高阶 ODE 求解器 | 更大 (\Delta t)、更少步 | 5–20× |
| 蒸馏(Distillation) | 学生网络模仿多步教师 | 10–100× |
| 潜空间扩散 LDM | 低维 (z) 上扩散 | 2–4×(每步更轻) |
2. DDIM:非马尔可夫跳步采样
Song et al.(2020)构造一族非马尔可夫前向过程,使相同的 (q(x_t\mid x_0)) 边缘分布与 DDPM 一致,但逆向可确定性、且只在子序列 ({\tau_1,\ldots,\tau_S}) 上更新。
2.1 更新公式((\eta=0) 确定性)
设 (\hat\epsilon = \epsilon_\theta(x_t,t)),预测 (\hat x_0 = \frac{1}{\sqrt{\bar\alpha_t}}(x_t - \sqrt{1-\bar\alpha_t},\hat\epsilon))。从步 (t) 跳到更早步 (t’):
[
x_{t’} = \sqrt{\bar\alpha_{t’}},\hat x_0 + \sqrt{1-\bar\alpha_{t’} - \sigma_t^2},\hat\epsilon + \sigma_t z,
]
(\eta \in [0,1]) 控制随机性:(\eta=0) 时 (\sigma_t=0),完全确定性;(\eta=1) 退化为 DDPM 类随机采样。
关键:可在 (S=50) 个均匀(或余弦)选取的 (t) 上运行,而训练仍用完整 (T=1000) 的 (\epsilon_\theta)。
2.2 与概率流 ODE 的关系
(\eta=0) 的 DDIM 等价于对概率流 ODE(第 2 篇)的一种离散化:同一 (x_T) 总得到同一 (x_0),便于插值与编辑(inpainting 时在已知区域每步替换为 (q(x_t\mid x_0^{\mathrm{known}})) 的采样)。
概念锚点 · Inpainting 与条件分布:inpainting 每步将已知区域重置为 (q(x_t\mid x_0^{\mathrm{fixed}})) 的样本——即固定 (x_0) 条件下的前向加噪,与 Math-0 §4 的条件高斯一致。


3. Classifier Guidance(分类器引导)
Dhariwal & Nichol(2021)在类条件扩散 (\epsilon_\theta(x_t,t,c)) 上,用预训练分类器 (p_\phi(c\mid x_t)) 引导采样 toward 目标类 (c):
[
\hat\epsilon = \epsilon_\theta(x_t,t,c) - w,\sqrt{1-\bar\alpha_t},\nabla_{x_t}\log p_\phi(c\mid x_t),
]
(w>0) 为引导强度(guidance scale)。直觉:在去噪方向叠加「使分类器更确信为 (c)」的梯度——本质是在 (\epsilon) 空间做条件得分的外推(与 Math-0 §11 得分方向一致)。

生物场景:若存在预测「是否为 (\alpha)-螺旋丰富」的分类器,可引导生成高螺旋蛋白——但需可微、且在 noisy (x_t) 上训练稳定的分类器,工程成本高。
4. Classifier-free Guidance(CFG)
Ho & Salimans(2022):不单独训练分类器,训练时以概率 (p_{\mathrm{uncond}}) 将条件 (c) 置空(如全零嵌入、特殊 null token),学习同一网络 (\epsilon_\theta(x_t,t,c)) 同时建模条件与无条件分布。
推理时:
[
\hat\epsilon = \epsilon_\theta(x_t,t,\varnothing) + w,\big(\epsilon_\theta(x_t,t,c) - \epsilon_\theta(x_t,t,\varnothing)\big),
]
(w=1) 为标准条件生成;(w>1) 放大条件方向,提高条件服从度,但过大时多样性下降、样本可能「过拟合条件」或物理不合理。
4.1 在蛋白质 design 中的对应
RFdiffusion 将条件(二级结构、block adjacency、motif 约束等)编码为额外通道或嵌入,训练时使用 CFG dropout;推理时 (w \approx 1!-!10) 调节 scaffold 与 motif 的保真度。
| 条件类型 | 编码方式 | CFG 作用 |
|---|---|---|
| 二级结构 | 逐残基 SS 标签 | 控制 (\alpha/\beta) 比例 |
| Motif scaffolding | 固定坐标 inpainting | 保留活性位点几何 |
| 对称性 | 对称复制 + 群平均 | 寡聚体 design |
| 结合靶点 | 靶点结构 cross-attention | 结合剂 design |
5. 其他条件注入机制
除 CFG 外,条件信息进入 (\epsilon_\theta) 的常见方式:
(1)通道拼接(concatenation)
将条件图(SS、距离图、序列 profile)与 (x_t) 在通道维拼接——U-Net 常用。
(2)交叉注意力(cross-attention)
条件序列(靶点残基、文本描述)作为 Key/Value,noisy 结构作为 Query——Stable Diffusion、部分 Chroma 模块采用。
(3)AdaGN / FiLM
条件向量调制各层 GroupNorm 的 scale/shift:(\mathrm{GN}(h) \cdot (1+s(c)) + b(c))。
(4)Inpainting / 硬约束
每步将已知区域替换为 (x_t^{\mathrm{known}} \sim q(x_t\mid x_0^{\mathrm{fixed}})),未知区域继续去噪——motif scaffolding 的标准做法。
6. 步数与引导强度的调参
步数 (S)
- 过少:结构未收敛,RMSD 高、clash 多;
- 过多:收益递减,线性增加延迟。
- 经验:骨架扩散 50–200 步 + DDIM/Heun 是常见起点。
引导强度 (w)
- (w=1):标准条件;
- (w \in [2,10]):更强条件,motif 保真度↑,多样性↓;
- (w) 过大:模式崩溃、非物理结构。
建议在验证集上画 designability vs. (S)、motif RMSD vs. (w) 曲线,而非照搬图像生成的 (w=7.5)。
7. 蒸馏与其他加速(简述)
Progressive Distillation(Salimans & Ho):训练学生网络用 2 步模仿教师 4 步,迭代减半——最终 4–8 步生成。
Consistency Models(Song et al.):学习任意 (t) 到 (0) 的一步映射 (f(x_t,t))。
生物领域:蒸馏工作相对图像少,工业 design 仍以 DDIM + 中等步数 为主。
8. 生物信息学案例:条件生成工作流
以 motif scaffolding 为例:
- 固定活性位点残基坐标 (x_0^{\mathrm{motif}});
- 初始化全结构 (x_T)(motif 区域加噪至与周围一致,或 inpainting 掩码);
- 每步 DDIM:预测 (\hat\epsilon),应用 CFG(条件 = SS + motif 掩码);
- Inpainting:motif 位置重置为 (q(x_t\mid x_0^{\mathrm{motif}}));
- 输出 (x_0),用 ProteinMPNN 设计序列,AlphaFold2 验证 self-consistency。

9. 小结
DDIM 在保持 DDPM 训练不变的前提下,用确定性跳步将推理步数降一个数量级;CFG 用条件与无条件预测之差实现免分类器引导,成为 RFdiffusion 等工具的条件控制核心。部署生物扩散 pipeline 时,(S) 与 (w) 是与 学习率 同等重要的超参,应针对 designability 与 motif 保真 联合标定。
段末注释:inpainting 指仅生成部分区域、其余区域由已知数据约束;self-consistency 指设计序列经折叠模型预测结构与生成结构一致。
本篇数学概念索引
| 概念 | 出现章节 | 延伸阅读 |
|---|---|---|
| 条件分布 / inpainting | §2.2 | Math-0 §4 |
| 得分 / 梯度引导(CFG) | §3–§4 | Math-0 §11 |
参考与延伸阅读
- Song et al., Denoising Diffusion Implicit Models(DDIM).
- Dhariwal & Nichol, Diffusion Models Beat GANs on Image Synthesis(Classifier Guidance).
- Ho & Salimans, Classifier-Free Diffusion Guidance(CFG).
- Watson et al., De novo design of protein structure and function with RFdiffusion.
- Karras et al., Elucidating the Design Space of Diffusion-Based Generative Models(求解器与日程).