抗体-02.可变区结构

抗体-01.认识抗体结构 中,我们已将 Fab 拆成 VH–CH1VL–CL,并点出 互补决定区(Complementarity-determining region,CDR) 是抗原识别的核心。本文把镜头推进到 可变区(variable region) 本身:先讲 免疫球蛋白折叠(immunoglobulin fold) 的域级拓扑,再分别解剖 重链可变域(Variable region of heavy chain,VH)轻链可变域(Variable region of light chain,VL),最后对照二者在 序列分区、环长分布、配对几何与基因来源 上的差异。配图均为 域球 + β 链 + 环区曲线 的科普示意,拓扑依据 Chothia–Lesk 与常见 Fab 高分辨率结构(如 PDB 1HZH),便于对照三维模型阅读。

段末注释可变区 指每条链 N 端、序列高度可变的 Ig 折叠域;恒定区 在 C 端、序列相对保守;Fv(Fragment variable) = VH + VL,不含 CH1/CL。

读前说明

  • 氨基酸编号若无特别说明,边界讨论以 IMGT(ImMunoGeneTics) 为主,并与 KabatChothia 对照;读 PDB 时以结构文件残基序号为准。
  • 本文聚焦 天然四链抗体的 VH/VL单域抗体(如 VHH) 仅保留 VH 同源折叠,轻链相关段落可略读。

1. 可变区在 Fab 中的位置

每条 轻链 的 N 端是 VL,C 端接 CL;每条 重链 的 N 端是 VH,经 CH1 与轻链 CL 配对后,再经铰链进入 Fc。抗原结合位点(paratope,互补位)完全由 VH 与 VL 配对的 Fv 塑造——CH1–CL 稳定 Fab 下半部,但不直接参与表位识别。

从分子量看,单个可变域约 12–13 kDa,由 约 105–120 个氨基酸 构成;Fv 二聚约 25 kDa。与 恒定域 相比,可变域共享同一类 β 三明治(β-sandwich) 折叠,但表面伸出 六条高变环(重链 H1–H3、轻链 L1–L3)。


2. 免疫球蛋白折叠:可变域的「刚性骨架」

2.1 β 折叠片与疏水核心

每个 VH 或 VL 域呈 两层反平行 β 折叠片疏水核心 的经典 免疫球蛋白折叠。按 Chothia 命名,片 A 常含 A、B、E、D 链,片 BC、C′、C″、F、G 链;两片刻面相对,中间堆叠疏水侧链。骨架区(Framework region,FR) 的氨基酸主要落在这套 β 链与转角上,维持折叠与 VH–VL 配对几何。

域内通常有一对 保守半胱氨酸 形成 二硫键,是识别 Ig 折叠域的标志之一(具体位点依 IMGT 编号,VH/VL 均保守)。

图 1 免疫球蛋白折叠:双层 β 片与 CDR 环出口(Chothia 链命名示意)

段末注释β-sandwich 即两层 β 片像三明治一样夹住疏水核心;FR 为 CDR 之间的相对保守序列,占可变区序列约 50% 以上。

2.2 从折叠到功能的分工

分区 结构角色 序列特征
FR1–FR4 维持 β 桶、界面堆积、规范环构象 相对保守,人源化时常「回复突变」
CDR1–CDR3 伸向互补位,直接接触抗原 高变,由体细胞突变与 V(D)J 重组塑造

关键直觉:抗原识别不是整个域「乱晃」,而是 刚性 FR 骨架柔性/高变 CDR 环 的组合优化;晶体学中 CDR 环的 B 因子(温度因子) 常高于 FR,提示局部柔性。


3. FR 与 CDR 的线性地图

3.1 四分法:FR1–CDR1–FR2–…–FR4

沿 N 端 → C 端,可变区可切成 4 段 FR3 段 CDR 交替排列:

1
N — FR1 — CDR1 — FR2 — CDR2 — FR3 — CDR3 — FR4 — C(接恒定域)

VHVL 采用 同一套分区逻辑,但各段 长度与保守性不同。下图以 IMGT 边界为参考给出相对宽度示意(具体起止残基依编号方案而变)。

图 2 VH 与 VL 线性分区:FR / CDR 排列与长度差异

3.2 三种常用编号与 CDR 边界

编号体系 特点 典型用途
Kabat 按序列变异性定义 CDR,历史最久 文献与数据库比对
Chothia 部分环(尤其 L1、H1)按结构叠合修正边界 结构建模、环构象分类
IMGT 统一免疫遗传学编号,gap 规则明确 序列数据库、克隆注释

实践建议:写方法学或做 CDR 移植时 必须注明方案;同一抗体在不同方案下 CDR 起止可能差 1–3 个残基,直接影响 人源化亲和力成熟 的突变设计。

段末注释CDR 移植 指将鼠源 CDR 序列嫁接到人源 FR 骨架;回复突变 在 FR 上少量回复鼠源残基以恢复亲和力或表达。

3.3 V(D)J 基因片段:可变区序列从何而来

可变区 的氨基酸序列并非由单一基因直接编码,而是在 B 细胞发育早期,由胚系 DNA 上的 基因片段(gene segment)V(D)J 重组(V(D)J recombination) 剪切拼接而成。该过程由 重组激活基因(Recombination-activating gene,RAG) 蛋白复合体(RAG1/RAG2)识别 重组信号序列(Recombination signal sequence,RSS) 并催化 位点特异性 DNA 断裂与重新连接 完成。理解「哪段胚系 DNA 对应哪段 FR/CDR」,是把 免疫遗传学§2–§3 的结构分区 对齐的关键。

段末注释RAG 仅在淋巴发育早期表达;RSS 为片段旁侧的七聚体–间隔–九聚体信号,决定重排位点。

胚系基因座(人类,示意)

胚系座(染色体位置示意) 片段类型 重排模式
重链 IGH(14q32) V~H(数十个)、D~H(十余个)、J~H(数个) D–J 先连,再 V–DJ
轻链 κ IGK(2p11) V~κJ~κ V–J
轻链 λ IGL(22q11) V~λJ~λ V–J

重排完成后,可变区外显子与 恒定区(C) 基因相连转录。Ig 类别(isotype) 由重链 C 区Cμ、Cγ 等)决定;类别转换重组(class switch recombination,CSR) 发生在 V(D)J 之后,替换 Cγ/Cα 等,不改变 已形成的 VH 序列。

段末注释CSR 改变效应功能(如 IgM → IgG),保留同一 VH/VL 抗原特异性。

重链 VH:V、D、J 各贡献什么?

  1. V~H 基因:编码 FR1、CDR-H1、FR2、CDR-H2FR3 的 5′ 部分——CDR-H1/H2 的序列主要来自所选 V 片段
  2. D 基因Diversity gene segment,D 片段):仅存在于重链;其读框经重组插入后,构成 CDR-H3 的中央段,是 H3 长度与序列 多样性的核心来源之一。
  3. J~H 基因:编码 FR3 3′ 端、完整 CDR-H3 的 C 端部分与 FR4

因此 CDR-H3 的氨基酸几乎 全部位于 V–D–J 连接区(junction)V 的 3′ 末端 + D 片段(重链特有)+ J 的 5′ 末端,再经 末端核苷酸修剪(junctional trimming)P 核苷酸 / N 核苷酸添加(P-/N-nucleotide addition) 进一步随机化——这也是 H3 在结构库中 长度 3–25+ aa、构象最难预测 的遗传学根源。

轻链 VL:V–J 两段,无 D

轻链 没有 D 基因Vκ/JκVλ/Jλ 直接重组:

  • CDR-L1、CDR-L2:主要来自 V 片段(与重链类似)。
  • CDR-L3:完全由 V 3′ 端与 J 5′ 端 的连接区形成,经同样类型的 修剪与 N/P 添加 多样化,但 无 D 插入,故 L3 长度与变异度通常小于 H3

同一抗体分子 两条轻链均为 κ 或均为 λκ/λ 比例胚系 V 基因库大小 有关,但不改变 VL 折叠拓扑(见 §6.3)。

连接区多样性:结构后果一览

机制 发生位置 主要影响
V/D/J 组合 胚系片段选择 库容:V×D×J(重链)或 V×J(轻链)
连接区修剪 各片段末端 CDR3 长度缩短、读框改变
P-/N-核苷酸添加 连接处 非模板编码核苷酸,进一步随机化
体细胞超突变(SHM) 生发中心,V 区 亲和力成熟;可波及 FR 与 CDR

SHM 发生在 V(D)J 完成之后生发中心(germinal center) 阶段,由 激活诱导的胞苷脱氨酶(AID) 等介导,不属于胚系重排本身,但会 改写 已形成的 CDR/FR 序列——读 亲和力成熟 文献时需与 初始 V(D)J 产物 区分。

图 6 V(D)J 基因片段与可变区 FR/CDR 的对应关系

段末注释AID 亦参与 CSR;SHM 靶标为 V 区高变区附近 DNA。


4. VH–VL 配对:Fv 的二聚几何

4.1 相对取向与抗原裂隙

结晶学与溶液研究表明,VH 与 VL 通过 FR 界面 非共价配对,两域纵轴约呈 50° 相对旋转(不同 Fab 略有波动)。配对后在「上方」形成 抗原结合裂隙:六条 CDR 环伸向裂隙,包裹 表位(epitope)

界面由 疏水堆积(如 VH Trp、VL Met/Tyr 等保守位点)、盐桥氢键 稳定;FR3、FR4 均参与接触。完整 Fab 中,VH–VL 界面与 CH1–CL 界面 空间相邻,共同抵抗变性。

图 3 VH–VL 二聚界面:相对取向、配对裂隙与保守堆积

4.2 Fv 与 Fab 的边界

  • Fv:仅 VH + VL,是 最小完整抗原结合单元(仍 单价)。
  • Fab:Fv + CH1 + CL,蛋白水解(如 木瓜蛋白酶)或重组表达常用 Fab 作为检测与治疗片段。

工程上常把 (VH–VL)柔性 linker 连成 单链 Fv(scFv);折叠与配对几何仍服从 VH–VL 界面规则,但 linker 长度 影响 顺式/反式 异构与稳定性。


5. 六条 CDR 环:空间排布与规范结构

5.1 环的位置与长度量级

Fv 顶部俯视,H1/L1 分列界面两侧上方,H2/L2 更靠近域体中部,H3/L3 从界面底缘伸向抗原。CDR-H3 长度与构象空间 远大于 其余五条环,常贡献 paratope 接触面积的一半以上CDR-L2 通常 最短(约 7 aa 量级),构象相对固定。

图 4 六条 CDR 环的空间排布与典型长度对比

5.2 规范结构(canonical structure)

H3 外,多数 CDR 环的骨架构象可归类为有限的 规范结构类(canonical structure class),由 FR 长度关键残基(如 Vernier zone 位点)决定。Chothia 等据此预测环主链走向;H3 则因 V–D–J 插入长度高度可变,成为 结构预测计算设计 的难点。

CDR 典型长度(aa,Kabat 统计量级) 构象可预测性
L1 10–17 中–高(κ/λ 有差)
L2 ~7
L3 8–11 中–高
H1 5–7 中–高
H2 16–19
H3 3–25+

段末注释Vernier zone 指 FR 中影响 CDR 构象的「校正」残基;规范类编号见 Chothia 等原始文献与 AbysisIMGT 工具。


6. VH 与 VL 的结构差异(重点对照)

二者 共享 Ig 折叠,差异主要体现在 基因组装来源、环长分布、界面细节与下游恒定域

图 5 VH 与 VL 结构差异对照(侧视示意 + 速查表)

6.1 基因与多样性来源

胚系片段如何拼成 FR/CDR,见 §3.3图 6;下表概括 VH vs VL 在遗传层面的对照:

项目 VH VL
胚系座 IGH:VH + D + JH IGK(κ)或 IGL(λ):V + J
重排模式 D–JV–DJ(无 D 轻链) V–J 直接连接
CDR1/2 来源 主要 V~H 主要 V~κV~λ
CDR3 来源 V + D + J 连接区 V + J 连接区(无 D)
多样性主因 D 片段 + 连接区修剪/N 添加 + SHM V/J 组合 + 连接区修剪/N 添加 + SHM
恒定域衔接 CH1(类别由 C~H 经 CSR 决定)

H3D 区插入连接区随机化,成为 互补位深度与形状 的首要塑造者;轻链 L3 虽也位于 V–J 连接处,但 无 D 参与,长度与构象空间通常小于 H3L1κ 型中可较长,且 κ/λCDR-L1 边界 在 Kabat 与 Chothia 中处理不同——这部分是 V 基因库差异 的结构体现,而非 D 片段所致。

6.2 结构尺度与界面

  • VH 略大于 VL(域高约 55 Å vs 50 Å 量级,依结构而变)。
  • VH 界面 凹槽更深Trp(Kabat H47 附近,IMGT 位点依序列而定)高度保守,与 VL 疏水侧链形成 「旋钮–孔」式堆积
  • VLL2 环短而保守,使轻链侧互补位 表面相对更平;与 H3 的突出形成 不对称的 paratope

6.3 κ 与 λ 轻链(结构视角)

同一抗体分子 两条轻链型别一致κλVL 折叠同源,差异主要在 L1 长度分布、部分 FR 残基与 CL 结构;与 VH 配对的界面模式 高度相似,因此 Fv 晶体学 中常不区分 κ/λ,但在 序列比对与人源化 时需标明轻链型别。

6.4 与恒定域的衔接

FR4 C 端后,VH 进入 CH1,VL 进入 CL;两段恒定域亦为 Ig 折叠,但 无 CDR 式高变环CH1–CL 界面与 VH–VL 界面 协同稳定 Fab;读 PDB 时可见 VL C 端VH CH1 空间上包裹 Fv 一侧。


7. 从结构到实验:读 PDB 与建模提示

  1. 选代表结构:人源 Fab 如 1HZH、抗原复合物如 7DK2(编号随需要检索更新),优先 X 射线 高分辨率条目。
  2. 先分链:重链 H、轻链 L;仅 Fv 时有时工程为 VH/VL 或单链。
  3. 标 CDR:用 IMGTAbysis 自动标注,与文章图示对照。
  4. 看环H3 电子密度是否完整;缺失常提示 柔性多构象
  5. 看界面:VH–VL 堆积是否因 晶体接触 扭曲;对比 apoholo(抗原结合)结构中 CDR 的 诱导契合(induced fit)

8. 小结

概念 一句话
Ig 折叠 双层 β 片 + 疏水核心,FR 维持骨架
CDR 六条环塑造 paratope;H3 多样性最大
VH–VL ~50° 相对旋转,界面疏水堆积保守
VH vs VL 同源折叠;VH 来自 V–D–J,环长与界面凹槽不同
V(D)J 胚系 V/D/J(或 V/J)重排;CDR3 在连接区形成
编号方案 Kabat / Chothia / IMGT 影响 CDR 边界与工程

参考与延伸阅读

  • Chothia、Lesk 等:免疫球蛋白可变区 β 折叠规范环 经典综述。
  • IMGT 数据库:序列编号、胚系 V/D/J 注释与 CDR 定义。
  • 上文 抗体-01.认识抗体结构:Fab/Fc、铰链与酶切。
  • 免疫学教材:V(D)J 重组CSRSHM 章节(如 Abbas 等《细胞与分子免疫学》)。
  • 后续可接:亲和力成熟 的突变扫描、人源化 策略、scFv/双特异性 的几何约束。

若你关心 CDR-H3 预测算法κ/λ 人源化模板选择与纳米抗体(VHH)折叠对比,可从本文 §5–§6 的环区与 VH/VL 差异两条线深入。

-------------本文结束感谢您的阅读-------------