文件格式说明 - MOL2(Tripos SYBYL)

MOL2(扩展名常用 .mol2)出自 Tripos SYBYL 体系,用分段关键字组织小分子数据:除坐标与键以外,常含 sybyl 原子类型部分电荷、残基/子结构标签等,利于 分子对接 前处理与 分子动力学(molecular dynamics,MD) 力场赋值。与纯 Molfile(见 fileformat-molfile.md)列定义不一一对应;与批量带表性质的 SDFfileformat-sdf.md)相比,MOL2 更强调单分子细分字段与力场语义。

段末注释:MD 指基于牛顿力学的原子轨迹模拟;对接与 MD 前处理常需一致的原子类型与电荷约定。

插图约定:示意图见 ./fileformat-mol2/文件名.png


1. 主要分段(概念)

分段关键字 典型内容
@MOLECULE 分子名、原子数、键数、子结构数等
@ATOM 原子 ID、(x,y,z)、sybyl 类型、亚结构名、电荷等
@BOND 键端点 ID、键类型编码
@SUBSTRUCTURE (可选)子结构或残基分组,蛋白–配体复合物拆分时便于标记

MOL2:@MOLECULE / @ATOM / @BOND 分段直觉(科普示意,非官方原图)


2. 科学意义(酶改造/对接)

  • 原子类型与电荷AMBERGAFF 等力场对接脚本输入强相关;同一配体从 Molfile 导入后再赋类型,有时会与软件原生 MOL2 导出存在细微差别。
  • 不同程序写入的 MOL2 列顺序或可选列可能略有差异,应以使用软件文档为准,解析时优先用 Open BabelRDKit(若支持)等库而非手写分列。

3. 何时选用 MOL2

场景 建议
只需拓扑 + 坐标、最大化兼容 MolfileSDF
高通量 + 活性字段 SDF
对接/MD 管线明确要求 sybyl 列或惯用 MOL2 MOL2

4. 小结 Checklist

  1. MOL2 非 Molfile 的超集简单映射,勿盲拷列到 PDB。
  2. 酶–蛋白整体坐标仍以 PDB/mmCIF 存档;配体可单独 MOL2 复现对接。
  3. fileformat-molfile.mdfileformat-sdf.md 搭配阅读,按流水线选格式。

参考与延伸阅读

  • Tripos / SYBYL 及所用工具(Open BabelMOE 等)用户手册中的 MOL2 列定义
  • Open Babel(含 MOL2 互转)
  • RDKit(部分版本/扩展对 MOL2 支持,以实现为准)
-------------本文结束感谢您的阅读-------------