MP-Ref 属于 MFEprimer 系列在网页端的产品形态之一:面向基于参考基因组的多重 PCR 初代引物布局,在 Graph-Expanding 框架下于扩增设计步骤中纳入特异性、交叉二聚体等约束,并预载大量参考基因组,服务目标富集、STR 旁侧引物、毛细管电泳多重重等管线。MFEprimer-3.0 论文描述的是通用 PCR 引物质控(QC) 内核;MP-Ref 在其上强调面板级兼容与预置基因组场景。
文献与官方资源
| 类型 | 说明 |
|---|---|
| MFEprimer-3.0 论文 | Wang K, Li H, Xu Y, et al. MFEprimer-3.0: quality control for PCR primers. Nucleic Acids Res. 47(Web Server issue):W105–W113 (2019). DOI 10.1093/nar/gkz351 · PMC6602485 |
| 主站 | https://www.mfeprimer.com/ |
| v3.0 说明 | https://www.mfeprimer.com/old-versions/mfeprimer-3.0/ |
| 源码 | quwubin/MFEprimer-3.0 |
| MulD(NGS 靶标富集示例) | https://mfeprimer3.igenetech.com/muld |
| 经典多重设计 | 本站 引物设计-03.软件-MPprimer.md |
应用场景
- 多重 PCR / 面板设计:在参考序列已知的条件下,需要批量候选引物经 QC 后入池,并控制交叉二聚体与非特异扩增。
- 自动化流水线:CLI 输出 JSON,嵌入「Primer3 → MFEprimer-3.0 → 决策/重设计」循环。
- MP-Ref 网页:强调预载参考基因组与 Graph-Expanding,适合不想自建全库索引的用户(具体功能以官网当前版本为准)。
- 不适合:期望单工具从零生成所有候选且无外部设计步骤(MFEprimer 核心是 QC,不是 Primer3 替代品)。
使用帮助
部署形态
| 方式 | 说明 |
|---|---|
| 在线(MFEprimer / MP-Ref) | 浏览器提交引物序列;默认人类 GRCh37/hg19 等以页面说明为准;有条目数/速率限制。 |
| 命令行 | MFEprimer-3.0 本地安装,可换自建基因组库,适合批量与自动化。 |
| MP-Ref | 以网页服务为主;与早期可下载的 v1–v3 形态可能不同,以官方说明为准。 |
输入与输出
- 输入(QC 核心)
- 候选 引物序列(FASTA 或每行一条);
- 模板/数据库:在线默认人类等;CLI 可指定路径与错配策略;
- 可选:结合位点 SNP 等(论文功能列表)。
- 输出
- Query 注释、Hairpin、Self/Cross dimer、潜在扩增子列表与详情;
- JSON 分区结构便于程序解析(论文与 GitHub)。
资源与环境
- 算力:大基因组 k-mer 索引 + 错配扩展检索,库越大时间与内存越高;建议 SSD、充足 RAM。
- 版本:参考基因组 版本号(hg19/hg38 等)直接影响特异性结论,需在项目中固定并记录。
功能与算法原理(MFEprimer-3.0)
在设计流水线中的角色
典型流程:Primer3 等生成候选 → MFEprimer-3.0 QC(扩增子、发夹/二聚体、3′ 稳定性、可选 SNP)→ 决策模块(DMM) 接受或拒绝 → 多重场景加 交叉二聚体 与 非特异扩增 约束,常迭代扩充合格池。
1. 特异性:k-mer 结合位点检索
- 建库:基因组按 k-mer(示例 k=9)索引。
- 查询:对引物 3′ 端 k-mer 生成「允许 1 个错配」的变体集合,将模糊匹配转为多次精确匹配;3′ 最后一碱基不允许错配,降低可延伸的假阳性结合。
记引物 3′ 端 k-mer 为 (q = b_1 b_2 \ldots b_k)((b_k) 为延伸端,不允许替换)。在至多 1 个错配且错配只能出现在 (b_1,\ldots,b_{k-1}) 时,需向索引发起的精确查询集合为
$$
\mathcal{Q}(q) = {q} \cup \bigcup_{j=1}^{k-1} \bigcup_{x \neq b_j,, x \in {\mathrm{A,C,G,T}}} q^{(j\leftarrow x)}
$$
其中 (q^{(j\leftarrow x)}) 表示将第 (j) 位改为 (x) 的 k-mer。于是
$$
|\mathcal{Q}(q)| = 1 + 3(k-1) = 3k - 2
$$
每次在基因组 k-mer 索引上精确命中即对应一个潜在结合位点;再结合延伸方向与产物长度模型筛出「可扩增」的潜在扩增子(论文与实现细节以 NAR / GitHub 为准)。
1 | flowchart LR |
2. 二聚体与发夹
思路修改自 AutoDimer:两序列步进重叠打分,记录高风险构型,并结合 ΔG 衡量稳定性。
对给定重叠对齐,双链区可用最近邻模型累加 (\Delta G^\circ);发夹则对茎环结构估计 (\Delta G^\circ_{\text{hairpin}})。若
$$
\Delta G^\circ \le \Delta G^\circ_{\max}
$$
则判为不可接受(阈值由 DMM/参数表给出)。
3. 多重 PCR 筛选策略
- 每靶多候选 → 逐对 QC;
- 过滤强 self-dimer / hairpin / 非特异扩增;
- 与已入池引物做 cross-dimer;
- DMM 阈值随应用可调。
决策模块(DMM,示意):对每个候选引物对 (\pi) 计算布尔或分级判据向量 (\mathbf{c}(\pi)=(c_1,\ldots,c_r))(特异性、hairpin、dimer、3′ 稳定性、SNP 等),当
$$
\mathbf{c}(\pi) \succeq \boldsymbol{\theta}
$$
(分量均优于阈值 (\boldsymbol{\theta}))时接受 (\pi) 入池;多重场景还需对所有已选引物集合 (S) 满足
$$
\forall p,q \in S,\ \text{cross-dimer}(p,q) \text{ 可接受}
$$
具体为 AND 规则还是加权评分,以程序配置为准。
配图(文献原图页面)
| 图号 | 内容(据期刊) | 官方页面 |
|---|---|---|
| Figure 1 | 工作流程 / 模块总览(以图题为准) | OUP NAR — article(文内 Figure 1) |
| Figure 2–3 | 特异性、二聚体或界面示例(以图题为准) | 同上(页面内图表) |
| PMC 全文与图表:PMC6602485。 |
局限性
- 非设计器:不替代 Primer3;需上游生成候选。
- 库依赖:特异性完全依赖数据库完整性、版本与注释;新物种/宏基因组片段可能覆盖不足。
- 启发式检索:k-mer + 错配规则在极端重复序列上仍可能漏检或误报,需实验交叉验证。
- MP-Ref / 在线:功能与配额以官网为准,长期 URL/服务可能变更。
参考资料
- Wang K, et al. Nucleic Acids Res. 2019;47(W1):W105–W113. https://doi.org/10.1093/nar/gkz351
- MFEprimer
- MFEprimer-3.0 GitHub
- MulD