简介
临床检测过程中,面对的一个比较复杂的问题,就是转录本的选择。
转录本的选择
转录本的选择需要结合相关预期临床用途。
目前华大相关产品的转录本选择方案参考文档:
[肿瘤产品转录本选择管理规程](TJ-SOP-RI-129 A0 肿瘤产品转录本选择管理规程.pdf)
文档仍在准备受控阶段,后续确定终板需要进行更新。
转录本切换评估方案
构建结构注释bed文件
首先基于新的转录本,构建一个描述基因结构的bed文件。该文件应该包含所关注的转录本结构区域。
- 在NCBI上下载对应版本的基因结构注释结果文件*gff格式。
- 使用 /jdfstj1/B2C_COM_P1/Research_and_Development/Database/Transtript_choose/5.1.1NCBI/gff2bed.pl 脚本将将gff格式的结构文件转化为bed文件(NCBI.gff2bed.bed)。
- 使用bedtools对产品检测范围进行结构注释。需要基于捕获区间分别对新旧转录本获取该文件。
1 | 对原始bed进行排序 |
- 对现有产品的新旧转录本文件进行比较。确定差异检测范围
- 获得两套转录本区域(该区域指和检测范围区间交集为基础)之间的交集
1
bedtools intersect -a Pancancer_v2.anno.Oldtrans.bed -b Pancancer_v2.anno.Newtrans.bed > old_new.overlap.bed
- 获得切换转录本后减少的区域
1
bedtools subtract -a Pancancer_v2.anno.Oldtrans.bed -b Pancancer_v2.anno.Newtrans.bed > old.subtract.new.bed
- 切换转录本后增加的区域
1
bedtools subtract -a Pancancer_v2.anno.Newtrans.bed -b Pancancer_v2.anno.Oldtrans.bed > new.subtract.old.bed
- 接受替换的标准
针对就转录本进行替换时,需要额外补充如下评估内容
- 更换转录本后,由于转录本涵盖区间发生改变,需要将更换后,不会提报的范围反馈解读。基于临床历史检测结果的变异进行汇总统计。确认是否会影响致病变异位点的输出。
- 核查新旧转录本特异性区域,对应的公共数据库交集区域,确定更换转录本对公共数据库变异范围产生的影响。
针对肿瘤检测相关产品可参考数据库如下:
备注
由于部分原始下载文件中,染色体编号常规命名和常规使用命名方式可能会存在出入; 因此在下游处理过程中需要对染色体编号进行转换,转换关系如下:
NCBI获取染色体编号和NC编码之间的对应关系
| Molecule name | GenBank sequence | RefSeq sequence | Unlocalized sequences count | |
|---|---|---|---|---|
| Chromosome 1 | CM000663.1 | = | NC_000001.10 | 2 |
| Chromosome 2 | CM000664.1 | = | NC_000002.11 | 0 |
| Chromosome 3 | CM000665.1 | = | NC_000003.11 | 0 |
| Chromosome 4 | CM000666.1 | = | NC_000004.11 | 2 |
| Chromosome 5 | CM000667.1 | = | NC_000005.9 | 0 |
| Chromosome 6 | CM000668.1 | = | NC_000006.11 | 0 |
| Chromosome 7 | CM000669.1 | = | NC_000007.13 | 1 |
| Chromosome 8 | CM000670.1 | = | NC_000008.10 | 2 |
| Chromosome 9 | CM000671.1 | = | NC_000009.11 | 4 |
| Chromosome 10 | CM000672.1 | = | NC_000010.10 | 0 |
| Chromosome 11 | CM000673.1 | = | NC_000011.9 | 1 |
| Chromosome 12 | CM000674.1 | = | NC_000012.11 | 0 |
| Chromosome 13 | CM000675.1 | = | NC_000013.10 | 0 |
| Chromosome 14 | CM000676.1 | = | NC_000014.8 | 0 |
| Chromosome 15 | CM000677.1 | = | NC_000015.9 | 0 |
| Chromosome 16 | CM000678.1 | = | NC_000016.9 | 0 |
| Chromosome 17 | CM000679.1 | = | NC_000017.10 | 4 |
| Chromosome 18 | CM000680.1 | = | NC_000018.9 | 1 |
| Chromosome 19 | CM000681.1 | = | NC_000019.9 | 2 |
| Chromosome 20 | CM000682.1 | = | NC_000020.10 | 0 |
| Chromosome 21 | CM000683.1 | = | NC_000021.8 | 1 |
| Chromosome 22 | CM000684.1 | = | NC_000022.10 | 0 |
| Chromosome X | CM000685.1 | = | NC_000023.10 | 0 |
| Chromosome Y | CM000686.1 | = | NC_000024.9 | 0 |