转座酶介导的片段化(Nextera 系列):Nextera XT 试剂盒采用 Tn5 转座酶,通过 “切割 - 连接" 同步反应,将接头序列直接插入 DNA 片段两端,片段化过程无需超声破碎,片段大小可通过转座酶浓度(0.1-0.5 U/μL)与反应时间(5-15 分钟)精准调控,片段大小偏差<±20 bp。实验数据显示,针对 1 μg 人类基因组 DNA,转座酶片段化可获得 200-300 bp 的均一片段,片段均一性较超声破碎法提升 40%,且 GC 富集区(如启动子区域)片段化效率与普通区域无显著差异(偏差<5%)。
超声破碎优化(TruSeq 系列):TruSeq Nano 试剂盒配套专用超声破碎仪(Covaris S220),采用聚焦超声技术,将超声能量集中于样本区域,避免传统超声仪的能量分散问题,片段大小可在 150-1000 bp 范围内精准设置,片段大小 CV 值<10%,传统超声仪 CV 值达 25%-30%。同时,破碎缓冲液中添加 GC 稳定剂(如甜菜碱,1 mol/L),保护 GC 富集区 DNA 不被过度切割,确保全基因组范围内片段化均匀。
片段筛选工艺:采用磁珠法(AMPure XP 磁珠)进行片段筛选,通过调整磁珠与样本的体积比(0.6×-1.2×),精准筛选目标片段。例如,筛选 200-300 bp 片段时,磁珠体积比设置为 0.8×,可去除<150 bp 的短片段与>350 bp 的长片段,片段回收率达 85% 以上,传统琼脂糖凝胶电泳回收回收率仅 60%-70%。
Y 型接头结构:接头采用 Y 型双链结构,5' 端为互补区域(用于连接 DNA 片段),3' 端为非互补区域(含索引序列 Index)。连接过程中,Y 型接头仅与 DNA 片段两端的粘性末端结合,避免传统平末端接头的自连接问题(自连接率<5%,传统接头自连接率达 30%-40%),连接效率提升至 80% 以上。
索引序列优化:接头含双索引序列(i5 与 i7),每个索引序列含 8 个碱基,可组合生成 96×96=9216 种不同的索引组合,支持高通量样本 multiplexing(混样测序)。索引序列经过严格筛选,避免与基因组 DNA 同源(同源性<20%),减少索引跳跃(Index Hopping)现象(发生率<0.1%),传统单索引序列索引跳跃率达 1%-2%。
测序引物结合区设计:接头 3' 端含 Illumina 测序平台专用引物结合区(如 P5、P7 序列),与测序仪的流动槽探针(Flow Cell Probe)互补,确保文库在流动槽上的高效杂交(杂交效率>95%),杂交时间从传统的 30 分钟缩短至 10 分钟,且杂交特异性高(非特异性杂交率<1%)。
高保真 DNA 聚合酶:采用 Phusion 高保真 DNA 聚合酶(错误率<1×10⁻⁶),其 3'-5' 外切酶活性可校正错配碱基,同时具备高延伸效率(延伸速度 1 kb/min),扩增效率较 Taq 酶提升 30%。针对高 GC 区域(GC 含量>65%),聚合酶可有效突破二级结构,扩增效率偏差<10%,传统 Taq 酶在高 GC 区域扩增效率下降 50% 以上。
扩增缓冲液优化:缓冲液中添加甜菜碱(1 mol/L)与二甲基亚砜(DMSO,5%),甜菜碱可降低 DNA 二级结构的稳定性,DMSO 可提高聚合酶在高 GC 区域的延伸能力,两者协同作用使全基因组范围内扩增效率均一(扩增效率 CV 值<5%)。同时,缓冲液中含 dUTP(代替 dTTP),可通过 UDG 酶(尿嘧啶 - DNA 糖基化酶)在测序前去除携带 dUTP 的扩增子,避免交叉污染(污染率<0.01%)。
循环数精准控制:根据初始 DNA 量(10 ng-1 μg)推荐最佳循环数(8-12 个循环),避免过度扩增导致的文库异质性(如过度扩增会导致短片段富集)。实验验证显示,100 ng 人类基因组 DNA 经 10 个循环扩增后,文库浓度达 50 ng/μL,片段大小分布均一(200-300 bp 占比>90%),测序后覆盖度 CV 值<8%,传统 20 个循环扩增覆盖度 CV 值达 25%。
样本处理:取 1 μg 人类外周血基因组 DNA,使用 Covaris S220 超声破碎仪将 DNA 片段化为 200-300 bp,加入末端修复酶(T4 DNA 聚合酶、Klenow 片段)修复粘性末端,5' 端磷酸化,3' 端加 A 尾(Klenow 片段 3'-5' 外切酶活性缺失突变体)。
接头连接与扩增:加入 Y 型接头(含 i5/i7 索引),T4 DNA 连接酶 16℃连接 16 小时;使用 AMPure XP 磁珠(0.8× 体积比)筛选连接产物,去除未连接接头的片段;加入 Phusion 高保真聚合酶,进行 10 个循环的 PCR 扩增(98℃ 10 秒→60℃ 30 秒→72℃ 30 秒)。
测序与结果分析:文库经 Agilent 2100 生物分析仪检测,片段大小 250±20 bp,浓度 50 ng/μL;在 Illumina NovaSeq 6000 平台进行双端 150 bp 测序,测序深度 30×,Q30 值>95%,基因组覆盖度>99.5%,Contig N50 达 50 kb,与传统文库制备方法相比,de novo 组装效率提升 30%,错误率降低 50%。
文库制备:取 100 ng 肿瘤组织基因组 DNA,使用 Tn5 转座酶片段化并连接接头(5 分钟反应),8 个循环 PCR 扩增;加入外显子捕获探针(覆盖人类 20,000 个外显子,约 30 Mb),65℃杂交 24 小时,使用磁珠捕获杂交复合物,12 个循环 PCR 扩增富集捕获产物。
测序与突变分析:在 Illumina HiSeq X Ten 平台进行双端 150 bp 测序,测序深度 100×,外显子区域覆盖度>98%(≥20× 覆盖度);使用 GATK 软件分析基因突变,检测到肿瘤组织中存在 EGFR L858R 突变(等位基因频率 15%)、TP53 R273H 突变(等位基因频率 8%),与 Sanger 测序结果一致,低频突变检出率达 0.1%,传统文库制备方法低频突变检出率仅 1%。
ctDNA 提取与文库制备:取 10 mL 癌症患者血浆,使用 Qiagen QIAamp Circulating Nucleic Acid Kit 提取 ctDNA(约 10 ng);加入 Tn5 转座酶(低浓度 0.1 U/μL)片段化 ctDNA,连接含 UMI(分子标识符)的接头(每个 DNA 分子携带12 bp UMI),12 个循环 PCR 扩增(含 dUTP)。
测序与 UMI 去重:在 Illumina NextSeq 550 平台进行双端 150 bp 测序,测序深度 10,000×;通过 UMI 去重去除 PCR 重复(重复率<10%),使用 Mutect2 软件分析基因突变,检测到患者 ctDNA 中存在 KRAS G12D 突变(等位基因频率 0.05%),与肿瘤组织测序结果一致,传统文库制备方法因无 UMI 去重,无法检测到<0.1% 的低频突变。