来宝网 2020/11/25点击1077次
文库“特异”决策者——接头奥秘的揭示
近些年来,测序仪型号更迭,不断刷新测序通量的纪录。测序通量的大幅增加,意味着更多的样本需要混合上机,这样的话,我们如何在茫茫数据中找到对应样本匹配的数据呢?人们想到了一种文库构建时在接头上添加“接头暗号”的方法,在测序完成之后根据“接头暗号”对样本进行分离。这里的接头暗号就是样本标签“Index/Barcode”。本文以illumina接头展开讲解,MGI接头下回见分晓。
接头概述
接头的本质是一段短的碱基序列,基本包括三个部分:与flow-cell上面寡核苷酸相同或互补的片段P5/P7;测序时测序引物结合部分R1/R2;用于区分不同样本的Index。接头是待测DNA片段与Flow-cell连接的桥梁,目的片段连接接头后可以在flow-cell上扩增再测序。
接头分类
接头的分类方法主要有两种,一是按照Index的位置,二是按照否匹配PCR-free建库。
1. 根据Index位置可以将接头分为单端Index接头和双端Index接头。单端Index接头指的是仅在P5端或P7端存在Index(一般在P7端),双端Index接头指的在P5和P7端均存在Index。Index的数目直接影响最终上机能混合的样本数目,双端Index比单端Index能容纳更多数目的样本,近年来为了满足一次能测量更多的样本的需求,双端带Index的接头被广泛使用。
2. 根据接头是否匹配PCR-free建库可以将接头分为长接头和短接头。长接头又称为完整接头,包括P5/P7+Index序列+Read 1/2,完整接头通过TA克隆的方式连接到DNA片段之后,可不进行PCR扩增反应直接上机测序(DNA量足够上机测序时可直接上机,当DNA量不够时还需进行PCR扩增使得产物达到一定的量方可上机测序)。短接头通过TA克隆方式连接到DNA片段上后,必须与包含P5/P7和Index序列的引物进行PCR扩增,扩增产物才是包含完整接头的DNA片段。也就是说短接头最终一定要通过PCR扩增形成完整接头才能上机测序。
UDI、UMI接头拓展
测序过程中,为了增加上样通量,一般在面临大量样本同时测序时,会选择双端Index。目前常用的双端Index策略是将少数几种Index排列组合,最终实现更多样本的区分,但这种方式一直存在接头交叉污染的可能,常规的双端Index组合标记的文库分子,有1%的错误分配率是无法被识别剔除的。
Illumina为了进一步提升通量与扩增效率,降低测序成本,为Novaseq等高通量型测序仪引入了阵列式流动槽(PFCT)和排他性扩增(ExAmp)成簇技术,但无意间却放大了Index hopping的样本标签错配现象。
为了弥补HiSeq3000/4000、HiSeq X Series及NovaSeq等测序平台凸显的标签跳跃问题,Illumina提出在文库的两端都带上独特标签(UDI)的策略,可以进行双侧校验,剔除标签错配的接头。采用双端唯一Index分析数据时,可以将Index错误分配率降低到0.01%,与之前常规的Index排列组合方法对比,Index hopping降低了两个数量级。
此外,在低频和极低频突变检测中,避免假阳性是液体活检格外关注的重要一环。应用分子标签UMI技术(其作用是冻结DNA片段扩增前的状态),生信人员就能区分不同来源的DNA模板,分辨哪些是PCR扩增及测序过程中的随机错误造成的假阳性突变,哪些是患者真正携带的突变,从而过滤掉背景噪音,实现低频和极低频突变的准确检测。
UMI接头包含P5 Index、P7 Index和UMI元件,其中,UMI分子标签可以设计为完全随机的核苷酸链、部分简并核苷酸链或者固定核苷酸链。根据UMI标签所在的位置,又可以将UMI接头分为单端UMI(10 nt)接头(UMI标签紧随P7端Index)和双端UMI(5-8 nt)接头(UMI标签位于插入片段两端)。
Index互补Yes or No?
Illumina接头根据接头设计的长短、下游应用和建库操作不同,分为短接头和长接头。其中,采用短接头测序时,i7 Index不分测序平台,都需要反向互补,i5 Index需要根据选择的测序平台决定是否需要反向互补(Miniseq,Nextseq,Hiseq 3000/4000,Hiseq X等平台需要反向互补)。采用长接头测序时,i7 Index在任何测序平台都不需要反向互补,i5 Index反向互补与否同短接头i5 Index保持一致。
表1:接头Index测序方向汇总
Index引入方式 | 接头 | Index | 测序时Index序列 | ||
NovaSeq, MiSeq, HiSeq 2000/2500, | Miniseq,Nextseq,Hiseq 3000/4000,Hiseq X | ||||
引物扩增加入 | 短接头 | 单端 | i7 Index | 反向互补 | |
双端 | i5 Index | 正向 | 反向 | ||
i7 Index | 反向互补 | ||||
接头连接加入 | 长接头 | 单端 | i7 Index | 正向 | |
双端 | i5 Index | 正向 | 反向 | ||
i7 Index | 正向 |
如上所述,Illumina平台接头包括长接头、短接头、UDI接头和UMI接头。在文库构建过程中,接头发挥着至关重要的作用,既决定了文库的完整性,又决定了文库的特异性,接头Index作为样本的“身份证”,可区分不同来源的DNA模板,1对1的编号,既满足多样本的协同操作,也便于生信后期对下机数据进行拆分。
产品推荐
产品类型 | 名称 | 货号 |
短接头 | Hieff NGS® 96 Single Index Primer Kit for Illumina® | 12611/2ES02 |
Hieff NGS® 384 Dual Index Primer Kit for Illumina® | 12613/4ES02 | |
长接头 | Hieff NGS® Complete Adapter Kit for Illumina® | 12615/6/7/8ES04/16 |
UDI 短接头 | Hieff NGS® Stubby UDI Primer for Illumina | 12404/5/6/7ES01 |
Hieff NGS® RNA Stubby UDI Primer for Illumina | 12408/9/10/11ES01 |