搞懂illumina nextera Tn5 和ATAC seq adaptor 序列

作者&投稿：仇诚（若有异议请与网页底部的电邮联系）

在准备NGS文库的时候，会有用到转座酶Tn5， Nextera DNA Library Preparation Kit ，比如ATAC-seq就有用到这个Tn5。转座酶携带有特定的序列称为转座子Transposon 。

下面是ATAC-seq的工作原理，想必听说过ATAC-seq的，对这个图都会再熟悉不过了。

Tn5是kit里面带有的，没什么大不同。ATAC-seq 的barcoded primers （adaptors）会有一些不同，接下来，看下图中的每段序列对应的sequnce都是什么。

下面图例，Nextera tn5用来给基因组DNA加adaptors。

下面的图片就是准备ATAC-seq时候需要用到的index primer （adaptor），和Nextera DNA library prep kit里的有一点类似，但是也很不同。Ad1_noMX是Forward 引物，没有index （barcode），所以只有一个。Reversed引物有24个Ad2.（1-24），所以有24组不同的index （barcode）序列。这个index序列是和Nextera一样的。我涂红色部分就是index序列的反向反义序列，每个index序列是不同的8个碱基，这个和Nextera的i7（部分一样，请自己对照）是一样的。

i5 sequence: ATAC-seq的Adaptor1 里没有barcode

i7 sequence:

有两种Adaptors，分别为Adaptor1 （50bp）和Adaptor2 （53bp）。

其中Adaptor1（5’ illumina Primer1 sequence （29bp）+ Tn5 Read1 sequence（14bp）（再延伸到ME里面7bp）3’），Adaptor2（5’ illumina Primer2 sequence（24bp）+ barcode sequence （8bp）+ Tn5 Read2 sequence （15bp）（再延伸到ME里面6bp）3’）

这样算来，ATAC-seq library的长度=左面（Adaptor1 长度 +剩余部分Tn5的ME（12 bp_TATAAGAGACAG））+ open chromatin 的DNA长度+右面（剩余部分Tn5的ME（13bp_GTATAAGAGACAG）+ Adaptor2 长度）=open chromatin 的DNA长度 + 128bp。

所以，在ATAC-seq的libraries中 mono nucleosome的ATAC-seq library长度大概是(单核小体146bp+核小体free region)+两端的adaptor及Tn5最里面部分ME序列长度（50bp+12bp+13bp+53bp）=274bp+free region，也就是bioanalyzer里面看到的第二个peak。图中显示大概是340bp左右。所以free region应该是330bp-274bp=56bp 。

那么会问，对不对呢？看下bioanalyzer的第一个peak，显示是182bp，这个peak代表的是nucleosome free region的ATAC-seq library，所以是nucleosome free region序列长度 + 两端的adaptor及Tn5部分ME序列长度（50bp+12bp+13bp+53bp）=182，所以，不难得出同样的结果，nucleosome free region序列长度是54bp。差不多哦

以此类推，第三个peak代表de-nucleosome ， 500bp到550 bp之间，是不是等于两个核小体长度加上核小体空隙序列再加上两个adaptor， 2 146bp + 2 55bp + 128bp= 530bp （为什么55bp也要乘2？答：多出来一个核小体当然就多出来一份核小体空隙）

nucleosome free region, mono-nucleosome, de-nucleosome and try-nucleosome

“GAP不是服装品牌，而是个坑”。

所以需要在PCR第一步，需要5min的72摄氏度来填坑。
还要注意，就是在tagmentation的时候会出现三种产物，上面的图只是其中一种。

哪里说的不对欢迎纠正，请留言。

参考：
http://ecoliwiki.net/colipedia/index.php/Transposon_Tn5
http://nextgen.mgh.harvard.edu/attachments/Nextera%20Protocol.pdf
https://teichlab.github.io/scg_lib_structs/SMART-seq_family.html
http://www.epibio.com/docs/default-source/protocols/ez-tn5-transposase.pdf?sfvrsn=4

搞懂illumina nextera Tn5 和ATAC seq adaptor 序列
有两种Adaptors，分别为Adaptor1 （50bp）和Adaptor2 （53bp）。其中Adaptor1（5’ illumina Primer1 sequence （29bp）+ Tn5 Read1 sequence（14bp）（再延伸到ME里面7bp）3’），Adaptor2（5’ illumina Primer2 sequence（24bp）+ barcode sequence （8bp）+ Tn5 Read2 sequence （15bp）（...

如何看懂illumina的检测甲基化的探针的信息
DNA甲基化是最早发现的基因表观修饰方式之一，真核生物中的甲基化仅发生于胞嘧啶，即在DNA甲基化转移酶（DNMTs）的作用下使CpG二核苷酸5’-端的胞嘧啶转变为5’-甲基胞嘧啶。DNA甲基化通常抑制基因表达，去甲基化则诱导了基因的重新活化和表达。这种DNA修饰方在不改变基因序列前提下实现对基因表达的调控。

【临检杂谈】---临床检测,到底该选PCR还是NGS?(二)
Flatley本身是医学博士，来Illumina之前把自己创办的公司“分子动力”卖了三个亿。所以可以看出这个人，不仅懂技术，还颇有商业变现头脑。 Jay Flatley的加入，为Illumina注入了完全不同的动力，他非常看好测序仪市场的广阔前景，并提出了大家后来都很熟悉的一句话， “把测序成本降到1,000美元以下” 。

Illumina_HiSeq_2000高通量测序结果分析
raw_count应该是某个转录本\/基因的测到的原始reads条数，normalized_count是经过标准化的数据量；差异分析需要统计 raw_count, FPKM值，pvalue

DAY7 一二三代测序,重一二代测序原理,三代略看,必备words
三平台：Roche公司的454技术、illumina公司的Solexa\/Hiseq技术(占主要市场，PE（Pair End双端）测序原理)、ABI公司的SOLID技术双端测序原理：如下 2. 上样 3. 桥式PCR 4. 测序（边合成变测序）flowcell ：测序反应的载体\/容器，1个flowcell有8个lane lane ：测序反应的平行泳道，试剂...

生信基础-测序原理
从荧光信号的产生到碱基序列的识别这一过程，主要包括图象校正（即空间校正）、cluster识别、荧光校正（即光学校正）、phasing\/prephasing（即化学校正）、碱基识别、PF（Illumina默认的数据过滤算法Pass Filtering）、质量评估等7个步骤其中相机识别碱基的工作原理：利用了CCD相机(1)对每一个簇(cluster)进行...

一文看懂植物单细胞测序怎么做?
然而在制备原生质体的过程中,通过过滤去除破碎细胞中的小碎片和细胞器,然后通过流式细胞仪进入10xGenomoics系统制备文库,然后利用Illumina平台测序,分析了来自三个独立重复的12525个单细胞,检测了28899个基因的表达, 与普通转录组的基因表达检测情况相当。使用MetaNeighbor进行细胞聚类,共将其聚成12个类别。构建植物单...

什么是多元微珠临床分析系统
Illumina公司将生物芯片技术运用到临床的一种系统 Illumina公司今年六月刚向Affymetrix公司支付9000万美元，以达成双方之间的专利纠纷。美国Affymetrix公司是全球著名的生物芯片制造商，在纳斯达克股市的市值已经超过20亿美元。它的表达谱基因芯片占全球同类产品一大半的市场份额。（这里有生物芯片的市场概况http:\/\/...

意大利买的化妆品(欧莱雅)帮忙翻译下
PROTEGGE ILLUMINA 对抗日光 Pelli normali o miste 适用于正常与混合肤质第五种：CHIAVE 钥匙 GIOVINEZZA 防止眼部皱纹 Trattamento Anti-rughe Ringiovanente OCCHI Rughe,occhiaie ,borse 对抗皱纹黑眼圈肿胀？不懂BORSA。。。NUOVA ERA 使你年轻十岁 NATA DALLA SCIENZA DEI GENI 10 ANNI DI ...

泰国试管婴儿PGD和ACGH技术的区别
；21号染色体（唐氏综合症），以及X和Y染色体。3.ACGH可以筛选24对染色体，比PGD在检查染色体方面更全面。4.ACGH要求胚胎的个数多以及质量好才能培养存活到第五天。而PGD培养胚胎只需要在第三天就可以知道是否能移植。如果做了ACGH的人可以不需要再做PGD了。因为ACGH包含了PGD里面所需求的。

波密县18534547885： Illumina adaptor是如何连接在片段上的呢?连在5'端还是3'端,还是两端都连? - ？
颛放喜得：[答案] illumina 的接头是两头都接上,illumina测序中有成簇这一步,需要两头接头不过illumina测序分为单端和双端,单端的话虽然接了两个接头,但是只有一个接头有测序引物.双端测序双端都有测序引物.

波密县18534547885： illumina、eternally这两个单词分别是什么意思,怎么发音? - ？
颛放喜得：[答案] 应该是GOD IS A GIRL的歌词里出现的吧 illuminate 英音:[i'lju:mineit]1.照亮;照射Moonlight illuminated the valley.月光照亮了山谷.2.用灯装饰(房屋等)[(+with)]The streets were illuminated for the celebratio...

波密县18534547885： 关于illumina测序,basespace是什么意思 base这里是碱基的意思么??懂生物信息学和高通量测序的帮帮忙？
颛放喜得： BaseSpace is Illumina's genomics cloud computing environment for next-generation sequencing (NGS) data analysis. Now biologists and informaticians can easily and securely analyze, archive, and share sequencing data. NGS data analysis is ...

波密县18534547885： 如何看懂illumina的检测甲基化的探针的信息 - ？
颛放喜得： 任务占坑

波密县18534547885： 在核苷酸测序(illumina测序等)中有mate pair和pair end这两个有什么区别啊?只听说mate pair是环化的mate pair是怎么环化的?测序后的序列中mate pair... - ？
颛放喜得：[答案] 你已经解释的很清楚了,mate pair测序的DNA文库是将很长的DNA进行环化,环化的接口处连接识别序列,然后打断,富集含有识别序列的DNA,再进行双向测序,那么双向测序的插入片段长度就会很长. 而pair end是直接在DNA两端假设接头进行...

波密县18534547885： 第二代基因测序技术的流程分别是什么,四种,Roche 454测序技术,Illumina Solexa测序技术,ABI SOLiD测序 - ？
颛放喜得：[答案] 454测序:DNA文库制备→emPCR→上机测序 Solexa测序:文库制备→Cluster扩增→边合成边测序 SOLiD测序:样品制备→Emulsion PCR和底物准备→测序反应→图像收集→数据分析

波密县18534547885： 有可能在一个月基本搞懂JAVA吗? - ？
颛放喜得： 语法是相似的,了解语法很快很简单的.关键是一要注意不同的地方,java对象的理解,封装、继承、多态java的三大特征;二就是了解java庞大的类库,这个在用到的时候再去查看api文档.我觉得还是下载视频看然后动手写东西比较简单,看书可以作为辅助,用到哪里看哪里.如果有c的基础java基础不要一个月的(当然是每天至少要有六七个小时的学习时间吧的情况下).不懂的虚心向新人学吧,在java方面你才是新人.

波密县18534547885： Java 嵌套循环搞不懂 - ？
颛放喜得： 1、第一层循环表示要循环的次数2、第二层表示进行具体的某一行的具体操作比如:一个输出一个3行4列的长方形,代码片段为:for(int i=0;i{ for(int j=0;j { if(j!=4) System.out.print(＂*＂); else System.out.println(＂*＂); } }

你可能想看的相关专题

星空见康网

搞懂illumina nextera Tn5 和ATAC seq adaptor 序列

你可能想看的相关专题