完整的单细胞分析通用流程——从数据到可视化

作者&投稿:虞嘉 (若有异议请与网页底部的电邮联系)
~ 本章概述了典型的scRNA-seq分析工作流程的框架(图1)。 随后将更详细地描述每个分析步骤。

在开始分析本身之前,对实验设计进行一些讨论可能会有所帮助。最明显的问题是技术的选择,大致可以分为:

1.基于液滴的:10XGenomics,inDrop, Dropseq
2.基于板的独特分子识别符(UMI):CEL-seq,MARS-seq
3.基于板的读取:Smart-seq2
4.其他:sci-RNA-seq,Seq-Well
这些方法中的每一种都有其优点和缺点,其他地方对此进行了广泛讨论(Mereu等人( http://bioconductor.org/books/release/OSCA/overview.html#ref-mereu2019benchmarking ); Ziegenhain等人2017( http://bioconductor.org/books/release/OSCA/overview.html#ref-ziegenhain2017comparative ))。实际上,基于液滴的技术由于其吞吐量和每个细胞的低成本而成为当前的事实上的标准。基于板的方法可以捕获其他表型信息(例如形态),并且更适合定制。基于reads的方法提供了完整的转录本覆盖范围,这在某些应用(例如剪接,外显子组突变)中很有用; 基于UMI的方法将减轻PCR扩增噪声的影响,因此更为流行。方法的选择取决于具体情况——但是以下我们分析流程中的大多数方面都与技术无关。

下一个问题是应该捕获多少个细胞,以及应该对它们进行测序的深度。简短的答案是“尽可能多地花钱”。长答案是,这取决于分析的目的。如果我们旨在发现稀有的细胞亚群,那么我们需要更多的细胞。如果我们旨在刻画细微的差异,那么我们需要更多的测序深度。目前,对文献的非正式调查表明,典型的基于液滴的实验将捕获10,000至100,000个细胞,每个细胞以1,000至10,000个UMI进行测序(通常与细胞数量成反比)。基于液滴的方法还需要在通量和双峰速率之间进行权衡,从而影响测序的真正效率。

对于涉及多个样品或条件的研究,设计注意事项与批量RNA-seq实验的考虑相同。每个条件应有多个生物学重复,并且条件不应与批次混淆。请注意,单个细胞不是重复单元。相反,我们指的是来自重复供体或培养物的样品。

来自scRNA-seq实验的测序数据必须转换成可用于统计分析的表达矩阵。考虑到测序数据的离散性,通常是一个计数矩阵,其中包含映射到每个细胞中每个基因的UMI或读数的数量。量化表达的过程往往取决于技术:

1.对于10X Genomics数据,CellRanger软件包提供了一个自定义管道来获取计数矩阵。这使用 STAR 将reads与参考基因组比对,然后计算映射到每个基因的独特UMI的数量。
2.伪比对方法(例如 alevin )可更高效地获取计数矩阵。这避免了精准对齐的需要,从而减少了计算时间和内存使用量。
3.对于其他高度复用的协议, scPipe 软件包提供了更通用的管道来处理scRNA-seq数据。这使用Rsubread比对reads,然后对每个基因的UMI进行计数。
4.对于CEL-seq或CEL-seq2数据,scruff软件包提供了专用的量化管道。
5.对于基于reads的方法,我们通常可以重复使用处理大量RNA-seq数据相同的管道。
6.对于涉及spike-in转录本的任何数据,在比对和定量过程中应将spike-in序列作为参考基因组的一部分。
量化后,我们将计数矩阵导入R并创建 SingleCellExperiment 对象。这可以通过基本方法(例如 read.table() )来完成,然后再应用 SingleCellExperiment() 函数构造。另外,对于特定的文件格式,我们可以使用 DropletUtils (用于10X数据)或 tximport / tximeta 包(用于伪对齐方法)等专用方法。根据数据的来源,需要注意以下几点:

1.某些feature计数工具会在计数矩阵中报告映射统计信息(例如,未对齐或未分配的reads数)。尽管这些值可用于质量控制,但如果将其视为基因表达值,则会产生误导。因此,在进行进一步分析之前,应将其删除(或至少移至 colData )。
2.小心使用 ^ ERCC 正则表达式来检测人类数据中的spike-in行,其中计数矩阵的行名称是基因符号。 ERCC基因家族实际上存在于人类注释中,因此这将导致错误地将基因识别为spike-in转录本。通过使用带有标准标识符(例如Ensembl,Entrez)的计数矩阵,可以避免此问题。

在最简单的情况下,工作流程具有以下形式:
1.我们计算质量控制指标,以去除会干扰下游分析的低质量细胞。这些细胞在处理过程中可能已经损坏,或者可能没有被测序方案完全捕获。常用指标包括每个细胞的总计数,spike-in或线粒体reads的比例以及检测到的feature的数量。
2.我们将计数转换为标准化的表达值,以消除特定于细胞的偏倚(例如捕获效率)。这使我们能够在下游诸如聚类等步骤中在细胞间执行准确的比较。我们还应用了一个转换(通常是对数)来调整均值-方差关系。
3.我们执行feature选择以选择有兴趣的特征子集进行下游分析。这是通过对每个基因的细胞间差异建模并保留高度可变的基因来完成的。目的是减少不必要的基因的计算和噪声。
4.我们应用降维来压缩数据并进一步降低噪声。通常使用主成分分析来获得初始的低阶表示,以进行更多的计算工作,然后再采用更具激进的方法,例如t-随机邻居嵌入可视化。
5.我们根据其(标准化)表达谱的相似性将细胞分组。这旨在获得用作不同生物学状态的经验代表分组。我们通常通过识别细胞群之间差异表达的标记基因来解释这些分组。
诸如数据整合和细胞注释之类的其他步骤以后再进行讨论。

在这里,我们使用Macosko等人的基于液滴的视网膜数据集。( http://bioconductor.org/books/release/OSCA/overview.html#ref-macosko2015highly ),在 scRNAseq 包中有提供。 这个例子从计数矩阵开始,并以聚类结束,为生物学解释做准备。


10X单细胞空间联合分析方法汇总及算法总结
通过了解 ST 数据中的细胞比例变化以及空间信息进行下游分析,我们可以更好地揭示潜在的生物学机制,并进一步发现使用 scRNA-seq 数据集无法实现的新发现。 然而,目前还没有对这些细胞去卷积方法进行公平和全面的比较。 我们将使用多个真实的 ST 数据集,包括单细胞水平分辨率和带有病理学家注释的点级分辨...

单细胞ATAC亚群分析
所有高维数据的分析都是采取降维的方式从多维到低纬的策略,之后还可以再次降维成2个维度并可视化(比如TSNE和UMAP)。我们对peaks是采取LSI降维的方式。与单细胞转录组类似,降维后的单细胞ATAC数据也同样可以采取graph-based clustering的分群方法。Graph-based图聚类算法包括两步:首先用降维(PCA或者LSI)...

热图在单细胞数据分析中的应用
提到相关性,我们很容易注意到WGCNA(weighted correlation network analysis,加权基因共表达网络分析), 用于提取与性状或临床特征相关的基因模块,解析与表达量相关生物学过程。这是除了富集分析之外另一个寻找好的geneList的方法。这里的颜色不再是表达量的度量而是相似性的度量。人们针对单细胞发展了相应的...

单细胞数据分析中future包的使用
跑锚点整合的时候遇到报错 提示 future.globals.maxSize 不足 解决办法参考: stackoverflow 在Seurat的 pipeline中,我们是可以使用future框架进行并行运算的。更多说明可以参考 future 。要访问 Seurat 中的并行函数版本,需要加载 future 包并设置 plan 。plan将指定如何运行该函数。默认行为是以非并行方式...

单细胞生物科技应用
单细胞分析作为化学、生物学和医学交叉学科的前沿领域,利用多种技术手段进行研究,其中包括毛细管电泳、微流控芯片、不同类型的光学显微镜(如荧光、聚焦、全内反射等)、扫描电化学显微镜、质谱成像、原子力和扫描隧道显微镜分析,以及新兴的阿达玛变换显微光谱、肿瘤电化学免疫分析、动力学分析等。新技术不...

单细胞转录组基础分析七:差异基因富集分析
本文是参考学习 单细胞转录组基础分析七:差异基因富集分析 的学习笔记。可能根据学习情况有所改动。此前的分析我们按转录特征把细胞分成了很多类别,例如seurat聚类分析得到的按cluster分类,singleR分析得到的按细胞类型分类,monocle分析得到的按拟时状态(state)分类。不同的细胞类型之间,有哪些表达差异...

10X单细胞空间联合分析之十一(CellTrek)
CellTrek 工具包还提供了两个下游分析模块,包括用于 空间共定位分析 的SColoc 和用于空间 共表达分析 的SCoexp。 使用模拟和原位数据集对 CellTrek 进行了基准测试。 然后,将 CellTrek 应用于来自正常小鼠大脑和肾脏组织的现有数据集以及从两个人类导管原位癌 (DCIS) 样本生成的数据,以研究单细胞空间分辨率下细胞...

10X单细胞(10X空间转录组)细胞通讯分析联合大全
LIANA(LIgand-receptor AAnalysis frAmework)是一个框架,能够使用不同的资源和方法对来自单细胞转录组学的配体-受体相互作用进行优先排序。 它允许用户系统地生成关于来自给定细胞类型的哪些配体与另一种细胞类型的受体结合的假设。 与 LIANA 相比,NicheNet 旨在深化将配体与一组转录靶标连接起来的细胞内...

单细胞RNA系列专题之一:单细胞RNA测序中质控之重要细节 (下篇)_百度...
单细胞测序的核心就是t-SNE降维,以及聚类。那么在做这些工作之前的质控,关乎到整个分析的成败。这篇文章我就继续给大家讲讲单细胞质控的那些事儿。整个单细胞分析的核心其实就是确定cell types\/ lineages。而在此之前的一步就是数据质控(QC, quanlity control)。我们在得到表达矩阵之后,会做Data ...

Seurat单细胞分析常见代码-02
默认是500 * 1024 ^ 2 = 500 Mb future在seurat的具体应用详见: https:\/\/satijalab.org\/seurat\/archive\/v3.0\/future_vignette.html CaseMatch()为seurat包内部函数, https:\/\/github.com\/satijalab\/seurat\/blob\/master\/R\/utilities.R 如果细胞太密,有重叠,可以设置透明度,我一般alpha.use设置0...

江川县19546593871: 济宁市能源科研所在利用植物秸秆生产燃料酒精的 研发中已取得突破性进展,其大致流程是:秸秆 → 糖液 -
于莘吡嘧: D.② ④ ⑤

江川县19546593871: 网站的域名解析类型有哪些,请网络公司易捷网络做了一个网站,域名和空间是我们自己提供的,现在要做网站的域名解析,可是提示请选择解析类型,不懂,请问域名解析类型是什么意思.
于莘吡嘧: 常见的四中域名解析类型 1、A记录解析 记录类型选择“A”;记录值填写空间商提供的主机IP地址;MX优先级不需要设置;TTL设置默认的3600即可. 2、CNAME记录解析 CNAME类型解析设置的方法和A记录类型基本是一样的,其中将记录...

江川县19546593871: 单细胞培养的方法有哪些?各有什么特点? -
于莘吡嘧: 1.转瓶培养 这个比较老的工艺,在逐步淘汰,不过投资少,技术含量低,人员经少量培训就可以操作. 2.悬浮培养 非贴壁依赖性细胞的一种培养方式.细胞悬浮于培养基中生长或维持.某些贴壁依赖性细胞经过适应和选择也可用此方法培养....

江川县19546593871: 苹果7 Plus打电话时,经常接通后听不到对方的声音,要么打着打着就自动断了线是怎么回事? -
于莘吡嘧: 如果您的手机出现通话中断的现象,建议您换个网络环境后进行尝试(如户外),来验证是否是信号覆盖问题.如信号正常,且无物体挡住天线时,建议您启用“飞行模式”保持至少15秒后,再重新关闭试一下.如仍无法恢复正常,建议您与...

江川县19546593871: 现代最新生物学里是如何解释单细胞进化成多细胞生物的现代最新生物学里是如何解释单细胞进化成多细胞生物的,过程请详细叙述 -
于莘吡嘧:[答案] 从单细胞生物到多细胞体这一过渡是怎么发生的?据美国物理学家组织网1月16日报道,5亿多年前,地球表面的单细胞生物开始形成多细胞簇,最终变成了植物和动物.美国明尼苏达大学研究人员在实验室用普通的啤酒酵母菌复制了这一关键进化步...

江川县19546593871: 毛细管电泳峰像一根线是什么原?毛细管电泳峰像一根线是什么原因
于莘吡嘧: 毛细管电泳(capillary electrophoresis,CE)又称高效毛细管电泳(high performance capillary electrophoresis,HPCE),是一类以毛细管为分离通道、以高压直流电场为驱动力的新型液相分离技术.毛细管电泳实际上包含电泳、色谱及其交叉内容,它使分析化学得以从微升水平进入纳升水平,并使单细胞分析,乃至单分子分析成为可能.长期困扰我们的生物大分子如蛋白质的分离分析也因此有了新的转机. 目录

江川县19546593871: 流式细胞术的原理在哪些检验仪器或技术平台中还有应用 -
于莘吡嘧: 血细胞分析仪和尿沉渣分析仪都有应用,可以形成连续的单细胞液柱,对每一个细胞逐个分析

江川县19546593871: 下图是对变形虫进行去核和再植入核的有关实验过程.分析回答: (1)变形虫是单细胞生物,光学显微镜下________(填“能”或“不能”)看到细胞核... -
于莘吡嘧:[答案] (1)能 (2)细胞质中已合成的蛋白质仍能发挥作用 (3)营养物质 能量 (4)细胞核在细胞生命活动中起决定性作用 (5)相互依存的统一整体

本站内容来自于网友发表,不代表本站立场,仅表示其个人看法,不对其真实性、正确性、有效性作任何的担保
相关事宜请发邮件给我们
© 星空见康网