单细胞转录组之Scanpy - 轨迹推断/拟时序分析

作者&投稿:百政 (若有异议请与网页底部的电邮联系)
~

什么是拟时序分析?拟时序(pseudotime)分析,又称细胞轨迹(cell trajectory)分析,通过拟时分析可以推断出发育过程细胞的分化轨迹或细胞亚型的演化过程。
我们可以理解为在一堆细胞中包含各种各样不同的发育状态的细胞,有的发育早,有的发育晚,有的分化了,有的未分化,有的处于中间态。利用算法基于基因表达推断每个细胞的相对分化时间,从而确定分化轨迹。

monocle是 进行拟时序分析常用的包,这是基于R完成的。但是之前也说了,monocle对于内存消耗很大,很容易出现内存不足的问题,scanpy则不会出现这个问题,而且scanpy内嵌轨迹推断函数,可以无缝衔接之前的单细胞分析。

scanpy作者使用了小鼠造血髓样数据进行了轨迹分析,我们这儿为了方便,我们直接使用pbmc3k数据进行测试。
注:pbmc这套数据集因为本身就是基本分化完全的细胞,分化轨迹没有啥实际生物学意义,这儿只是做测试。

单细胞转录数据分析之Scanpy: https://www.jianshu.com/p/e22a947e6c60
单细胞转录组之Scanpy - 轨迹推断/拟时序分析: https://www.jianshu.com/p/0b2ca0e0b544
单细胞转录组之Scanpy - 样本整合分析: https://www.jianshu.com/p/beef8a8be360
单细胞空间转录分析之Scanpy:
单细胞空间转录分析之Scanpy-结合单细胞转录组:

导入相关包:

读取数据 (这儿我们使用了前面跑完scanpy流程输出的pbmc3k.h5ad)

预处理数据,计算距离并可视化

汗,作者自己认为这儿做的这个图类别很乱,因此作者进行了优化,就是去噪。

对图形进行降噪

汗,作者认为仍旧有点乱(我心也乱了)

因此,因此,因此

作者又提供了一种方法:Clustering and PAGA
PAGA(Partition-based Graph Abstraction)是一种基于空间划分的抽提细胞分化“骨架”的一种算法,用于显示细胞的分化轨迹,评估cluster之间的关系紧密程度。
在这儿,作者又使用sc.tl.louvain来对细胞进行聚类,想重现使用的数据的结果,好吧,我也试试louvain聚类,发现在pbmc中聚类结果基本一致

当然我们根据已知marker基因识别细胞类别,可以将细胞类型的信息注释上去

查看颜色,可以自行定义颜色

替换颜色

定义分化起点,计算每个细胞的拟时间,画拟时间分布(这儿我是随便取的B细胞作为root,请根据自身数据细胞类别选取)

针对给定的一组基因,沿PAGA路径重建基因变化




求助鉴定细胞是干细胞还是癌细胞的方法
对心肌和骨骼肌细胞可以从移植的骨髓来源的SP细胞再生证明了SP细胞的潜在可塑性. ABCG2在SP细胞上的专一表达提示ABCG2可能成为是成体多能干细胞阳性筛选的潜在标志物。ABCG2在干细胞发育生物学里也扮演着一定的功能上的角色。Sca-1: Sca-1 (stem cell antigen 1, Ly-6A\/E), 是18kDa磷脂酰肌醇...

运动神经元病致病基因有20多种突变类型吗?
ALS或额颞叶痴呆(frontotemporaldementia,FTD)患者神经元胞浆中可以出现含有由该基因编码的蛋白TDP-43的包涵体,该蛋白参与RNA的转录加工过程,正常情况下该蛋白定位于细胞核中。目前认为TARDBP突变导致脊髓前角的运动神经元和胶质细胞中的TDP-43蛋白从细胞核转移到细胞质的再分布对ALS和FTD的发病有重要意义。有报道显示,4...

全基因组选择的模型汇总(转载)
我们知道,基因经过转录翻译以及一系列调控后才能最终体现在表型特征上,它只能在一定程度上反映表型事件发生的潜力。随着多组学技术的发展,整合多组学数据用于基因组预测也是目前GS研究的一个重要方向。 在植物育种中,除基因组外,转录组学和代谢组学是当前GS研究相对较多的两个组学。转录组将基因表达量与性状进行关联预测...

关于植物双受精过程的概述
双受精主要是被子植物(当然裸子植物麻黄属和买麻藤属也存在)特有的生殖方式,其过程主要是成熟的花粉粒落在柱头上水合萌发形成花粉管,花粉管穿过引导组织,穿过隔膜,进入胚珠后花粉管爆炸释放出两个精细胞,其中一个精细胞与卵细胞结合,最后发育成胚(2n),另外一个与中央细胞融合发育形成胚乳(3n)。 植物生殖过程中演化...

全基因组选择之模型篇
在植物育种中,除基因组外,转录组学和代谢组学是当前GS研究相对较多的两个组学。转录组将基因表达量与性状进行关联预测,代谢组则将调控表型的小分子含量与性状进行关联预测,对于某些特定的性状而言,可能会提高预测能力。最好的方法是将各个组学的数据共同整合进模型,但这样会大大增加模型的复杂度。 表型测定的准确性直...

巴东县19584702019: 10x genomics单细胞转录组为什么只能获得3'端转录本信息 -
说堂阳春: 要看情况,总体的测序深度是否够高,如果某个基因或转录本的reads数目仅有1-2条,我们一般认为其确实存在,但是表达量无法准确估计.所以在下结论的时候一般以readscount;1的认为有表达,但是以FPKM;1为可信的表达量,低于该值的表达量可能是不

巴东县19584702019: 高中生物题,关于细胞共性? -
说堂阳春: 有的基因表达是能同时表达的,没有时间空间的区别,如管家基因.也有的基因在不同细胞中表达情况不同,受时间空间的影响,如奢侈基因.

巴东县19584702019: qPCR怎么会出现这种结果 -
说堂阳春: 用参考基因的表达来均一化(normalization)不适用于单细胞,因为基因表达存在大的、不相关的变化.我们在原先的文章中展示了这一点,自那以后,几乎所有的基因和细胞都证明了这一点,除了mrna代谢不活跃的细胞(如卵母细胞)外....

巴东县19584702019: 如图所示,图一是同一种生物体内,有关细胞分裂的一组图象,图二表示有丝分裂各阶段细胞核中DNA和细胞质 -
说堂阳春: (1)由以上分析可知,图一中①②③⑤细胞含同源染色体;①细胞含有4个染色体组. (2)由以上分析可知,图中②④⑤可表示减数分裂;图一中的③处于有丝分裂中期,对应于图二的d区间. (3)基因突变一般分裂在分裂间期,即图一的⑤所示的细胞中;基因重组发生在减数第一次分裂后期,即图一的②所示的细胞中.a和c时期,细胞中mRNA含量最高,说明转录主要发生在细胞周期中的a、c期,此时染色体以染色质状态存在. 故答案为:(1)①②③⑤4 (2)②④⑤d (3)⑤②a、c 染色质

本站内容来自于网友发表,不代表本站立场,仅表示其个人看法,不对其真实性、正确性、有效性作任何的担保
相关事宜请发邮件给我们
© 星空见康网