单细胞系列课程-10 Trajectory inference analysis of scRNA-seq data

作者&投稿:荡疫 (若有异议请与网页底部的电邮联系)
~

视频链接: https://www.youtube.com/watch?v=XmHDexCtjyw&list=PLjiXAZO27elC_xnk7gVNM85I2IQl5BEJN&index=11
练习地址: https://github.com/NBISweden/excelerate-scRNAseq/blob/master/session-trajectories/session-trajectories.md

在进行标准的单细胞分析流程得到聚类结果后,可以进行轨迹分析,并进一步进行基因表达分析。
但并不是只有聚类结果才可进行轨迹分析,标准分析中的很多步骤都可以follow with轨迹分析。

在整个生命生长发育过程中,细胞都在不断从一种功能“状态”过渡到另一种功能“状态”(如下图)。处于不同状态的细胞表达不同的基因,产生蛋白质和代谢物的动态重复,从而完成它们的工作。当细胞在不同的状态间转化时,会经历转录重组的过程,一些基因被沉默,而另一些则被激活。这些瞬态通常很难描述,因为在更稳定的端点状态之间净化细胞可能很困难或不可能。但由于这个过程是连续发生的,我们可以使用轨迹推断(TI,trajectory inference)的方法可以根据测序的细胞(瞬时状态)之间表达模式的相似性对单细胞沿着轨迹进行排序,以此来模拟细胞动态变化的过程。也就是重建分化轨迹或者拟时间轴。

但值得注意的是,并不是所有样本都适合进行轨迹分析。

比如我们明确知道骨髓中存在分化中间态的细胞(存在从干细胞到成熟细胞的分化过程),因此骨髓的样本可以进行轨迹分析。但一些样本如PBMC中几乎都是分化成熟的细胞,虽然也可以做轨迹分析,但是意义不大。此外,存在分化过程的细胞也有差别。比如B细胞到浆细胞的分化更像是一个线形过程,不存在分支(branch),所以B细胞不适合做branching。但Th细胞向其亚型的分化可能就存在多个分支。

自2014年以来,TI的各种算法得到飞速发展,至2018年已有接近60种方法。

降维的方法包括线性降维PCA,ICA等,和非线性降维TSNE,UMAP,DF等。在学习轨迹分析之前,先来了解两种之前接触的比较少的降维方法:ICA和DF。

ICA是数据结构的一种方法(A method for decomposing the data)。 monocle1使用的就是ICA方法。

ICA与PCA比较类似,PCA(对高斯分布的数据效果较好)是将高变基因分配到主要的主成分中,用主成分来进行后续分析。而ICA是将数据解构,从混杂的信号中分离原始的多个生物信号。

PCA和ICA的区别:
主成分分析假设源信号间彼此非相关,独立成分分析假设源信号间彼此独立。
主成分分析认为主元之间彼此正交,样本呈高斯分布;独立成分分析则不要求样本呈高斯分布。

总结:ICA和PCA一样,是一种线性降维方法。常被用于评估数据的原始组成。在ICA中,这些原始信号被认为是互相独立的,而且,ICA会先假定单细胞数据是非高斯分布的,实际上往往不是这样。不同的信号在ICA分析中同等重要,但ICA不能确定实际有多少个信号源。

Diffusion maps是一种非线性降维方法。
Diffusion maps原理讲解视频: https://www.bilibili.com/video/av38891467/

Diffusion Map用的是Diffusion Process的方法。如果两个点距离较近,则从一个点随机行走到一个点的概率就大。反之,如果两个点距离较远,则从一个点随机行走到一个点的概率就小。Deffusion Map就是这样将两个点之间的距离转换成它们之间能够产生随机行走的概率 ,并用这个随机行走的过程去捕捉数据的neighborhood结构,从而将一个高维的扭曲的数据展开,变成一个低维的visualization。

简单来说,为了把可能性转化成距离,DM可以计算B到C的可能性,再计算A到C的可能性。根据公式,如果两种可能性差不多大,那么他们的差值就趋于0。说明A到B的过程可以通过C来很好的连接起来。

DM是一种非线性降维(UMAP和tSNE也是非线形降维)。点和点之间(也就是细胞和细胞之间的距离)是通过probability来计算的。

在学习了ICA和DM两种降维方法后,现在我们想要建立细胞之间的关系,定义轨迹应该从哪里开始,在哪里结束。

举个例子:下图中有很多点,每个点之间的距离都可以计算(比如使用DM来计算点和点之间的possibility)。将点连线,寻找一个 所有的点之间距离加和最小的连接方式 ,得到的结果如黑色的粗线所示,这就是 最小生成树 。细胞数目越多,MST的轨迹构建越准确。

monocle1中使用的就是这种方式。 如下图a:每个细胞都代表了高维空间中的一个点,将高维空间降维(使用PCA/ICA或UMAP/TSNE),随后使用MST定义细胞轨迹,并将细胞按照MST构建的生成树排序,标注上细胞类型,就可以得到细胞轨迹。

但值得注意的是,MST只能构建细胞轨迹,但不能告诉你端点是转录起始点还是终止点,也就是不知道是从哪个方向向哪个方向分化。所以如果有先验知识(比如干细胞向别的细胞分化),就会容易很多。
此外,由于MST没有循环,所以不适用于增殖细胞(细胞周期)样本。

第二种方法叫做反向图嵌入。
如下图A和B:在使用MST进行轨迹推断时,由于最小生成树高度依赖于每个点的位置和点与点之间的距离,仅仅只是某个点的位置有些微变化就会得到完全不同的细胞轨迹。而REG的方法(图C)则是先对细胞进行聚类,再对细胞群的平均值进行轨迹构建。

Monocle2中使用的就是RGE方法(DDRTree)。

上图显示的是RGE的工作原理。每个细胞都代表了高维空间中的一个点,使用PCA或其他方法来对细胞进行降维后,根据假定的细胞cluster的中心点来对轨迹进行构建。随后计算细胞到假设轨迹的距离,并将细胞分配到距离细胞最近的轨迹cluster上,分配完成后对中心点进行更新,重建轨迹,再将二维轨迹投射到多维空间里,比较与原始数据的契合度,如果match的不好,就重新降维和构建轨迹,循环这个过程,直到细胞轨迹能充分反映原始data(类似降维中的TSNE和UMAP循环)。这时就可以选择轨迹的root(需要先验知识),并对拟时间轴或者发育轨迹进行定义。根据轨迹图中的分叉,还可以定义cell fate。

REG还衍生出了许多方法,比如PAGA、Slingshot、TSCAN、CellRouter等。

Monocle3进行聚类的原理与Monocle2类似
Monocle3的工作流程:scRNAseq数据 --> 预处理(标准化+PCA)--> 降维 --> 聚类 --> 拟时间轴的建立(DDRTree、SimplePPT、L1-graph)--> 差异分析

和Monocle2相比,Monocle3的主要update:

RNA velocity是基于真实的转录动力学,可用于细胞基因表达的动态分化的研究。

如上左图,刚转录出的mRNA包含外显子和内含子,经过splicing切除内含子后,得到用于编码蛋白的spliced mRNA。spliced mRNA的丰度由未成熟mRNA的splicing速度和降解速率共同决定。如上中图:每个点代表一个细胞,在拟时间轴上,未经过剪切的mRNA的出现始终早于经过剪切的mRNA。如上右图:红色代表未经过剪切的mRNA,蓝色代表经过剪切的mRNA,可以看出,这些细胞的应该是从左往右分化的,因此Velocity可以用于定义轨迹的起点分支和终点。也就是说,Velocity可以在不知发育过程的前提下,预测谱系的方向(如下图)。

Velocity可以用于周期的轨迹

Which method should I use?




单细胞系列课程-10 Trajectory inference analysis of scRNA-seq data...
每个细胞都代表了高维空间中的一个点,使用PCA或其他方法来对细胞进行降维后,根据假定的细胞cluster的中心点来对轨迹进行构建。随后计算细胞到假设轨迹的距离,并将细胞分配到距离细胞最近的轨迹cluster上,分配完成后对中心点进行更新,重建轨迹,再将二维轨迹投射到多维空间里,比较与原始数据的契合度,如果match的不好,就重...

高中生物中关于细胞学的知识点有哪些?
细胞学是生物学的一个重要分支,主要研究细胞的结构、功能和生命活动。在高中生物课程中,关于细胞学的知识点主要包括以下几个方面:1.细胞的基本概念:细胞是生物体结构和功能的基本单位,是生命活动的场所。细胞具有相对独立的自主性,能够进行生长、繁殖、代谢等生命活动。2.细胞的形态和结构:细胞有多...

细胞生物学实验技术内容提要
这部实验教材由中国海洋大学海洋生命科学实验教学中心精心编撰,作为其系列教材的一部分。它以细胞生物学教学大纲为基石,同时融入了海洋特有的元素,旨在提供一个全面的教育平台。它不仅涵盖了基础型实验,还包含了综合性和创新性的实验内容,旨在满足不同层次教育的需求。教材适用于全国综合性大学、师范院校、...

通过学习《细胞生物学》这门课有何心得体会,在你生命活动中有何作用_百...
1、细胞通讯:细胞的生命活动是由通讯引发的一系列生理活动现象。细胞通讯有三种方式:通过信号分子传递信息、通过相邻细胞表面分子的黏着相联系、通过细胞与胞外基质的黏着发生关系。其中通过信号分子的细胞通讯是主要的方式,也是发现最早研究最深入的细胞通讯。信号分子按组成分有激素、局部介质和神经递质三种...

医学细胞生物学复习纲要和练习内容简介
这本《医学细胞生物学复习纲要和练习》是根据卫生部高等医药院校教材编审委员会制定的《医学细胞生物学》教学大纲,结合浙江大学的《医学细胞生物学》精品课程系列教材编写的。它旨在帮助学生全面理解和掌握这门课程的内容。书籍结构分为四部分:教学大纲、重点内容概要、习题和参考答案。教学大纲将知识点分为...

细胞生物学与遗传学:医学知识记忆与考试一点通内容简介
本书是系列丛书中的一员,专注于细胞生物学与遗传学的教育。它以增强学生学习体验和记忆为目标,精心设计内容,旨在使枯燥的专业知识变得生动有趣。通过图表、趣味元素、联想、对比和口诀等方法,将复杂的课程内容和知识点进行系统化归纳和总结,使之易于理解,从而提升学习效率,实现高效学习。在版式设计上...

高一上册生物走进细胞教学反思
新的课堂理念不仅是新课程的标志,也是新课程实施的系列环节的方向标。只有教师细细地揣摩,认真领会新的课堂理念,才能将其渗透到教学过程的各环节。 今年我第一次接触到新课标,我积极参与新课标学习,信心百倍地给学生上《走进细胞》的第一节。从生物圈到细胞这一节的教学目标有两个:一是生命活动离不开细胞;二是...

生物必修1 2 3的完全知识点~谁可以给我??
而老教材P72第一句话就直截了当告诉我们细胞呼吸包括有氧呼吸和无氧呼吸两种类型。再比如说P104探究“环境因素对光合作用强度的影响”,也是通过一系列实验,让学生自己探索出提高农作物光合作用强度的有效而实用的措施。而老教材P57是以小字体形式直接告知。(三)高中生物课程标准和老教材教学要求的比较分析(人教版)高中...

细胞培养论文范文
细胞培养论文篇一 细胞工程课程教学改革初探 细胞培养论文摘要 摘要 细胞工程是我国本科院校生物技术专业的一门专业必修课。针对该课程特点,本文从优化理论教学和强化实践教学等方面进行了积极的探索,以便为细胞工程课程的教学改革提供参考。 细胞培养论文内容 关键词 生物技术 细胞工程 教学改革 中图分类号:G424 文...

生物科学专业课程设置
是现代生物技术发展的基石。10. 生态学:关注生物与环境的相互作用,对生物多样性和环境保护具有重大意义。实践性教学环节同样不可或缺,野外实习让学生亲身体验生物环境,提升实践能力;毕业论文则要求学生独立进行科研项目,锻炼科研素养,一般课程实践时间安排在10至20周之间,确保理论与实践的深度融合。

大田县13766153922: 单细胞生物的形态结构和生命活动特点 -
霍妮全达: 解:单细胞生物虽然只由一个细胞构成,但也能完成营养、呼吸、排泄、运动、生殖和调节等生命活动.如草履虫的一系列生命活动可以通过细胞的一些结构来完成,如图所示:故答案为:单细胞生物只由单个细胞组成,而且经常会聚集成为细胞集落.单细胞生物个体微小,营养、呼吸、排泄、运动、生殖和调节等全部的生命活动都在一个细胞内完成,一般生活在水中.

大田县13766153922: 单细胞测序知多少 -
霍妮全达: 类基组计划测单倍体基组现代遗传家认,约3万基,发现所类基并搞清其染色体位置,破译类全部遗传信息.类基组计划美科家于1985率先提,程像步行式画北京海路线图.打比,张命图绘,30亿碱基构类基组精确测序.随着类基组逐渐破译,基...

大田县13766153922: 人类进化顺序 -
霍妮全达: 单细胞--无脊椎动物(三叶虫)--脊椎动物--哺乳类(脊椎动物演化为鱼类 两栖类 爬行类 鸟类和 哺乳类,人由哺乳类进化而来)--灵长类--古猿--直立人种--智人

大田县13766153922: 作业:简述细胞原代培养的过程. -
霍妮全达: 这个具体得分抄什么组织(一个子一个字打出来的..累死我了)1、一般取出组织之后,先要对组织块进行修剪,去除有害物袭质.以鸡胚为例,取出鸡胚之后,去除头部和内脏,用BSS也进行清洗两次.2、将组织进行剪碎处理,加入一2113定量的胰酶5261进行消化,多放入37°二氧化碳培养箱中静止5分钟左右.3、轻轻的倒掉上清液,并加入一定量的DMEM溶液.4、用纱布进行4102过滤,滤除大的组织块,一般纱布至少六层以上.5、直接将过滤后1653的细胞液,进行率为的处理之后,然后直接分装到培养瓶中,放入培养瓶中进行培养即可.

大田县13766153922: 举出10种单细胞生物,10种细菌,10种真菌 -
霍妮全达: 单细胞生物:绿眼虫 大变形虫 太阳虫 间日疟原虫 草履虫 小瓜虫 钟虫 车轮虫 沙壳虫 球房虫 细菌:幽门杆菌 肺炎双球菌 苏云金杆菌 破伤风杆菌 大肠杆菌 肉毒梭菌 伤寒杆菌 结核杆菌 痢疾杆菌 金黄色葡萄球菌 真菌:白僵菌 青霉 酵母菌 曲霉 蘑菇 灵芝 黑根霉 火丝菌 木耳 银耳

大田县13766153922: 单细胞生物列举10种 -
霍妮全达: 草履虫,眼虫,绿藻,变形虫,披发虫,团藻,间日疟原虫,夜光虫,锥虫,领鞭毛虫

大田县13766153922: 关于单细胞与多细胞生物 -
霍妮全达: 在动物界里除了单细胞动物外,其余都是多细胞动物.从单细胞到多细胞是生物从低级向高级发展的一个重要过程,代表了生物进化史上一个极为重要的阶段.一切高等生物虽然都是多细胞的,但发展是不平衡的.动物的发展水平远远高于植物...

大田县13766153922: 单细胞动物有排泄系统吗细胞有排泄系统吗对于单细胞动物的任何研究可以用系统二字吗?细胞属于微生物吗 -
霍妮全达: 所谓系统,对于人体而言,是由一系列器官组成的,一个器官中有很多的细胞,一个系统又有许多器官,所以对于单细胞生物来说,是没有系统的,也不能用系统二字. 微生物是指个体微小,形态简单的生物,单细胞生物属于微生物,但如果说某一种多细胞动物的一个细胞,则不能说是微生物.

大田县13766153922: 初一上册生物难点 -
霍妮全达: 七年级生物复习提纲(上册)第一单元 生物和生物圈一、生物的特征:1、生物的生活需要营养 2、生物能进行呼吸 3、生物能排出体内产生的废物4、生物能对外界刺激做出反应 5、生物能生长和繁殖 6、由细胞构成(病毒除外)二、调查的一...

大田县13766153922: 单细胞生物是怎样繁殖下一代的 -
霍妮全达: 通过细胞分裂进行系列,称为分裂生殖,不一定是有丝分裂,因为单细胞生物有很多是原核生物.

本站内容来自于网友发表,不代表本站立场,仅表示其个人看法,不对其真实性、正确性、有效性作任何的担保
相关事宜请发邮件给我们
© 星空见康网