几种推测cdna编码的蛋白质的方法

作者&投稿:晏熊 (若有异议请与网页底部的电邮联系)
~ 利用互联网预测cDNA蛋白质产物的结构和功能3

王涤平综述 童坦君审校

(北京大学医学部生物化学与分子生物学系 北京100083)

摘要 人类基因组计划预计近两三年内即可完成,我们将会得到许多序列已知但未知功能的cDNA。本文简单介绍利用互联网上信息资源分析cDNA序列和预测它所编码的蛋白质的结构和功能的方法和常用工具。

关键词 互联网,cDNA,蛋白质,结构和功能预测

The protein product of cDNA:Predicting its structure and function using internet

W ANG Di2Ping,T ONG T an2Jun

(The H ealth Science Center,Peking Univer sity,Beijing100083,P.R.China)

Abstract The Human G ene Project will be completed in tw o or three years,biologist will obtain many cDNA sequences which functions are unknown.This article introduces s ome methods and tools in internet,by which we can analysis cDNA sequences and predict the structure and function of the proteins that are coded by them.

K ey w ords internet,cDNA,protein,structural and functional prediction

  人类基因组计划(Human G ene Project,HG P)进展非常迅速。1999年11月人类第22条染色体的测序全部完成,这是第一条完整测序的染色体[1]。2000年5月人类第21条染色体的测序也宣布完成[2]。到1999年底约有1P3的基因组序列已经测出,目前保守估计不迟于2003年底将全部完成,人类即将步入后基因组时代。(编者注:本文发排时HG P已全部完成)。然而HG P只是一个以测序为主的结构基因组学的研究,该计划完成之后的任务更加艰巨,要阐明整个基因组基因的功能可能是21世纪整个生物学界的中心任务。为了阐述新基因的功能,科学家已经提出了功能基因组学(functional genomics)、转录子组学(transcriptomics)、蛋白质组学(proteomics)的概念。但是目前由于各方面技术的限制其速度远远跟不上潮水般涌现的新基因的步伐。近年来cDNA 克隆和测序工作进展也很快,一方面短序列片段(EST)在数据库中大量涌现,另一方面越来越多的全长cDNA得以克隆和测序,许多新型cDNA文库也被大量构建,极大地扩展了cDNA文库的应用。这样,分子生物学工作者经常会遇到一个问题:在获取一条cDNA部分或全长序列后如何判断它是属于已知或未知的某个基因、如何知道它所编码的蛋白质的结构和功能。随着计算机网络技术和生物信息学的飞速发展,利用互联网上生物信息资源对cDNA序列及其蛋白质产物的结构和功能进行分析和预测已经成为一个快速、简单可行的方法。1 常用序列数据库

G enBank由NC BI(美国国立卫生研究院生物技术中心)创建并管理,是NC BI众多数据库中最重要的一个,能提供超过55000种不同生物的所有已知的核酸及蛋白质序列和相关文献及生物学注释[3]。它与E M BL P E BI(欧洲分子生物学实验室P欧洲生物信息学研究所)的E M BL数据库及日本国立遗传学研究所的DDB J数据库是最主要的3家DNA和蛋白质序列数据库。它们分别收集各自所在区域的序列信息,每天交换各自数据库新建立的记录,每隔两三个月完整地更新一次数据库信息,这样就保证了它们几乎包括了所有已知的核酸及蛋白质序列。dbEST数据库是G enBank的一部分,它包含了cDNA片段或EST的序列数据和其它相关信息。为了管理重复的EST数据和便于信息的提取,NC BI创建了Unigene系统,它能自动地将G enBank中包括EST序列在内的DNA序列进行系统分析,形成无重复的同一基因起源的序列簇(gene2oriented clusters),每一个簇代表一个基因。NC BI现有人类、大鼠和小鼠三个Unigene库。至1999年末在人类的Unigene库中包含有超过150万个EST所形成的约83000个序列簇[4]。G S DB(G enome Sequence Database)是由NCG R(Na2 tional Center for G enome Res ources)创建管理的基因组数据库。从1999年秋开始G S DB不再接受个人实验室递交的数据,数据库的所有权转交给了G enBank。目前G S DB仍然能够提供

3国家自然科学基金重点项目(项目号39930170)与国家重点基础研究发展规划(项目号G2000057001)资助课题



7

4

1



生物技术通讯

LETTERS I N BI OTECH NO LOGY V ol.12 N o.2 May2001

© 1995-2005 Tsinghua Tongfang Optical Disc Co., Ltd. All rights reserved.

序列分析和查询服务。G DB (G enome Database )是约翰・霍普金斯大学医学院的人类基因组数据库,它包括人类基因组各方面的信息如基因、克隆、断裂位点(breakpoints )、细胞遗传学标志、脆弱位点、EST 、重复序列和重叠群,另外还有人类基因组图谱、基因组突变多型性以及等位基因组频率数据的信息。

PIR (Protein In formation Res ource )和SWISS 2PROT 因收录全

面、注释详尽、重复率低和与相关数据库的广泛连接等特点而成为最常用的蛋白质序列信息综合数据库。SWISS 2PROT 创建于1987年,现在由E M BL 和SI B (瑞士生物信息学研究所)联合管理,到1999年11月SWISS 2PROT 已有约81000条序列。在SWISS 2PROT 中每个序列条目下都有参考文献、分类数据和相关注释的信息,这些信息主要包括蛋白质的功能、翻译后修饰、结构域和位点、二级和四级结构、与其它蛋白质的同源性、相关疾病及序列变异等方面的信息。由于核酸序列爆炸性的增加而数据库的注释速度有限,E M BL 和

SI B 在1996年推出了SWISS 2PROT 的补充数据库T rE BM L ,T rE BM L 是由计算机将E M BL 数据库中除了编码SWISS 2PROT

中已有序列以外的所有编码序列(C DS )翻译并注释而形成的,所以其注释的准确性比SWISS 2PROT 低

[5]



现在互联网上生物信息数据库种类繁多,可谓五花八门,除上述的大的综合性数据库外还有许多专业方向特异的数据库如RNA 、酶、载体、转录因子、翻译信号及各种物种的数据库等等。由于生物信息学数据库的急剧增多,专门收集生物信息学数据库目录的数据库也应运而生。Dbcat (http :P P

w w w.in fobiogen.fr P services P dbcat )有500个按不同领域(DNA 、RNA 、蛋白质、文献等)分类的生物学数据库以供检索。E BI P E M BL 新推出的SRS (Sequence Retrieval System )5.1版中也增

添了DAT ABANK S 数据库,其中含有约1300个生物学数据库,用户进入SRS 的主页(http :P P w w w.ebi.ac.uk P )选择“SRS

W orld Wide ”后即可检索DAT ABANK S

[6]



2 全长cDNA 的获取

在进行序列分析和结构功能预测时最好能利用全长

cDNA 序列。若只有部分cDNA 序列或EST 片段,传统方法

是通过RACE 法或重新筛选新的cDNA 文库。简单快捷的方法是通过硅片克隆(sililo cloning )的方法拼接出cDNA 全长。基本过程如下:从EST 开始利用同源性比较工具(BLAST 、

FAST A 等)在公共EST 数据库(如dbEST )中找出高度同源的EST ,通过EST 拼接,形成重叠群(contig ),然后将重叠群再次

进行BLAST 拼接直到没有新的重叠群发现即得到了完整的编码框。进入Unigene 数据库中只要输入EST 登录号就可以得到属于同一转录起始位点的其它序列。欲直接得到EST 簇及其重叠群可以登录T igem 网站(http :P P gcy.tigem.it P cgi 2

bin P uniestass.pl )的EST assembly machine ,利用EST 拼接程序(EST assembly program )即可。同样的程序还有ESTblast ,它更

为复杂和完善,该程序在HG MP 2RC (human genome mapping

project )服务器(http :P P w w w.hgmp.mrc.ac.uk P ESTblast P )上可以

提供。将含重叠群的EST 与数据库反复比较延伸就可能获得cDNA 全长。利用它就可以进一步进行序列分析和结构与功能预测。在得到cDNA 全长后就可以将其序列或数据库位名输入相应数据库或服务器进行检索、查询相关注释和预测其编码的蛋白质的结构和功能。在ESTblast 输出结果的界面上有与这些数据库和程序的超级链接,使用极为方便[7]。

3 网上序列分析和基因定位的工具

当得到一个完整的cDNA 序列后首先要进行对序列数据库的类似性检索,以鉴定是否为新基因及对基因的结构、定位及其编码的蛋白质的结构、功能进行研究。NC BI 的

BLAST 是目前广泛应用的同源性比较工具。BLAST 有5个

应用程序:Blastp 、Blastn 、Blastx 、tBlastn 、tBlastx ,应依照所需检索的和所检索的数据库是核酸或氨基酸序列及阅读框架的不同而使用,具体见表1。值得一提的是尽管许多服务器能把核酸与氨基酸序列互相转换,但是若已知氨基酸序列最好用氨基酸序列进行分析。因为DNA 序列存在阅读框架和非编码区等问题,而且氨基酸种类多,特异性识别容易。

BLAST 能对十几种指定的数据库(包括nr 、dbSTS 、dbEST 、PDB

等)进行比较。BLAST 的新版本有G apped BLAST 、PSI 2BLAST

(P osition S pecific Iterated BLAST )、BLAST 2sequences 、PHI 2BLAST (Pattern Hit Initiated BLAST )。与传统的BLAST 比较,G apped BLAST 允许在序列对排(alignment )中有部分插入或缺失,有

利于得到较大的同源片段,同时运行速度也提高了。PSI 2

BLAST 首先进行一次传统的BLAST 搜索产生序列对排从而

构建一个位置特异的轮廊(profile ),然后用此轮廓的矩阵

(matrix )代替起初的序列进行同源性搜索。PSI 2BLAST 大大

提高同源性搜索的敏感性,有助于发现蛋白质家族中的变异成员和确定新基因的功能[8]。BLAST 2sequences 通过产生一个代表序列对排的点状图(dot 2plot )来显示两个DNA 或肽序列之间的相似性。PHI 2BLAST 要求将所需查询的氨基酸序列和相应的模体一起输入,能够获得序列和结构都相对应的序列对排。另外,FAST A 和SSE ARCH 也是相似性比较程序,与BLAST 相比运行速度慢一些但效果更好。

Locus Link (http :P P w w w.ncbi.nlm.nih.g ov P Locus Link P )和RefSeq (http :P P w w w.ncbi.nlm.nih.g ov P Locus Link P reseq.html )是NC BI 新提供的方便快速的获取基因及其产物的详细信息及

基因定位的服务器。用户可以通过多种途径(基因的名称、缩写及序列等)搜索数据库就可以得到相应基因的LocusI D

(数据库位名)、简述及染色体定位。点击LocusI D 即能得到

关于该基因的更为详尽的说明,更方便的是每个基因都与P

(PubMed )、O (OMI M )、R (Refseq )、G (G enBank )、U (UniG ene )、V (dbS NP )数据库相连接,以利进一步查询和分析。其中Refseq

能提供该基因的名称、G enBank 中的I D 、详细的说明和所编码蛋白质的信息,并与相应的蛋白质数据库相链接[10]。



841・生物技术通讯

LETTERS I N BI OTECH NO LOGY  V ol.12 N o.2 May 2001

表1 BLAST的5种程序[9]

程序查询序列数据库比较    用 途

blastn blastp blastx tblastn tblastx DNA

蛋白质

DNA

蛋白质

DNA

DNA

蛋白质

蛋白质

DNA

DNA

DNA水平

蛋白质水平

蛋白质水平

蛋白质水平

蛋白质水平

寻找同源DNA序列和剪接模式

发现同源蛋白质

分析新DNA以寻找同源基因和蛋白质

在未注释的DNA中寻找基因

发现基因结构

4 蛋白质结构分析和同源性模建

PDB(Protein Data Bank)是由BN L(Brookhaven National Lab2 oratories)建立的蛋白质结构数据库,1998年10月管理权移交给了RCS B(Research C ollaboratory for S tructure Bioin formatics)。现在PDB除收集蛋白质和多肽的三维结构外,还收集酶、病毒、碳水化合物和核酸的晶体结构数据。新的PDBsum内容更加广泛,是几乎所有核酸和蛋白质结构数据的总集[11]。虽然Marcotte和Enright分别提出通过综合进化相关、表达类型、代谢途径以及复合物结构之间的联系和结构域融合的方法来分析和预测蛋白质功能的新方法[12,13],网上常用蛋白质结构和功能分析方法的基础仍然是依据氨基酸序列的相似性,通过结构域和模体的比较进行分析。PROSITE、P fam、BLOCK S、PRI NTS是常用的结构域或模体数据库。PROSITE 收集的是有生物学意义的蛋白质模型和序列对排。P fam收录了一系列的多重序列对排和H M M(Hidden Markov M odel)模型。BLOCK S存储的是模体和profiles。PRI NTS是收集蛋白质家族指纹(fingerprint)的数据库,指纹是指一群模体的线性整合,运用它来比较、运算比单个模体更准确有效[14]。C ATH 也是一个蛋白质分类数据库,它把蛋白质按不同等级水平分成Class、Architecture、T opology、H om olog ous(C ATH)超家族。SC OP(S tructural Classification of Proteins database)按照家族、超家族、普通折叠和类分层次地组织蛋白质结构数据。SC OP BLAST2sequences现在可以通过以下途径检索:其一是通过浏览SC OP的树状分类结构;其二是利用氨基酸序列检索;其三是关键词检索;其四是通过PDB identifier,最后也可以通过PDB收录或出版的日期检索[15]。

从结构数据库中检索得到的只是原子坐标数据,必须用图像显示软件才能将三维结构呈现出来。RAS M O L是常用的显示蛋白质三维结构的软件之一,利用它可以显示各种不同的图像,包括棍棒、空间填充、α2碳原子骨架折叠和带型等等,各部分可以单独或组合显示,原子、亚基、残基可以着色,图像可以旋转,结果可以存盘。2000年8月最新推出的Pro2 tein Explorer(PE)是从RAS M O L的基础上发展而来,功能更加强大、使用起来更加方便、图像更加形象直观、具有更多的解释说明。两者均可以从RAS M O L主页免费下载后安装在用户的计算机上使用。其它如M AGE和NC BI的C D3n也是很好的三维结构显示软件,也可以从相应的站点下载。了解蛋白质的四级结构对于完整地理解蛋白质的结构和功能是十分必要的,蛋白质四级结构预测服务器PQS能提供PDB中所有蛋白质可能的四级结构的信息[16]。ExPASy服务器是瑞士日内瓦大学开发的专家蛋白分析系统。它可以进行几乎所有的蛋白质序列分析作业,包括理化特性分析、氨基酸组成和分子量分析、序列统计学分析、序列类似性检索、双重和多重序列对排、模式和位点分析、二级结构预测及跨膜区和蛋白质定向的预测。

S wiss2M odel是一个能自动进行蛋白质模型构建的服务器,它能把用户输入的氨基酸序列根据序列同源性模拟构建成蛋白质模型。由于运算系统仍然有许多难以克服的缺陷,并不是所有模建都能得到完美的结果,特别是在靶蛋白质与模板序列之间的相同率较低的区域。事实上,当相同率低于40%时预测的准确率很低。因此,S wiss2M odel提供了两种模式供用户选择。First Approach m ode界面简单,只有当靶蛋白质与模板序列之间的相同率大于25%时自动模建过程才能进行,否则结果将完全不可靠。这时就应选择Optimise m ode,它能修正和优化第一种模式的结果。模建过程一般需要15~60分钟,模建结果(包括最后模型的原子坐标及3D2 profiles)将通过电子邮件发送给用户。需要提醒的是任何一种模建方法的结果都是非实验性的,与该蛋白质的真实结构可能会有出入[17]。

网上各种数据库数据来源不同、丰度不一、数据分类处理方法各异,服务器计算方法也不尽相同,它们各具优缺点,同一序列通过不同数据库或服务器往往会得到不尽相同的结果[18]。因此最好先根据所需信息的类型选择合适的数据库和程序,另外尽量多用几个不同数据库和程序以获取最准确的信息。表2是一些常用的生物学数据库和服务器的网址。虽然生物信息学的方法能预测基因及其蛋白质产物的结构、功能和定位,但是所有预测在未被实验证实以前都是不可靠的。因此必须把二者有机地结合起来,在生物信息学方法提供的信息的基础上指导实验设计,实验所得结果才是最准确的。



9

4

1



王涤平等:利用互联网预测cDNA蛋白质产物的结构和功能

表2 常用的生物学数据库和服务器的网址

数据库或服务器

     网  址

G enBank http :P P w w w.ncbi.nlm.nih.g ov P W eb P G enbank P E M BL http :P P w w w.ebi.ac.uk P DDB J http :P P w w w.nig.ac.jp P

G S DB http :P P w w w.ncgr.org P tdb P tdb.html Unigene http :P P w w w.ncbi.nlm.nih.g ov P Unigene P G DB http :P P w w w.gdb.org

PIR

http :P P w w w.gdb.nbrf.georgetown.edu P pri P SWISS 2PROT P T rE M BL http :P P w w w.expasy.ch P sprot PDB http :P P w w w.rcsb.org P pdb P

PDBsum http :P P w w w.biochem.ucl.ac.uk P bsml P pdbsum P PROSITE http :P P w w w.expasy.ch P prosite P P fam http :P P w w w.sanger.ac.uk P s oftware P P fam P BLOCK S http :P P w w w.blocks.fhcrc.org

PRINTS http :P P w w w.biochem.ucl.ac.uk P bsm P dbbrower P PRINTS P printscontents.html SCOP http :P P w w w.mrc 2lmb.cam.ac.uk P scop P CATH http :P P w w w.biochem.ucl.ac.uk P bsm P cath P BLAST http :P P w w w.ncbi.nlm.nih.g ov P BLAST P FAST A http :P P w w w2.ebi.ac.uk P fasta3P SSE ARCH http :P P sss.stan ford.edu P sss P

RAMS O L http :P P w w w.umass.edu P microbio P rasm ol P

SWISS 2M ODE L http :w w w.expasy.ch P swissm od P SWISS 2M ODE L.html ExPaSy http :P P expasy.hcuge.ch P PQS

http :P P w w w.pqs.ebi.ac.uk P

参考文献

1 Dunham I ,Shimizu N ,P oe BA et al .The DNA sequence of human

chrom os ome 22.Nature ,1999,402:489

2 H ottori M ,Fujiyama A ,T aylor T D et al .The DNA sequence of human

chrom os ome 21.Nature ,2000,405:311

3 Bens on DA ,K arsch 2M izrachi L ,Ostell J et al .Nucleic Acids Res ,

2000,28:15

4 Wheeler D L ,Chsppey C ,Lash AE et al .Nucleic Acids Res ,2000,28:

10

5 Bairoch A ,Apweiler R.The SWISS 2PROT protein sequence database

and its supplement T rE M BL in 2000.Nucleic Acids Res ,2000,28:456 K reil DP ,E tzx old T.DAT ABANK S 2a catalogue database of m olecular

biology databases.T rends Biochem S ic ,1999,24:155

7 Banti S ,G u ffaniti A ,Borsani G.H ow to get the best of dbEST.T rends

G enetic ,14:81

8 Altschul SF ,K oonin E V.Iterated profile searches with PSI 2BLAST 2a

tool for discovery in protein databases.T rends Biochem Sci ,1998,23:358

9 Brenner SE.Practical database searching.T rends G uide to Bioin format 2

ics (T rends suppl ),1998,910 Puitt K D ,K atz K S ,S icotte H et al .Introducing Refseq and Locuslink :

curated human genome res ources at the NC BI.T rends G enetic ,2000,16:44

11 Puitt K D ,K atz K S ,S icotte H et al .Introducing Refseq and Locuslink :

curated human genome res ources at the NC BI.T rends G enetic ,2000,16:44

12 M arcotte E M ,Pellegrinim M ,Thom ps on M J et al .A combines alg o 2

rithm for genome 2wide prediction of protein function.Nature ,1999,402:83

13 Enright A J ,Illopoulos I ,K yrpides NC et al .Protein interaction maps

for com plete genomes based on gene fusion events.Nature ,1999,402:86

14 Attw ood TK,Croning M DR ,Flower DR et al .PRINTS 2S :the database

formerly known as PRINTS.Nucleic Acids Res ,2000,28:22515 C onte LC ,Ailey B ,Hubbard T JP et al .SCOP :a structural classifica 2

tion of proteins database.Nucleic Acids Res ,2000,28:257

16 Henrick K Thornton JM.PQS :a protein quaternary structure file server.

T rends Biochem ,Sci ,1998,23:358

17 G uex N ,Diemand A ,Peitsch MC.Protein m odeling for all.T rends

Biochem Sci ,1999,24:364

18 Bouck J ,W ei Y u ,G ibbs R et al .C om paris on of gene indexing databas 2

es.T rends G enetic ,1999,15:159

(2000209225收稿)



051・生物技术通讯LETTERS I N BI OTECH NO LOGY  V ol.12 N o.2 May 2001


5.9
百度文库VIP限时优惠现在开通,立享6亿+VIP内容
立即获取
利用互联网预测cDNA蛋白质产物的结构和功能
利用互联网预测cDNA蛋白质产物的结构和功能3

王涤平综述 童坦君审校

(北京大学医学部生物化学与分子生物学系 北京100083)

摘要 人类基因组计划预计近两三年内即可完成,我们将会得到许多序列已知但未知功能的cDNA。本文简单介绍利用互联网上信息资源分析cDNA序列和预测它所编码的蛋白质的结构和功能的方法和常用工具。

关键词 互联网,cDNA,蛋白质,结构和功能预测

第 1 页
The protein product of cDNA:Predicting its structure and function using internet

W ANG Di2Ping,T ONG T an2Jun

(The H ealth Science Center,Peking Univer sity,Beijing100083,P.R.China)

Abstract The Human G ene Project will be completed in tw o or three years,biologist will obtain many cDNA sequences which functions are unknown.This article introduces s ome methods and tools in internet,by which can analysis cDNA sequences and predict the structure and function of the proteins that are coded by them.

展开全文


怎样提纯编码某种蛋白质的cDNA,并用实验证明所克隆的cDNA是正确的?
不知你 的目的是什么,估计你应该是检测某种细胞或组织中是否表达这种蛋白!首先你得知道此种蛋白质的 核苷酸序列 ,从而设计 引物 ,然后提取此细胞中的总mRNA,依此引物进行 反转录 特异性扩增你需要验证的蛋白质 DNA序列 ,最后电泳检测,进行胶回收就可以纯化了!若要实验证明所克隆的cDNA是正确的,...

解释一下 cDNA、mRNA,EST,CDS,transcripts,gene的意义及其之间的关系...
由于cDNA文库的复杂性和测序的随机性,有时多个EST代表同一基因或基因组,将其归类形成EST簇(EST clusteF)CDS是Coding sequence的缩写,是编码一段蛋白产物的序列,是结构基因组学术语。参考资料:http:\/\/baike.baidu.com\/view\/212931.htm http:\/\/baike.baidu.com\/view\/548250.htm# ...

...为了在细菌细胞中表达真核生物的基因产物,为什么通常要用cDNA...
cDNA是用生物体的mRNA通过RT-PCR反转录而成的,cDNA在反转录过程中只能反转录出能够转录成mRNA的外显子,说明cDNA全部的核苷酸序列可以转录成mRNA并且成功翻译成蛋白质。。。

请问各位老师,cDNA和结构基因,编码基因,调节基因,调控基因这几个名次...
cDNA区别于后面,这个是RNA反转录得到的基因,最大特点是没有内含子。结构基因和调节基因联系记:前者转录翻译出组成人体组织蛋白质,后者转录翻译出调节体内生化反应蛋白质。编码基因与DNA编码链和模版链联系起来记。结构基因,调控基因联系到操纵子里面记。

cDNA方面的一些疑问
大肠杆菌、酵母、果蝇、灵长类等每种生物都有独特的8个密码子极少被利用[1]。有趣的是,灵长类和酵母有6个同样的利用率低的密码子。大肠杆菌、酵母和果蝇中编码丰度高的蛋白质的基因明显避免低利用率的密码子。因此,重组蛋白的表达可能受密码子利用的影响(尤其在异源表达系统中)的事实并不很奇怪...

解释CDS、cDNA、EST、mRNA、ORF间的区别?
(2)CAT(T在最右侧)(3)TGC(T在最左侧)本例中实际核酸编码的组合。这就是ORF三种框架的来源。实际上,DNA序列可以按六种框架阅读和翻译(每条链三种,对应六种不同的三联密码子)。所以,我们说ORF只是理论上的编码区,与真实的情景可能并不一样。而CDS是检查cDNA后得到的编码组合序列,和实际...

cDNA和gDNA区别
gDNA(genomic DNA,基因组DNA):是指有机体在单倍体状态下的DNA全部含量。广义的基因组也指某一体系(如核或细胞器)中的DNA,它包括编码或细胞中固有的核糖体DNA(rDNA)、线粒体DNA(mtDNA)、tRNA基因及其它RNA编码。cDNA:与RNA链互补的单链DNA,以其RNA为模板,在适当引物的存在下,由RNA与DNA进行...

反式比对方法注释蛋白质编码基因时不需要使用到全长的cdna
反式比对方法是一种用于注释蛋白质编码基因的生物信息学方法,其主要目的是将转录本序列与参考基因组序列进行比对,从而识别基因组中的转录本以及推断出其对应的蛋白质编码基因。反式比对方法在注释过程中并不需要使用全长的cDNA或转录本序列,而是依赖于经过修剪和标准化处理后的基因表达数据,如RNA测序(...

如何判断获得的某一真核生物cDNA序列是否为全长序列
全长序列的判断可以通过观察开头的启动子,最后的终止密码子等特征。当然最好的方法还是去NCBI上BLAST以下就知道了。

...分子生物生物学和基因工程技术获得该蛋白质的cDNAX序列
这样的题太扯淡了...想获得cDNA序列,首先抽提总RNA,然后用通用引物如PloyA,RT-pcr得到单链cDNA序列;根据蛋白质N短序列,反推可能的序列,以此设计一条上游引物;然后用这个引物和PloyA pcr得到双链cDNA;理论这样是可行的,实际完成应该时间挺长的。这种东西学起来有毛用啊...现在很多物种全基因序列...

田家庵区17175214798: 请设计几种方法分离蛋白质基因的cDNA -
祖骅橘红:[答案] 1)若是直接知道该蛋白质中氨基酸的序列,可以用来推测氨基酸中的碱基序列,并用化学合成仪直接合成该cDNA 2)用该基因转录出的mRNA进行逆转录 3)用鸟枪法直接从原核生物体内分离

田家庵区17175214798: 已知蛋白质的氨基酸序列,如何求出编码该蛋白的基因序列 -
祖骅橘红: 由于基因存在内含子和外显子翻译成mRNA时候得进行剪切连接除去内含子,减去的部分是无法推出.蛋白质序列反推只能得到cDNA,而且密码子有几个对应一个氨基酸,这个就更复杂了.

田家庵区17175214798: 请设计几种方法分离蛋白质基因的cDNA -
祖骅橘红: 1)若是直接知道该蛋白质中氨基酸的序列,可以用来推测氨基酸中的碱基序列,并用化学合成仪直接合成该cDNA2)用该基因转录出的mRNA进行逆转录3)用鸟枪法直接从原核生物体内分离

田家庵区17175214798: 克隆一个新基因,通常要对其编码的蛋白质进行功能预测,为什么 -
祖骅橘红: 克隆一个新基因,通常要对其编码的蛋白质进行功能预测,为什么 一般的研究思路(针对真核细胞蛋白):1. 克隆后,在细胞内过量表达,看有啥变化2. 检测不同细胞内的表达水平,设计RNAi, 在表达水平高的细胞内阻断该蛋白的产生.看有啥变化.3. 至于在大肠杆菌中的表达,是要研究蛋白质本身的性质,比如结构等,再用到.

田家庵区17175214798: 如何根据真核生物蛋白质氨基酸的一级结构获得其cdna -
祖骅橘红: 大致试验步骤:1、由氨基酸序列即蛋白质免疫反应得体2、再将抗体与胞内核糖体(上的蛋白质)结合3、将核糖体上的蛋白质和mRNA拆分4、由MRNA逆转录cDNA

田家庵区17175214798: 知道一小段基因组序列,怎么查这段基因的编码蛋白质和表达 -
祖骅橘红: 方法很多,随便说几个.第一,上ncbi检测有没有同源序列.第二,构建载体,转入过量表达看效果.第三,据此推测出蛋白序列,人工合成看效果.

田家庵区17175214798: 测定蛋白质一级结构的方法 -
祖骅橘红: 用PCR技术 可测其末端的氨基酸序列,设计引物cDNA,找出编码该蛋白质的DNA,排列出mRNA序列,按照三联密码的原则推演出氨基酸的序列.(目前的技术还无法直接测完整的大分子蛋白质,但DNA还是可以的)

田家庵区17175214798: 怎样提纯编码某种蛋白质的cDNA,并用实验证明所克隆的cDNA是正确的? -
祖骅橘红: 不知你的目的是什么,估计你应该是检测某种细胞或组织中是否表达这种蛋白!首先你得知道此种蛋白质的核苷酸序列,从而设计引物,然后提取此细胞中的总mRNA,依此引物进行反转录特异性扩增你需要验证的蛋白质DNA序列,最后电泳检测,进行胶回收就可以纯化了!若要实验证明所克隆的cDNA是正确的,只需对纯化的DNA进行测序就可以验证了!

田家庵区17175214798: 求教cDNA制备的一般方法 -
祖骅橘红: 参考:http://baike.baidu.com/view/60324.htm 一、制备用于克隆cDNA的mRNA1.Oligotex mRNA Kits (QIAGEN)法2.磁珠法分离mRNA注意:一般需要做mRNA完整性的检测(检查mRNA在无细胞翻译体系指导合成高分子量蛋白质的能力、...

田家庵区17175214798: DNA测序可以采用哪些手段,并阐述各自的原理 -
祖骅橘红: 1 cDNA 文库的构建 1.1 cDNA 文库构建的基本原理与方法 cDNA 文库是指某生物某发育时期所转录的全部 mRNA 经反转录形成的 cDNA 片段与某种载体连接而形成的克隆的集合.经典 cDNA 文库构建的基本原理是用 Oligo(dT) 作逆转录引物,...

本站内容来自于网友发表,不代表本站立场,仅表示其个人看法,不对其真实性、正确性、有效性作任何的担保
相关事宜请发邮件给我们
© 星空见康网