entrez gene数据库从哪些方面对基因进行注释

作者&投稿:初常 (若有异议请与网页底部的电邮联系)
基因组注释分析主要包括哪些内容~

基因组注释分析主要包括哪些内容
基因组注释包括以下方面的内容:

(1) 重复序列的预测。通过比对已知的重复序列数据库,找出序列中包含的重复序列,识别类型并转化为N或者X,统计各种类型重复序列的分布。

(2) 编码基因的预测。通过将转录组或EST数据比对到拼接后的基因组序列上,找出编码基因位置,预测编码基因结构。或者通过专业的外显子预测软件,预测编码基因的外显子结构。

(3) 小RNA基因的预测。通过比对已知的小RNA的数据库,或者通过生物信息(bioinformation)学软件预测,找出这些小RNA基因,并进行分类。

(4) 调控序列和假基因的预测。

基因功能的注释,使用的数据库包括NT/NR, SwissProt/TrEMbl, InterPro, KEGG, COG, Gene ontology等,使用比对的方法,如blast,找出同源相近的基因,并注释功能。

运用KEGG数据库查询某个基因注释到哪些通路
最简单,但是未必最有效的办法,但是最快
抽个样本,把你的目标基因打上标记,然后建立一个模型,比如决策树等等
模型质量不错的情况下跑全库,然后找出分类结果为你目标分类的记录

美国国立生物技术信息中心(National Center for Biotechnology Information),即我们所熟知的NCBI 是由美国国立卫生研究院(NIH)于1988年创办。
创办NCBI的初衷是为了给分子生物学家提供一个信息储存和处理的系统。除了建有GenBank核酸序列数据库(该数据库的数据资源来自全球几大DNA数据库,其中包括日本DNA数据库DDBJ、欧洲分子生物学实验室数据库EMBL以及其它几个知名科研机构)之外,NCBI还可以提供众多功能强大的数据检索与分析工具。
目前,NCBI提供的资源有Entrez、Entrez Programming Utilities、My NCBI、PubMed、PubMed Central、Entrez Gene、NCBI Taxonomy Browser、BLAST、BLAST Link (BLink)、Electronic PCR等共计36种功能,而且都可以在NCBI的主页www.ncbi.nlm.nih.gov上找到相应链接,其中多半是由BLAST功能发展而来的。


临潭县19160223181: entrez gene数据库从哪些方面对基因进行注释 -
弓琴乳酸: 美国国立生物技术信息中心(National Center for Biotechnology Information),即我们所熟知的NCBI 是由美国国立卫生研究院(NIH)于1988年创办.创办NCBI的初衷是为了给分子生物学家提供一个信息储存和处理的系统.除了建有GenBank...

临潭县19160223181: 怎样找到基因序列(请告诉详细步骤)O(∩ - ∩)O谢谢 -
弓琴乳酸: NCBI,若有序列号则直接输入查找.没有可以通过查找物种以及基因名称在NCBI中查找. 步骤:1.打开http://www.ncbi.nlm.nih.gov/sites/entrez 2. 上方有搜索条,默认为PUBMED,打开下拉菜单,选择Gene,在右侧输入"基因名称"AND"物种名称", 点击搜索 3. 如基因序列收录,应该在搜索结果里,找到点击打开 说的比较简单,如你没搜到,可以给我发消息

临潭县19160223181: genebank号和Entrez Gene号有什么区别 -
弓琴乳酸: Entrez Gene比genebank更加全面和先进.GenBank: GenBank是美国国家生物技术信息中心(National Center for Biotechnology Information ,NCBI)建立的DNA序列数据库,从公共资源中获取序列数据,主要是科研人员直接提供或来源于大...

临潭县19160223181: NCBI上的BGD什么意思?还有GI?是数据库吧? -
弓琴乳酸: 都是RefSeq的编号NW是gene的,XM是mRNA的,XP是protein的,详见 http://www.ncbi.nlm.nih.gov/books/bv.fcgi?highlight=xm&rid=helpgene.table.EntrezGene.T2 gi是序列(如gene,protein,mRNA...)存入NCBI数据库时顺序assign的一个数字,便于database管理和监控. 跟上面的那些没有关系 参考资料: http://www.ncbi.nlm.nih.gov/books/bv.fcgi?highlight=xm&rid=helpgene.table.EntrezGene.T2

临潭县19160223181: 简述NCBI Entrez系统的功能. -
弓琴乳酸: 集成信息检索:ENTREZ系统编辑本段回目录检索服务器可以对有目标的检索记录,但它主要的缺陷在于一次只能从一个数据库中检索到记录;想对一批数据库进行检索的用户必须为每一个目标数据库分别发出一次申请.很明显,这些大量的公...

临潭县19160223181: 能够用于tf - idf的语料库(python学习). -
弓琴乳酸: 您好,推荐使用CRAFT语料库 CRAFT(Colorado Richly Annotated Full-Text)语料库,中文名科罗拉多丰富语料注释库.CRAFT收录了97篇可公开获取全文的生物医学期刊文献,并将这些文章在语义和句法上都作了详尽的注释以作为自然语言处...

临潭县19160223181: ncbi基因组数据库包括了哪些文件 -
弓琴乳酸: NCBI对BLAST进行了全新的改版,推出了最新的web BLAST report.在最新的BLAST比对结果页面中,“图形化概要(Graphic Summary)”、“具体描述(Descriptions)”以及“序列比对(Alignments)”等部分页面都可以展开和收起....

临潭县19160223181: 如何在uniprot数据库中查找某个蛋白序列 -
弓琴乳酸: NCBI NCBI下有很多数据库,以下是蛋白质序列PopSet 包括研究1个人群、1个种系产生或描写人群变化的1组组联合序列.PopSet既包括核酸序列数据又包括蛋白质序列数据. Entrez 功能强大,在于它的大多数记录可相互链接,既可在同1数...

临潭县19160223181: NCBI的DNA序列数据库GenBank的介绍哪里有?生物学论坛哪些比较不错 -
弓琴乳酸: GenBank是美国国家生物技术信息中心(National Center for Biotechnology Information ,NCBI)建立的DNA序列数据库,从公共资源中获取序列数据,主要是科研人员直接提供或来源于大规模基因组测序计划( Benson等, 1998).为保证数据...

临潭县19160223181: 如何根据蛋白序列寻找SNP?
弓琴乳酸: 博凌科为-为你解答:以编码5-hydroxytryptamine (serotonin) receptor的HTR1A基因为例,先进入entrez,选择gene选项,在NCBI中搜HTR1A基因,到如下图界面,点基因缩略图,然后点 graphics.点击后的界面如下.这里已经很清楚地标明了SNP所 在的位置以及对应的核酸与蛋白序列.但有一点要说明,我注意到这个基因编码的蛋白序列与swissprot的序列有一些差别,很可能是收录的版本不同,或 是有些序列是NCBI直接根据orf形成的.

本站内容来自于网友发表,不代表本站立场,仅表示其个人看法,不对其真实性、正确性、有效性作任何的担保
相关事宜请发邮件给我们
© 星空见康网