Python 脚本之统计基因组文件中染色体长度及N碱基数目

作者&投稿:潭韦 (若有异议请与网页底部的电邮联系)
~

re模块是Python中的正则表达式调用模块,在python中,通过将正则表达式内嵌集成re模块,程序员们可以直接调用来实现正则匹配。

正则表达式的大致匹配过程是:

re模块所支持的方法有如下:

其中,pattern为匹配模式,由re.compile生成,例如: pattern = re.compile(r'hello')

参数flag是匹配模式,取值可以使用按位或运算符’|’表示同时生效,如 re.I | re.M。可选值有:

注:以上七个方法中的flags同样是代表匹配模式的意思,如果在pattern生成时已经指明了flags,那么在下面的方法中就不需要传入这个参数了。

1. re.match(pattern, string[, flags])

2. re.search(pattern, string[, flags])

3. re.split(pattern, string[, maxsplit])

4. re.findall(pattern, string[, flags])

5. re.finditer(pattern, string[, flags])

6. re.sub(pattern, repl, string[, count])

7. re.subn(pattern, repl, string[, count])

描述

注意:该方法只能删除开头或是结尾的字符,不能删除中间部分的字符。
语法

参数

返回值

实例

以上实例输出结果如下:

参考
https://www.cnblogs.com/chengege/p/11190782.html
https://www.runoob.com/python/att-string-strip.html




常德市18260591135: 怎样使用python处理sam文件?
春尝降克: 有个叫Tablet的软件,主要是输入.sam文件和基因组文件,然后直接把mapping的情况转换成1张图给你看,不知道是不是符合你的需要.

常德市18260591135: 一个fasta格式序列用python求GC含量 -
春尝降克: 如果用perl来编写统计fasta序列的长度脚本,很简单的几行代码就可以搞定,但是想了想,觉得用python写更时候处理大的文件,尤其是想用python实现多线程处理.因此,就有了用python来编写最初版的统计fasta序列长度的脚本的想法. 运行...

常德市18260591135: 如何用python实现 echart -
春尝降克: python安装echarts-python模块

常德市18260591135: 基因注释文件生成矩阵python -
春尝降克: #!/usr/bin/env python # coding: usrtf-8 #import osdef iterCombine(filename):with open(filename, 'rt') as handle:for ln in handle:s1, s2, s3 = ln.strip().split('\t')gene = s1.rstrip(";;")remk = s3.rstrip("\n")yield gene, remk def getDataSet(...

常德市18260591135: 如何在Windows环境下运行Python脚本 -
春尝降克: python是一款应用非常广泛的脚本程序语言,谷歌公司的网页就是用python编写.python在生物信息、统计、网页制作、计算等多个领域都体现出了强大的功能.python和其他脚本语言如java、R、Perl 一样,都可以直接在命令行里运行脚本程序...

常德市18260591135: python中scipy中uniform分布怎么用 -
春尝降克: 物信息、统计、网页制作、计算等多个领域都体现出了强大的功能.python和其他脚本语言如java、R、Perl 一样,都可以直接在命令行里运行脚本程序.工具/原料 python;CMD命令行;windows操作系统 方法/步骤 1、首先下载安装python,建...

常德市18260591135: python A, C, T, 和 G构成的字符串来构建一个基因组,,在 TAG, TAA, 或者 TGA之前结束 -
春尝降克: # -*- coding:utf-8 -*- sstr=raw_input('Please input the Gene String:\r\n') endsplit=['TAG','TAA','TGA'] if 'ATG' in sstr:for i in sstr.split('ATG'):for j in endsplit:if j in i:print i.split(j)[0] else:print 'error' >>> Please input the Gene String: ...

常德市18260591135: 如何用Python绘制Circos图 -
春尝降克: 用Python实现Circos图的绘制在线绘制的Circos有一定局限性,如对数据的要求、个性化的局限和处理速度等的问题,但如果你是一个Pythoneer或者喜欢用更加Pythonic的方式来个性化地绘制Circos图,那么今天就跟随我一起用代码实现这一目...

常德市18260591135: 怎么用bioedit在基因组序列中找出已知序列的序列相似 -
春尝降克: Bioedit提供了本地blast工具(菜单里的local blast 功能),如图一. 你需要把基因组数据做成本地数据库,使用菜单里的create a local nucleotide database file功能建立本地DNA数据库,建库的原始数据需要做成fasta格式的,建成的数据库存放在...\bioedit\database文件夹里. 然后用另一种菌的基因序列和基因组本地数据库做blastn或者tblastx(图二),就能找到与这个基因序列相似性较高的contig了. 我的bioedit版本较低,估计也能参考吧. 也可以直接从NCBI下载本地blast相关程序,使用dos命令行操作.

常德市18260591135: python程序纠错 -
春尝降克: import re def check(a): reg=re.compile(r"(? result=reg.findall(a) if not result:return "error" return ' '.join(result) r=check('TTATGTTTTAAGGATGGGGCGTTAGTT') print(r)

本站内容来自于网友发表,不代表本站立场,仅表示其个人看法,不对其真实性、正确性、有效性作任何的担保
相关事宜请发邮件给我们
© 星空见康网