Python 脚本之统计基因组文件中染色体长度及N碱基数目
re模块是Python中的正则表达式调用模块,在python中,通过将正则表达式内嵌集成re模块,程序员们可以直接调用来实现正则匹配。
正则表达式的大致匹配过程是:
re模块所支持的方法有如下:
其中,pattern为匹配模式,由re.compile生成,例如: pattern = re.compile(r'hello')
参数flag是匹配模式,取值可以使用按位或运算符’|’表示同时生效,如 re.I | re.M。可选值有:
注:以上七个方法中的flags同样是代表匹配模式的意思,如果在pattern生成时已经指明了flags,那么在下面的方法中就不需要传入这个参数了。
1. re.match(pattern, string[, flags])
2. re.search(pattern, string[, flags])
3. re.split(pattern, string[, maxsplit])
4. re.findall(pattern, string[, flags])
5. re.finditer(pattern, string[, flags])
6. re.sub(pattern, repl, string[, count])
7. re.subn(pattern, repl, string[, count])
描述
注意:该方法只能删除开头或是结尾的字符,不能删除中间部分的字符。
语法
参数
返回值
实例
以上实例输出结果如下:
参考
https://www.cnblogs.com/chengege/p/11190782.html
https://www.runoob.com/python/att-string-strip.html
春尝降克: 有个叫Tablet的软件,主要是输入.sam文件和基因组文件,然后直接把mapping的情况转换成1张图给你看,不知道是不是符合你的需要.
常德市18260591135: 一个fasta格式序列用python求GC含量 - ?
春尝降克: 如果用perl来编写统计fasta序列的长度脚本,很简单的几行代码就可以搞定,但是想了想,觉得用python写更时候处理大的文件,尤其是想用python实现多线程处理.因此,就有了用python来编写最初版的统计fasta序列长度的脚本的想法. 运行...
常德市18260591135: 如何用python实现 echart - ?
春尝降克: python安装echarts-python模块
常德市18260591135: 基因注释文件生成矩阵python - ?
春尝降克: #!/usr/bin/env python # coding: usrtf-8 #import osdef iterCombine(filename):with open(filename, 'rt') as handle:for ln in handle:s1, s2, s3 = ln.strip().split('\t')gene = s1.rstrip(";;")remk = s3.rstrip("\n")yield gene, remk def getDataSet(...
常德市18260591135: 如何在Windows环境下运行Python脚本 - ?
春尝降克: python是一款应用非常广泛的脚本程序语言,谷歌公司的网页就是用python编写.python在生物信息、统计、网页制作、计算等多个领域都体现出了强大的功能.python和其他脚本语言如java、R、Perl 一样,都可以直接在命令行里运行脚本程序...
常德市18260591135: python中scipy中uniform分布怎么用 - ?
春尝降克: 物信息、统计、网页制作、计算等多个领域都体现出了强大的功能.python和其他脚本语言如java、R、Perl 一样,都可以直接在命令行里运行脚本程序.工具/原料 python;CMD命令行;windows操作系统 方法/步骤 1、首先下载安装python,建...
常德市18260591135: python A, C, T, 和 G构成的字符串来构建一个基因组,,在 TAG, TAA, 或者 TGA之前结束 - ?
春尝降克: # -*- coding:utf-8 -*- sstr=raw_input('Please input the Gene String:\r\n') endsplit=['TAG','TAA','TGA'] if 'ATG' in sstr:for i in sstr.split('ATG'):for j in endsplit:if j in i:print i.split(j)[0] else:print 'error' >>> Please input the Gene String: ...
常德市18260591135: 如何用Python绘制Circos图 - ?
春尝降克: 用Python实现Circos图的绘制在线绘制的Circos有一定局限性,如对数据的要求、个性化的局限和处理速度等的问题,但如果你是一个Pythoneer或者喜欢用更加Pythonic的方式来个性化地绘制Circos图,那么今天就跟随我一起用代码实现这一目...
常德市18260591135: 怎么用bioedit在基因组序列中找出已知序列的序列相似 - ?
春尝降克: Bioedit提供了本地blast工具(菜单里的local blast 功能),如图一. 你需要把基因组数据做成本地数据库,使用菜单里的create a local nucleotide database file功能建立本地DNA数据库,建库的原始数据需要做成fasta格式的,建成的数据库存放在...\bioedit\database文件夹里. 然后用另一种菌的基因序列和基因组本地数据库做blastn或者tblastx(图二),就能找到与这个基因序列相似性较高的contig了. 我的bioedit版本较低,估计也能参考吧. 也可以直接从NCBI下载本地blast相关程序,使用dos命令行操作.
常德市18260591135: python程序纠错 - ?
春尝降克: import re def check(a): reg=re.compile(r"(? result=reg.findall(a) if not result:return "error" return ' '.join(result) r=check('TTATGTTTTAAGGATGGGGCGTTAGTT') print(r)