13个最常用的Python深度学习库介绍

作者&投稿:兆类 (若有异议请与网页底部的电邮联系)
~ 13个最常用的Python深度学习库介绍
如果你对深度学习和卷积神经网络感兴趣,但是并不知道从哪里开始,也不知道使用哪种库,那么这里就为你提供了许多帮助。
在这篇文章里,我详细解读了9个我最喜欢的Python深度学习库。
这个名单并不详尽,它只是我在计算机视觉的职业生涯中使用并在某个时间段发现特别有用的一个库的列表。
这其中的一些库我比别人用的多很多,尤其是Keras、mxnet和sklearn-theano。
其他的一些我是间接的使用,比如Theano和TensorFlow(库包括Keras、deepy和Blocks等)。
另外的我只是在一些特别的任务中用过(比如nolearn和他们的Deep Belief Network implementation)。
这篇文章的目的是向你介绍这些库。我建议你认真了解这里的每一个库,然后在某个具体工作情境中你就可以确定一个最适用的库。
我想再次重申,这份名单并不详尽。此外,由于我是计算机视觉研究人员并长期活跃在这个领域,对卷积神经网络(细胞神经网络)方面的库会关注更多。
我把这个深度学习库的列表分为三个部分。
第一部分是比较流行的库,你可能已经很熟悉了。对于这些库,我提供了一个通俗的、高层次的概述。然后,针对每个库我详细解说了我的喜欢之处和不喜欢之处,并列举了一些适当的应用案例。
第二部分进入到我个人最喜欢的深度学习库,也是我日常工作中使用最多的,包括:Keras、mxnet和sklearn-theano等。
最后,我对第一部分中不经常使用的库做了一个“福利”板块,你或许还会从中发现有用的或者是在第二板块中我还没有尝试过但看起来很有趣的库。
接下来就让我们继续探索。
针对初学者:
Caffe
提到“深度学习库”就不可能不说到Caffe。事实上,自从你打开这个页面学习深度学习库,我就敢打保票你肯定听说Caffe。
那么,究竟Caffe是什么呢?
Caffe是由Berkeley Vision and Learning Center(BVLC)建立的深度学习框架。它是模块化的,速度极快。而且被应用于学术界和产业界的start-of-the-art应用程序中。
事实上,如果你去翻阅最新的深度学习出版物(也提供源代码),你就很可能会在它们相关的GitHub库中找到Caffe模型。
虽然Caffe本身并不是一个Python库,但它提供绑定到Python上的编程语言。我们通常在新领域开拓网络的时候使用这些绑定。
我把Caffe放在这个列表的原因是它几乎被应用在各个方面。你可以在一个空白文档里定义你的模型架构和解决方案,建立一个JSON文件类型的.prototxt配置文件。Caffe二进制文件提取这些.prototxt文件并培训你的网络。Caffe完成培训之后,你可以把你的网络和经过分类的新图像通过Caffe二进制文件,更好的就直接通过Python或MATLAB的API。
虽然我很喜欢Caffe的性能(它每天可以在K40 GPU上处理60万张图片),但相比之下我更喜欢Keras和mxnet。
主要的原因是,在.prototxt文件内部构建架构可能会变得相当乏味和无聊。更重要的是, Caffe不能用编程方式调整超参数!由于这两个原因,在基于Python的API中我倾向于对允许我实现终端到终端联播网的库倾斜(包括交叉验证和调整超参数)。
Theano
在最开始我想说Theano是美丽的。如果没有Theano,我们根本不会达到现有的深度学习库的数量(特别是在Python)。同样的,如果没有numpy,我们就不会有SciPy、scikit-learn和 scikit-image,,同样可以说是关于Theano和深度学习更高级别的抽象。
非常核心的是,Theano是一个Python库,用来定义、优化和评估涉及多维数组的数学表达式。 Theano通过与numpy的紧密集成,透明地使用GPU来完成这些工作。
虽然可以利用Theano建立深度学习网络,但我倾向于认为Theano是神经网络的基石,同样的numpy是作为科学计算的基石。事实上,大多数我在文章中提到的库都是围绕着Theano,使自己变得更加便利。
不要误会我的意思,我爱Theano,我只是不喜欢用Theano编写代码。
在Theano建设卷积神经网络就像只用本机Python中的numpy写一个定制的支持向量机(SVM),当然这个对比并不是很完美。
你可以做到吗?
当然可以。
它值得花费您的时间和精力吗?
嗯,也许吧。这取决于你是否想摆脱低级别或你的应用是否需要。
就个人而言,我宁愿使用像Keras这样的库,它把Theano包装成更有人性化的API,同样的方式,scikit-learn使机器学习算法工作变得更加容易。
TensorFlow
与Theano类似,TensorFlow是使用数据流图进行数值计算的开源库(这是所有神经网络固有的特征)。最初由谷歌的机器智能研究机构内的Google Brain Team研究人员开发,此后库一直开源,并提供给公众。
相比于Theano ,TensorFlow的主要优点是分布式计算,特别是在多GPU的环境中(虽然这是Theano正在攻克的项目)。
除了用TensorFlow而不是Theano替换Keras后端,对于TensorFlow库我并没有太多的经验。然而在接下来的几个月里,我希望这有所改变。
Lasagne
Lasagne是Theano中用于构建和训练网络的轻量级库。这里的关键词是轻量级的,也就意味着它不是一个像Keras一样围绕着Theano的重包装的库。虽然这会导致你的代码更加繁琐,但它会把你从各种限制中解脱出来,同时还可以让您根据Theano进行模块化的构建。
简而言之:Lasagne的功能是Theano的低级编程和Keras的高级抽象之间的一个折中。
我最喜欢的:
Keras
如果我必须选出一个最喜欢的深度学习Python库,我将很难在Keras和mxnet中做出抉择——但最后,我想我会选Keras。
说真的,Keras的好处我说都说不完。
Keras是一个最低限度的、模块化的神经网络库,可以使用Theano或TensorFlow作为后端。Keras最主要的用户体验是,从构思到产生结果将会是一个非常迅速的过程。
在Keras中架构网络设计是十分轻松自然的。它包括一些state-of-the-art中针对优化(Adam,RMSProp)、标准化(BatchNorm)和激活层(PReLU,ELU,LeakyReLU)最新的算法。
Keras也非常注重卷积神经网络,这也是我十分需要的。无论它是有意还是无意的,我觉得从计算机视觉的角度来看这是非常有价值的。
更重要的是,你既可以轻松地构建基于序列的网络(其中输入线性流经网络)又可以创建基于图形的网络(输入可以“跳过”某些层直接和后面对接)。这使得创建像GoogLeNet和SqueezeNet这样复杂的网络结构变得容易得多。
我认为Keras唯一的问题是它不支持多GPU环境中并行地训练网络。这可能会也可能不会成为你的大忌。
如果我想尽快地训练网络,那么我可能会使用mxnet。但是如果我需要调整超参数,我就会用Keras设置四个独立的实验(分别在我的Titan X GPUs上运行)并评估结果。
mxnet
我第二喜欢的深度学习Python库无疑就是mxnet(重点也是训练图像分类网络)。虽然在mxnet中站立一个网络可能需要较多的代码,但它会提供给你惊人数量的语言绑定(C ++、Python、R、JavaScript等)。
Mxnet库真正出色的是分布式计算,它支持在多个CPU / GPU机训练你的网络,甚至可以在AWS、Azure以及YARN集群。
它确实需要更多的代码来设立一个实验并在mxnet上运行(与Keras相比),但如果你需要跨多个GPU或系统分配训练,我推荐mxnet。
sklearn-theano
有时候你并不需要终端到终端的培养一个卷积神经网络。相反,你需要把CNN看作一个特征提取器。当你没有足够的数据来从头培养一个完整的CNN时它就会变得特别有用。仅仅需要把你的输入图像放入流行的预先训练架构,如OverFeat、AlexNet、VGGNet或GoogLeNet,然后从FC层提取特征(或任何您要使用的层)。
总之,这就是sklearn-theano的功能所在。你不能用它从头到尾的训练一个模型,但它的神奇之处就是可以把网络作为特征提取器。当需要评估一个特定的问题是否适合使用深度学习来解决时,我倾向于使用这个库作为我的第一手判断。
nolearn
我在PyImageSearch博客上用过几次nolearn,主要是在我的MacBook Pro上进行一些初步的GPU实验和在Amazon EC2 GPU实例中进行深度学习。
Keras把 Theano和TensorFlow包装成了更具人性化的API,而nolearn也为Lasagne做了相同的事。此外,nolearn中所有的代码都是与scikit-learn兼容的,这对我来说绝对是个超级的福利。
我个人不使用nolearn做卷积神经网络(CNNs),但你当然也可以用(我更喜欢用Keras和mxnet来做CNNs)。我主要用nolearn来制作Deep Belief Networks (DBNs)。
DIGITS
DIGITS并不是一个真正的深度学习库(虽然它是用Python写的)。DIGITS(深度学习GPU培训系统)实际上是用于培训Caffe深度学习模式的web应用程序(虽然我认为你可以破解源代码然后使用Caffe以外其他的后端进行工作,但这听起来就像一场噩梦)。
如果你曾经用过Caffe,那么你就会知道通过它的终端来定义.prototxt文件、生成图像数据、运行网络并监管你的网络训练是相当繁琐的。 DIGITS旨在通过让你在浏览器中执行这些任务来解决这个问题。
此外,DIGITS的用户界面非常出色,它可以为你提供有价值的统计数据和图表作为你的模型训练。另外,你可以通过各种输入轻松地可视化网络中的激活层。最后,如果您想测试一个特定的图像,您可以把图片上传到你的DIGITS服务器或进入图片的URL,然后你的Caffe模型将会自动分类图像并把结果显示在浏览器中。干净利落!
Blocks
说实话,虽然我一直想尝试,但截至目前我的确从来没用过Blocks(这也是我把它包括在这个列表里的原因)。就像许多个在这个列表中的其他库一样,Blocks建立在Theano之上,呈现出一个用户友好型的API。
deepy
如果让你猜deepy是围绕哪个库建立的,你会猜什么?
没错,就是Theano。
我记得在前一段时间用过deepy(做了初始提交),但在接下里的大概6-8个月我都没有碰它了。我打算在接下来的博客文章里再尝试一下。
pylearn2
虽然我从没有主动地使用pylearn2,但由于历史原因,我觉得很有必要把它包括在这个列表里。 Pylearn2不仅仅是一般的机器学习库(地位类似于scikit-learn),也包含了深度学习算法的实现。
对于pylearn2我最大的担忧就是(在撰写本文时),它没有一个活跃的开发者。正因为如此,相比于像Keras和mxnet这样的有积极维护的库,推荐pylearn2我还有些犹豫。
Deeplearning4j
这本应是一个基于Python的列表,但我想我会把Deeplearning4j包括在这里,主要是出于对他们所做事迹的无比崇敬——Deeplearning4j为JVM建立了一个开源的、分布式的深度学习库。
如果您在企业工作,你可能会有一个塞满了用过的Hadoop和MapReduce服务器的储存器。也许这些你还在用,也许早就不用了。
你怎样才能把这些相同的服务器应用到深度学习里?
事实证明是可以的——你只需要Deeplearning4j。
总计
以上就是本文关于13个最常用的Python深度学习库介绍的全部内容

由于Python的易用性和可扩展性,众多深度学习框架提供了Python接口,其中较为流行的深度学习库如下:
第一:Caffe
Caffe是一个以表达式、速度和模块化为核心的深度学习框架,具备清晰、可读性高和快速的特性,在视频、图像处理方面应用较多。
Caffe中的网络结构与优化都以配置文件形式定义,容易上手,无须通过代码构建网络;网络训练速度快,能够训练大型数据集与State-of-the-art的模型,模块化的组件可以方便地拓展到新的模型与学习任务上。
第二:Theano
Theano诞生于2008年,是一个高性能的符号计算及深度学习库,被认为是深度学习库的始祖之一,也被认为是深度学习研究和应用的重要标准之一。其核心是一个数学表达式的编译器,专门为处理大规模神经网络训练的计算而设计。
Theano很好地整合了Numpy,可以直接使用Numpy的Ndarray,使得API接口学习成本大为降低;其计算稳定性好,可以精准地计算输出值很小的函数;可动态地生成C或者CUDA代码,用来编译成高效的机器代码。
第三:TensorFlow
TensorFlow是相对高阶的机器学习库,其核心代码使用C++编写,并支持自动求导,使得用户可以方便地设计神经网络结构,不需要亲自编写C++或CUDA代码,也无须通过反向传播求解梯度。由于底层使用C++语言编写,运行效率得到了保证,并简化线上部署的复杂度。
TensorFlow不只局限于神经网络,其数据流式图还支持非常自由的算法表达,也可以轻松实现深度学习以外的机器学习算法。
第四:Keras
Keras是一个高度模块化的神经网络库,使用Python实现,并可以同时运行在TensorFlow和Theano上。
Keras专精于深度学习,其提供了到目前为止最方便的API,用户仅需将高级的模块拼在一起便可设计神经网络,大大降低了编程开销与理解开销。


Python渗透测试工具都有哪些
Scapy, Scapy3k: 发送,嗅探,分析和伪造网络数据包。可用作交互式包处理程序或单独作为一个库 pypcap, Pcapy, pylibpcap: 几个不同 libpcap 捆绑的python库 libdnet: 低级网络路由,包括端口查看和以太网帧的转发 dpkt: 快速,轻量数据包创建和分析,面向基本的 TCP\/IP 协议 Impacket: 伪造和解码网...

python代码转化为sas代码
sas_pred = sas_pred.iloc[:,-3:]sas_pred(abs(python_pred - sas_pred) > 0.00001).sum()登录后复制可以看到,两个预测的结果基本上一样,基本没问题,我们就可以在sas中跑xgboost模型了。总结上面只是个最简单的示例,没有对特征处理。对于复杂的建模过程,比如很多特征工程,那就要对Python脚本进一步调整了。以...

SPSS的时间序列分析怎么做
3. 自回归移动平均ARMA(p,q)模型(1) 模型形式 yt=φ1yt-1+φ2yt-2+……+φpyt-p+εt-θ1εt-1-θ2εt-2-……-θpεt-p式中符号: p和q是模型的自回归阶数和移动平均阶数;φ和θ是不为零的待定系数;εt独立的误差项;yt是平稳、正态、零均值的时间序列。(2) 模型含义使用两个多项式的比率...

几个病毒的问题啊(烦)
最简单的,重装系统,把QQ删了也重装.俺也不知道是什么病毒,瞎白话几句吧.先用ICESWORD看看进程有没有可疑的,找到后直接找到相关文件删除,然后用AUTORUN查看启动项,可疑的也删除.运行,CMD回车,输入NETSTAT -ANO,看看有没有可以进程和外界联系,然后对照PID找到相关进程.QQ估计得重新装了.得,有点说不清楚...

SQL Server 2016 企业版 在安装时需不需要 Product Key
--- SQL Server 2016 Enterprise Edition: MDCJV-3YX8N-WG89M-KV443-G8249 SQL Server 2016 Enterprise Core Edition: TBR8B-BXC4Y-298NV-PYTBY-G3BCP SQL Server 2016 Standard Edition: B9GQY-GBG4J-282NY-QRG4X-KQBCR SQL Server 2016 Web Edition: BXJTY-X3GNH-WHTHG-8V...

数学四年级小知识
阿拉伯数字现在已成为人们学习、生活和交往中最常用的数字了。6.自然数:用以计量事物的件数或表示事物次序的数 。 即用数码0,1,2,3,4,……所表示的数 。表示物体个数的数叫自然数,自然数由0开始(包括0), 一个接一个,组成一个无穷的集体。7.计算工具:算盘、计算器、计算机。8.射线:在几何学中,直线上...

谁可以帮忙提供几篇关于ARIMA预测问题的论文!
3.自回归移动平均模型ARMA(p,q) 如果时间序列{yt}满足: yt=φ1yt-1+…+φpyt-p+εt-–θ1εt-1–…–θqyt-q 则称时间序列{yt}服从(p,q)阶自回归移动平均模型,记为ARMA(p,q)。φ1,…,φp称为自回归系数,θ1,…,θq称为移动平均系数。 对于ARMA(p,q)模型,当q=0,模型即为AR(p)模型;...

想要94年考研英语完型解析
链接:https:\/\/pan.baidu.com\/s\/1pyT-SOqCboLltUPEG0WquQ 提取码:6666 这里有考研历年英语真题及讲解,如果资源有问题随时追问

容耀8 青春版怎样外接蛇管摄像头
华为荣耀八可以外接摄像头吗荣耀8到手很轻薄,背面超级好看,性价比也高,当时2000+,活动的时候1499京东入手,...

明光市19341954656: python深度学习的学习方法或者入门书籍有什么 -
闾战男宝: 作者:issac Syndrome来源:知乎这是一个较完整的应用深度学习进行图像识别的学习路径,不是深度学习的捷径!1. 模式识别从你的描述问题的语言来看,题主似乎对模式识别没有较高的认识.所以在做基于深度学习的图像识别前,建议先大...

明光市19341954656: python三本经典书籍都是什么? -
闾战男宝: python三本经典书籍有:《深度学习入门:基于Python的理论与实现》,《Python高性能(第2版)》,《Python科学计算最佳实践:SciPy指南》. 1、《深度学习入门:基于Python的理论与实现》 本书深入浅出地剖析了深度学习的原理和相关...

明光市19341954656: 如何评价Python的深度学习框架DeepPy? -
闾战男宝: 最近一直在用keras,说点个人感受.1、keras根植于python及theano,人气比较旺.2、提供较为上层的框架,搞个深度学习的原型非常方便.3、更新很快,我记得几个月前还没有multi-task的能力,最近再查就提供了graph的对象.4、最重要的,文档很全.这点超过其它类似的基于theano的框架(Lasagne, Opendeep, Blocks)

明光市19341954656: Python得达到什么程度,才能学好深度学习?
闾战男宝: 第1步:Python基本技能如果我们希望用Python进行机器学习,对Python的基本理解是至关重要的.幸运的是,由于Python作为编程语言的普及和它在相关领域的广泛应用,找到入门教程并非难事.而从何处起步取决于你对Python的掌握程度....

明光市19341954656: 深度学习使用的算法有哪些? -
闾战男宝: 先列举一下在深度学习中,我们常见的优化算法有哪些: 最基本的如梯度下降(Gradient Descent)—— GD 然后还有一些GD的变体: 随机梯度下降法(Stochastic Gradient Descent)——SGD 小批量梯度下降——mini-batch GD 动量梯度下降——Momentum 均方根算法(root mean square prop) ——RMSprop 自适应矩估计(Adaptive Moment Estimation)——Adam

明光市19341954656: python好学吗,人工智能跟python有什么关系? -
闾战男宝: 提到人工智能就一定会提到Python,有的初学者甚至认为人工智能和Python是划等号的,其实Python是一种计算机程序设计语言.是一种动态的、面向对象的脚本语言,开始时是用于编写自动化脚本(shell),随着版本的不断更新和语言新功能...

明光市19341954656: 怎么用python 实现lenet的深度学习 -
闾战男宝: Python学得倒不用很深,循环跟函数还有类学完就可以搞深度学习了. 新手用深度学习库先跑跑,真要进阶还要修改的话,你会发现瓶颈其实在数学

明光市19341954656: 学完python都能做哪些职业? -
闾战男宝: 从入门级选手到专业级选手都在做的——爬虫 用 Python 写爬虫的教程网上一抓一大把,据我所知很多初学 Python 的人都是使用它编写爬虫程序.小到抓取一个小黄图网站,大到一个互联网公司的商业应用.通过 Python 入门爬虫比较简单易学...

明光市19341954656: 大数据开发中最常用的编程语言
闾战男宝: 大数据仓库斯卡拉Scala是面向对象和函数式编程范例的完美结合. 它快速,强大,是许多大数据人士选择的语言. 实际上,两个最受欢迎的大数据处理框架Apache Spark...

明光市19341954656: 百度Paddle会和Python一样,成为最流行的深度学习引擎吗
闾战男宝: 百度 PaddlePaddle 在和几款最常用的深度学习框架TensorFlow、Torch、Caffe比较之前,我们先重点介绍新出现的PaddlePaddle.Paddle其实已经有多年历史了.早在 2013 年,百度就察觉到传统的基于单GPU的训练平台,已经无法满足深度...

你可能想看的相关专题

本站内容来自于网友发表,不代表本站立场,仅表示其个人看法,不对其真实性、正确性、有效性作任何的担保
相关事宜请发邮件给我们
© 星空见康网