如何用python和scikit learn实现神经网络

作者&投稿：严彪（若有异议请与网页底部的电邮联系）

如何用Python和SciKit Learn 0.18实现神经网络~

这个嘛,Python能处理的事情确实比较多.但是机器人这个还没有现成的库,而且机器人这个算法Python估计也跑不动.

官方不支持，建议等支持吧。 dll有自己版本对应的，必须使用专门为python3.4编译的dll（cv2.pyd），你拿python2.7的肯定用不了。如果非要使用—— 方法一：自己编译opencv的源码方法二：安装python2.7

1：神经网络算法简介

2：Backpropagation算法详细介绍

3：非线性转化方程举例

4：自己实现神经网络算法NeuralNetwork

5：基于NeuralNetwork的XOR实例

6：基于NeuralNetwork的手写数字识别实例

7：scikit-learn中BernoulliRBM使用实例

8：scikit-learn中的手写数字识别实例

一：神经网络算法简介

1：背景

以人脑神经网络为启发，历史上出现过很多版本，但最著名的是backpropagation

2：多层向前神经网络（Multilayer Feed-Forward Neural Network）

多层向前神经网络组成部分

输入层（input layer），隐藏层（hiddenlayer），输出层（output layer）

每层由单元（units）组成

输入层（input layer）是由训练集的实例特征向量传入

经过连接结点的权重（weight）传入下一层，一层的输出是下一层的输入

隐藏层的个数是任意的，输出层和输入层只有一个

每个单元（unit）也可以被称作神经结点，根据生物学来源定义

上图称为2层的神经网络（输入层不算）

一层中加权的求和，然后根据非线性的方程转化输出

作为多层向前神经网络，理论上，如果有足够多的隐藏层（hidden layers）和足够大的训练集，可以模拟出任何方程

3：设计神经网络结构

3.1使用神经网络训练数据之前，必须确定神经网络层数，以及每层单元个数

3.2特征向量在被传入输入层时通常被先标准化（normalize）和0和1之间（为了加强学习过程）

3.3离散型变量可以被编码成每一个输入单元对应一个特征可能赋的值

比如：特征值A可能取三个值（a0,a1,a2），可以使用三个输入单元来代表A

如果A=a0,那么代表a0的单元值就取1，其他取0

如果A=a1,那么代表a1的单元值就取1，其他取0，以此类推

3.4神经网络即可以用来做分类（classification）问题，也可以解决回归（regression）问题

3.4.1对于分类问题，如果是2类，可以用一个输入单元表示（0和1分别代表2类）

如果多于两类，每一个类别用一个输出单元表示

所以输入层的单元数量通常等于类别的数量

3.4.2没有明确的规则来设计最好有多少个隐藏层

3.4.2.1根据实验测试和误差，以及准确度来实验并改进

4：算法验证——交叉验证法（Cross- Validation）

解读：有一组输入集A,B，可以分成三组，第一次以第一组为训练集，求出一个准确度，第二次以第二组作为训练集，求出一个准确度，求出准确度，第三次以第三组作为训练集，求出一个准确度，然后对三个准确度求平均值

二：Backpropagation算法详细介绍

1：通过迭代性来处理训练集中的实例

2：输入层输入数

经过权重计算得到第一层的数据，第一层的数据作为第二层的输入，再次经过权重计算得到结果，结果和真实值之间是存在误差的，然后根据误差，反向的更新每两个连接之间的权重

3：算法详细介绍

输入：D : 数据集，| 学习率（learning rate），一个多层前向神经网络

输出：一个训练好的神经网络（a trained neural network）

3.1初始化权重（weights）和偏向（bias）：随机初始化在-1到1之间，或者-0.5到0.5之间，每个单元有一个偏向

3.2对于每一个训练实例X，执行以下步骤：

3.2.1：由输入层向前传送,输入->输出对应的计算为：

计算得到一个数据，经过f 函数转化作为下一层的输入，f函数为：

3.2.2：根据误差（error）反向传送

对于输出层（误差计算）： Tj：真实值，Qj表示预测值

对于隐藏层（误差计算）： Errk 表示前一层的误差， Wjk表示前一层与当前点的连接权重

权重更新： l：指学习比率（变化率），手工指定，优化方法是，随着数据的迭代逐渐减小

偏向更新： l：同上

3.3：终止条件

3.3.1权重的更新低于某个阀值

3.3.2预测的错误率低于某个阀值

3.3.3达到预设一定的循环次数

4：结合实例讲解算法

0.9对用的是L，学习率

测试代码如下：

1.NeutralNetwork.py文件代码

#coding:utf-8

import numpy as np

#定义双曲函数和他们的导数
def tanh(x):
return np.tanh(x)

def tanh_deriv(x):
return 1.0 - np.tanh(x)**2

def logistic(x):
return 1/(1 + np.exp(-x))

def logistic_derivative(x):
return logistic(x)*(1-logistic(x))

#定义NeuralNetwork 神经网络算法
class NeuralNetwork:
#初始化，layes表示的是一个list，eg[10,10,3]表示第一层10个神经元，第二层10个神经元，第三层3个神经元
def __init__(self, layers, activation='tanh'):
"""
:param layers: A list containing the number of units in each layer.
Should be at least two values
:param activation: The activation function to be used. Can be
"logistic" or "tanh"
"""
if activation == 'logistic':
self.activation = logistic
self.activation_deriv = logistic_derivative
elif activation == 'tanh':
self.activation = tanh
self.activation_deriv = tanh_deriv

self.weights = []
#循环从1开始，相当于以第二层为基准，进行权重的初始化
for i in range(1, len(layers) - 1):
#对当前神经节点的前驱赋值
self.weights.append((2*np.random.random((layers[i - 1] + 1, layers[i] + 1))-1)*0.25)
#对当前神经节点的后继赋值
self.weights.append((2*np.random.random((layers[i] + 1, layers[i + 1]))-1)*0.25)

#训练函数，X矩阵，每行是一个实例，y是每个实例对应的结果，learning_rate 学习率，
# epochs，表示抽样的方法对神经网络进行更新的最大次数
def fit(self, X, y, learning_rate=0.2, epochs=10000):
X = np.atleast_2d(X) #确定X至少是二维的数据
temp = np.ones([X.shape[0], X.shape[1]+1]) #初始化矩阵
temp[:, 0:-1] = X # adding the bias unit to the input layer
X = temp
y = np.array(y) #把list转换成array的形式

for k in range(epochs):
#随机选取一行，对神经网络进行更新
i = np.random.randint(X.shape[0])
a = [X[i]]

#完成所有正向的更新
for l in range(len(self.weights)):
a.append(self.activation(np.dot(a[l], self.weights[l])))
#
error = y[i] - a[-1]
deltas = [error * self.activation_deriv(a[-1])]

#开始反向计算误差，更新权重
for l in range(len(a) - 2, 0, -1): # we need to begin at the second to last layer
deltas.append(deltas[-1].dot(self.weights[l].T)*self.activation_deriv(a[l]))
deltas.reverse()
for i in range(len(self.weights)):
layer = np.atleast_2d(a[i])
delta = np.atleast_2d(deltas[i])
self.weights[i] += learning_rate * layer.T.dot(delta)

#预测函数
def predict(self, x):
x = np.array(x)
temp = np.ones(x.shape[0]+1)
temp[0:-1] = x
a = temp
for l in range(0, len(self.weights)):
a = self.activation(np.dot(a, self.weights[l]))
return a

2、测试代码

#coding:utf-8
'''
#基于NeuralNetwork的XOR（异或）示例
import numpy as np
from NeuralNetwork import NeuralNetwork

nn = NeuralNetwork([2,2,1], 'tanh')
X = np.array([[0, 0], [0, 1], [1, 0], [1, 1]])
y = np.array([0, 1, 1, 0])
nn.fit(X, y)
for i in [[0, 0], [0, 1], [1, 0], [1,1]]:
print(i,nn.predict(i))
'''
'''
#基于NeuralNetwork的手写数字识别示例
import numpy as np
from sklearn.datasets import load_digits
from sklearn.metrics import confusion_matrix,classification_report
from sklearn.preprocessing import LabelBinarizer
from sklearn.cross_validation import train_test_split
from NeuralNetwork import NeuralNetwork

digits = load_digits()
X = digits.data
y = digits.target
X -= X.min()
X /= X.max()

nn =NeuralNetwork([64,100,10],'logistic')
X_train, X_test, y_train, y_test = train_test_split(X, y)
labels_train = LabelBinarizer().fit_transform(y_train)
labels_test = LabelBinarizer().fit_transform(y_test)
print "start fitting"
nn.fit(X_train,labels_train,epochs=3000)
predictions = []
for i in range(X_test.shape[0]):
o = nn.predict(X_test[i])
predictions.append(np.argmax(o))
print confusion_matrix(y_test, predictions)
print classification_report(y_test, predictions)
'''

#scikit-learn中的手写数字识别实例
import numpy as np
import matplotlib.pyplot as plt

from scipy.ndimage import convolve
from sklearn import linear_model, datasets, metrics
from sklearn.cross_validation import train_test_split
from sklearn.neural_network import BernoulliRBM
from sklearn.pipeline import Pipeline

###############################################################################
# Setting up

def nudge_dataset(X, Y):

direction_vectors = [
[[0, 1, 0],
[0, 0, 0],
[0, 0, 0]],

[[0, 0, 0],
[1, 0, 0],
[0, 0, 0]],

[[0, 0, 0],
[0, 0, 1],
[0, 0, 0]],

[[0, 0, 0],
[0, 0, 0],
[0, 1, 0]]]

shift = lambda x, w: convolve(x.reshape((8, 8)), mode='constant',
weights=w).ravel()
X = np.concatenate([X] +
[np.apply_along_axis(shift, 1, X, vector)
for vector in direction_vectors])
Y = np.concatenate([Y for _ in range(5)], axis=0)
return X, Y

# Load Data
digits = datasets.load_digits()
X = np.asarray(digits.data, 'float32')
X, Y = nudge_dataset(X, digits.target)
X = (X - np.min(X, 0)) / (np.max(X, 0) + 0.0001) # 0-1 scaling

X_train, X_test, Y_train, Y_test = train_test_split(X, Y,
test_size=0.2,
random_state=0)

# Models we will use
logistic = linear_model.LogisticRegression()
rbm = BernoulliRBM(random_state=0, verbose=True)

classifier = Pipeline(steps=[('rbm', rbm), ('logistic', logistic)])

###############################################################################
# Training

# Hyper-parameters. These were set by cross-validation,
# using a GridSearchCV. Here we are not performing cross-validation to
# save time.
rbm.learning_rate = 0.06
rbm.n_iter = 20
# More components tend to give better prediction performance, but larger
# fitting time
rbm.n_components = 100
logistic.C = 6000.0

# Training RBM-Logistic Pipeline
classifier.fit(X_train, Y_train)

# Training Logistic regression
logistic_classifier = linear_model.LogisticRegression(C=100.0)
logistic_classifier.fit(X_train, Y_train)

###############################################################################
# Evaluation

print()
print("Logistic regression using RBM features:
%s
" % (
metrics.classification_report(
Y_test,
classifier.predict(X_test))))

print("Logistic regression using raw pixel features:
%s
" % (
metrics.classification_report(
Y_test,
logistic_classifier.predict(X_test))))

###############################################################################
# Plotting

plt.figure(figsize=(4.2, 4))
for i, comp in enumerate(rbm.components_):
plt.subplot(10, 10, i + 1)
plt.imshow(comp.reshape((8, 8)), cmap=plt.cm.gray_r,
interpolation='nearest')
plt.xticks(())
plt.yticks(())
plt.suptitle('100 components extracted by RBM', fontsize=16)
plt.subplots_adjust(0.08, 0.02, 0.92, 0.85, 0.08, 0.23)

plt.show()

'''
from sklearn.neural_network import BernoulliRBM
X = [[0,0],[1,1]]
y = [0,1]
clf = BernoulliRBM().fit(X,y)
print

测试结果如下：

学Python毕业后可以做什么?
Python的应用领域 1. Web开发 Python可以快速创建Web应用，这得益于其强大的基础库和丰富的网络框架，例如著名的Django，Flask，Tonardo，Web.py 等。通过使用这些Web框架，我们开发Web网站会更加安全与便利，在天下武功唯快不破的时代，何乐而不为呢。2. 游戏开发 Python也能用来开发互动性的游戏。PySoy...

如果只会Python能不能找到工作
学python的同时一定会接触到其他技术，毕竟光会python这门语言是不够的，要看用它来做什么。比如说用 python做爬虫，就必须接触到html, http等知识。python是现在最火的数据分析工具语言python的进阶的路线是数据清洗，爬虫，数据容器，之后是卷积，线性分析，和机器学习，区块连，金融方面的量化等高端进阶...

python 和 php哪个学起来简单
2. python是跨平台的，你可以运用python在mac,在linux，在win下，甚至是s60手机中开发软件；PHP没有这些能力。3. 从语法上说python的语法蜜糖更多些，语言结构简练，最简单的，PHP的$烦死你。4. web开发上，PHP应用较广，有很多现成的代码和模版，python这方面欠缺，虽然他有很多很好的框架。比如...

python为什么叫python
Python爬虫开发工程师,从网站某一个页面(通常是首页)开始，读取网页的内容，找到在网页中的其它链接地址，然后通过这些链接地址寻找下一个网页，这样一直循环下去，直到把这个网站所有的网页都抓取完为止。如果把整个互联网当成一个网站，那么网络蜘蛛就可以用这个原理把互联网上所有的网页都抓取下来。爬虫，...

Python自学心得分享
去帮助解决处理问题,也就好像,假设Python有100个技术框架,但是一个企业只用到其中30个,那如果你的学习掌握正是他们用的这30个,那么你不会那另外的70个也可以,只不过你学习掌握的越多,你的条件符合范围和就业机会也就越大,我按照我的这个大致理解, 我就仔细了解了一下Python主要可以从事哪些方向,我就根据我比较喜...

如何学python
我们可以在交互环境中先熟悉使用其中的函数,如果遇到函数的使用上的问题,可以参考python 安装后的自带chm帮助文件。5)为了更好得掌握python,我们的学习不能只是停留在学习一些语法或者api阶段。在此阶段中,我们可以尝试用python解决我们项目中遇到的一些问题,如果项目不是用python开发的,那我们可以想想能不能用python...

学java还是python比较好呢?各有哪些优势?
java和Python，无论学习那个语言都是不错的选择，而且他们的应用领域都是非常广泛的，有着自己独特的优势。就目前这种情况来说，Python发展前途更好一点，不过虽然java没有之前发展那么火爆了，但是java的应用数量还是最高的，在市场上已经拥有了非常稳固的地位。而Python的话跟之前的java是比较相似的，正在...

Python 相比 Java的优势是什么?缺点又是什么
Python相比Java的优势如下：1. Python作为动态语言更适合初学编程者。Python可以让初学者把精力集中在编程对象和思维方法上，而不用去担心语法、类型等等外在因素。而Python清晰简洁的语法也使得它调试起来比Java简单的多。2. Python有一些Java没有的强大的架构，可以表达非常复杂的逻辑 3. Python有非常强大...

大数据Java,Python语言两者发展侧重点有何不同?
首先，掌握编程语言是很多大数据岗位的基础要求，比如说大数据平台开发、大数据应用开发、大数据分析和大数据运维等都需要具备扎实的编程语言基础，才可以拥有更好的发展。据了解，现在大数据开发领域可以使用的编程语言有很多种，比如说Java和Python都是比较常见的语言，具体掌握哪门语言合适，结合自身情况来决定吧...

如何让python可视化
Pandas Seaborn ggplot Bokeh pygal Plotly 在示例中，我将使用 pandas 处理数据并将数据可视化。大多数案例中，使用上述工具时无需结合 pandas，但我认为 pandas 与可视化工具结合是非常普遍的现象，所以以这种方式开启本文是很棒的。什么是 Matplotlib？Matplotlib 是众多 Python 可视化包的鼻祖。其功能非常...

黄岩区13042287144： 利用python进行数据分析怎么学 - ？
房娇先妮： python进行数据分析主要是numpy、matplotlib这两个模块包,进阶之后,符号运算用scipy,机器学习用scikit-learn,时间序列用pandas,numpy和matplotlib一定要熟练,可以看一下python科学计算这本书,最好从网站上看,因为涉及numpy和matplotlib、scipy的内容不是特别多,但是作为入门该接触的东西都有

黄岩区13042287144： python scikit - learn怎么用 - ？
房娇先妮： 你好,你有读写的权限吗?尝试普通的文件读写操作: f=open('a.txt', 'w') 如果不能正常运行,那么尝试用管理员权限运行你的程序.或者,修改保存的文件名,'iris.doct'修改为其它的名字,如'abcd.dot'.

黄岩区13042287144： 怎么用python训练神经网络 - ？
房娇先妮： Python 可以用scikit-learn、Theano、pybrain等库来做神经网络,详细的内容可以搜索相关的例子和官方文档.

黄岩区13042287144： python怎么安装scikit - ？
房娇先妮： 如果你安装了pip和easy_install 可能这样安装 easy_install scikit-image或者pip install scikit-image这个库还需要依赖 numpy+mkl.记得同时安装

黄岩区13042287144： ubuntu怎么安装python的第三方库scikit - learn - ？
房娇先妮： 1、首先配置基本的python库sudo apt-get install build-essential python-dev python-numpy python-setuptools python-scipy libatlas-dev libatlas3-base 2、配置matplotlib库,进行画图之类的sudo apt-get install python-matplotlib 3、配置scikit-learn库sudo apt-get install python-sklearn

黄岩区13042287144： 如何让python调用多线程来执行机器学习 - ？
房娇先妮： Python在科学计算领域,有两个重要的扩展模块:Numpy和Scipy.其中Numpy是一个用python实现的科学计算包.包括:一个强大的N维数组对象Array;比较成熟的(广播)函数库;用于整合C/C++和Fortran代码的工具包;实用的线性代数、...

黄岩区13042287144： python sdk 怎么用 - ？
房娇先妮： sdk里面有demo代码么,有的话仿照着import即可.如果sdk里面有setup.py这个文件,那就是需要安装的.用命令行cd到这个文件夹,然后执行Python setup.py install即可

黄岩区13042287144： 如何在 Tableau 中利用 Python 的力量 - ？
房娇先妮： 2016年, Tableau便发布了 TabPy的试用版本,一个可以在 Tableau工作簿中运行 Python代码的新 API .当你通过 Tableau使用 TabPy时,你可以在 Python中定义计算字段,从而在你的可视化作品中充分挖掘大量机器学习库的潜力. 这个在 ...

黄岩区13042287144： 如何使用scikit - learn处理文本数据 - ？
房娇先妮： 应用scikit-learn做文本分类分类: Data Mining Machine Learning Python2014-04-13 20:53 12438人阅读评论(16) 收藏举报 20newsgroups文本挖掘Pythonscikitscipy 文本挖掘的paper没找到统一的benchmark,只好自己跑程序,走过路过的...

黄岩区13042287144： python怎样对tfidf计算出来的权值进行排序' - ？
房娇先妮： 1.使用python+selenium分析dom结构爬取百度|互动百科文本摘要信息;2.使用jieba结巴分词对文本进行中文分词,同时插入字典关于关键词;3.scikit-learn对文本内容进行tfidf计算并构造N*M矩阵(N个文档 M个特征词);4.再使用K-means进行文本聚类(省略特征词过来降维过程);5.最后对聚类的结果进行简单的文本处理,按类簇归类,也可以计算P/R/F特征值;6.总结这篇论文及K-means的缺点及知识图谱的一些内容.

你可能想看的相关专题

星空见康网

如何用python和scikit learn实现神经网络

你可能想看的相关专题