PaddlePaddle：在Serverless架构上十几行代码实现OCR能力

作者&投稿：仰达（若有异议请与网页底部的电邮联系）

简介：飞桨深度学习框架采用基于编程逻辑的组网范式，对于普通开发者而言更容易上手，同时支持声明式和命令式编程，兼具开发的灵活性和高性能。

飞桨(PaddlePaddle)以百度多年的深度学习技术研究和业务应用为基础，是中国首个自主研发、功能完备、开源开放的产业级深度学习平台，集深度学习核心训练和推理框架、基础模型库、端到端开发套件和丰富的工具组件于一体。

飞桨深度学习框架采用基于编程逻辑的组网范式，对于普通开发者而言更容易上手，同时支持声明式和命令式编程，兼具开发的灵活性和高性能。另外飞桨不仅广泛兼容第三方开源框架训练的模型部署，并且为不同的场景的生产环境提供了完备的推理引擎，包括适用于高性能服务器及云端推理的原生推理库PaddleInference，面向分布式、流水线生产环境下自动上云、A/B测试等高阶功能的服务化推理框架PaddleServing，针对于移动端、物联网场景的轻量化推理引擎PaddleLite，以及在浏览器、小程序等环境下使用的前端推理引擎Paddle.js。同时，透过与不同场景下的主流硬件高度适配优化及异构计算的支持,飞桨的推理性能也领先绝大部分的主流实现。

安装飞桨

飞桨可以被认为是一个Python的依赖库，官方提供了pip，conda，源码编译等多种安装方法。以pip安装方法为例，飞桨提供了CPU和GPU两个版本安装方法：

CPU版本安装方法：

pipinstallpaddlepaddle

GPU版本安装方法：

pipinstallpaddlepaddle-gpu

实践：手写数字识别任务

MNIST是非常有名的手写体数字识别数据集，在无论是Tensorflow的官方网站还是PaddlePaddle的新手入门，都是通过它做实战讲解，它由手写体数字的图片和相对应的标签组成，如：

MNIST数据集分为训练图像和测试图像。训练图像60000张，测试图像10000张，每一个图片代表0-9中的一个数字，且图片大小均为28*28的矩阵。这一小节将会以PaddlePaddle官方提供的MNIST手写数字识别任务为例，进行PaddlePaddle框架的基本学习。与其他深度学习任务一样，飞桨同样要通过以下四个步骤完成一个相对完整的深度学习任务：

数据集的准备和加载；

模型构建；

模型训练；

模型评估。

加载内置数据集

飞桨框架内置了一些常见的数据集，在这个示例中，开发者可以加载飞桨框架的内置数据集，例如本案例所涉及到的手写数字体数据集。这里加载两个数据集，一个用来训练模型，一个用来评估模型。

importpaddle.vision.transformsasTtransform=T.Normalize(mean=[127.5],std=[127.5],data_format='CHW')

下载数据集

train_dataset=paddle.vision.datasets.MNIST(mode='train',transform=transform)val_dataset=paddle.vision.datasets.MNIST(mode='test',transform=transform)

模型搭建

通过Sequential将一层一层的网络结构组建起来。注意，需要先对数据进行Flatten操作，将[1,28,28]形状的图片数据改变形状为[1,784]。

mnist=paddle.nn.Sequential(

paddle.nn.Flatten(),

paddle.nn.Linear(784,512),

paddle.nn.ReLU(),

paddle.nn.Dropout(0.2),

paddle.nn.Linear(512,10))

模型训练

在训练模型前，需要配置训练模型时损失的计算方法与优化方法，开发者可以使用飞桨框架提供的prepare完成，之后使用fit接口来开始训练模型。

#预计模型结构生成模型对象，便于进行后续的配置、训练和验证

model=paddle.Model(mnist)

#模型训练相关配置，准备损失计算方法，优化器和精度计算方法

model.prepare(paddle.optimizer.Adam(parameters=model.parameters()),paddle.nn.CrossEntropyLoss(),

paddle.metric.Accuracy())

#开始模型训练

model.fit(train_dataset,

epochs=5,

batch_size=64,

verbose=1)

训练结果：

Thelossvalueprintedinthelogisthecurrentstep,andthemetricistheaveragevalueofprevioussteps.Epoch1/5step938/938[==============================]-loss:0.1801-acc:0.9032-8ms/stepEpoch2/5step938/938[==============================]-loss:0.0544-acc:0.9502-8ms/stepEpoch3/5step938/938[==============================]-loss:0.0069-acc:0.9595-7ms/stepEpoch4/5step938/938[==============================]-loss:0.0094-acc:0.9638-7ms/stepEpoch5/5step938/938[==============================]-loss:0.1414-acc:0.9670-8ms/step

模型评估

开发者可以使用预先定义的验证数据集来评估前一步训练得到的模型的精度。

model.evaluate(val_dataset,verbose=0)

结果如下：

{'loss':[2.145765e-06],'acc':0.9751}

可以看出，初步训练得到的模型效果在97.5%附近，在逐渐了解飞桨后，开发者可以通过调整其中的训练参数来提升模型的精度。

与Serverless架构结合

PaddlePaddle团队首次开源文字识别模型套件PaddleOCR，目标是打造丰富、领先、实用的文本识别模型/工具库。该模型套件是一个实用的超轻量OCR系统。主要由DB文本检测、检测框矫正和CRNN文本识别三部分组成。该系统从骨干网络选择和调整、预测头部的设计、数据增强、学习率变换策略、正则化参数选择、预训练模型使用以及模型自动裁剪量化8个方面，采用19个有效策略，对各个模块的模型进行效果调优和瘦身，最终得到整体大小为3.5M的超轻量中英文OCR和2.8M的英文数字OCR。

本地开发

#index.py

importbase64

importbottle

importrandom

frompaddleocrimportPaddleOCR

ocr=PaddleOCR(use_gpu=False)

@bottle.route('/ocr',method='POST')

deflogin():

filePath='./temp/'+(''.join(random.sample('zyxwvutsrqponmlkjihgfedcba',5)))

withopen(filePath,'wb')asf:

f.write(base64.b64decode(bottle.request.body.read().decode("utf-8").split(',')[1]))

ocrResult=ocr.ocr(filePath,cls=False)

return{'result':[[line[1][0],float(line[1][1])]forlineinocrResult]}

bottle.run(host='0.0.0.0',port=8080)

开发完成之后，运行该项目：

pythonindex.py

可以看到服务已经启动：

然后通过Postman工具进行测试，首先准备一张图片（此处以PaddleOCR项目内置的测试图片为例）：

通过将图片转换为Base64编码，并以POST方法请求刚刚启动的Web服务，可以看到PaddleOCR的执行结果：

部署到Serverless架构

目前各大云厂商的FaaS平台均已经逐渐支持容器镜像部署。所以，可以将项目打包成镜像，并通过ServerlessDevs部署到阿里云函数计算。

部署前准备

首先需要完成Dockerfile文件：

FROMpython:3.7-slim

RUNaptupdate&&aptinstallgcclibglib2.0-devlibgl1-mesa-glxlibsm6libxrender1-y&&pipinstallpaddlepaddlebottlescikit-buildpaddleocrlescikit-buildpaddleocr

#Createappdirectory

WORKDIR/usr/src/app

#Bundleappsource

COPY..

编写符合ServerlessDevs规范的Yaml文档：

#s.yaml

edition:1.0.0name:paddle-ocraccess:defaultservices:paddle-ocr:component:fcprops:region:cn-shanghaiservice:name:paddle-ocrdescription:paddle-ocrservicefunction:name:paddle-ocr-functionruntime:custom-containercaPort:8080codeUri:./timeout:60customContainerConfig:image:'registry.cn-shanghai.aliyuncs.com/custom-container/paddle-ocr:0.0.1'command:'["python"]'args:'["index.py"]'triggers:-name:httpTriggertype:httpconfig:authType:anonymousmethods:-GET-POSTcustomDomains:-domainName:autoprotocol:HTTProuteConfigs:-path:/*

项目部署

首先构建镜像，此处可以通过ServerlessDevs进行构建：

sbuild--use-docker

构建完成之后，可以通过工具直接进行部署：

sdeploy--push-registryacr-internet--use-local-y

部署完成，可以看到系统返回的测试地址：

项目测试

此时，可以通过该测试地址进行测试，同样得到了预期效果：

项目优化

通过对部署在Serverless架构上的项目进行请求，可以看到冷启动和热启动的时间消耗：

通过冷启动与热启动的对比，我们可以发现，在热启动时，整个系统的性能是相对优秀的。但是遇到冷启动整个项目的响应时常是不可控的，此时可以考虑一下途径进行优化：

缩减容器镜像的体积，减少不必要的依赖、文件等，清理掉安装依赖时留下的缓存等；因为函数计算的冷启动包括镜像拉取时间；

部分流程进行优化，例如在PaddleOCR项目中有明确说明：“paddleocr会自动下载ppocr轻量级模型作为默认模型”，所以这就意味着该项目在Serverless架构的冷启动过程中，相对比热启动还增加了一个模型下载和解压的流程，所以这一部分在必要时是可以打入到容器镜像中，进而减少冷启动带来的影响；

开启镜像加速，可以有效降低容器镜像的冷启动，在阿里云函数计算官方文档中有相关镜像加速的性能测试描述：“开启函数计算的镜像加速后，可提速2~5倍，将分钟级的镜像拉取缩短至秒级”；

实例预留，最大程度上降低冷启动率。通过实例预留，可以通过多种算法/策略进行实例的预热和预启动，可以最大程度上降低Serverless架构冷启动带来的影响；

来源：阿里云

延津县15521592424： paddle是什么意思及用法？
殷田科德： paddle:名词:桨,木桨例如:We might be able to push ourselves across with the paddle. 我们也许可以用桨把自己推过去.动词:用桨划(船) 例如:They paddle their boat up the river. 他们划着小船往上游去了.动词:玩水例如:Children love to paddle at the beach.孩子们在海滩玩水.

延津县15521592424： oar和 paddle有什么区别？
殷田科德： 从这两个词在桨的意思上来看 oar特指单边的长桨,通常有铁环卡在船沿 paddle即可以是单边的也可以是双边的,短桨,需手持,不通过铁环卡在船沿

延津县15521592424： PaddlePaddle出现 Duplicated layer name 错误怎么办？
殷田科德： 出现该错误的原因一般是用户对不同layer的参数 name 设置了相同的取值.遇到该错误时,先找出参数 name 取值相同的layer,然后将这些layer的参数 name 设置为不同的值

延津县15521592424： paddle是什么意思 - ？
殷田科德： paddle 桨双语对照词典结果: paddle [英][ˈpædl][美][ˈpædl] n.[航海] 宽叶短桨; 桨状物; 搅拌金矿的铁器,类似铁铲的工具; 洗衣板,扁板; vi.涉水; 趟水; 用桨划船; 荡桨; vt.用浆划动,用船桨推动(船只); 搬运,运输; 拍打; 搅拌; 第三人称单数:paddles过去分词:paddled复数:paddles现在进行时:paddling过去式:paddled以上结果来自金山词霸----------------------------------- 如有疑问欢迎追问! 满意请点击右上方【选为满意回答】按钮

延津县15521592424： 百度Paddle会和Python一样,成为最流行的深度学习引擎吗？
殷田科德： 百度 PaddlePaddle 在和几款最常用的深度学习框架TensorFlow、Torch、Caffe比较之前,我们先重点介绍新出现的PaddlePaddle.Paddle其实已经有多年历史了.早在 2013 年,百度就察觉到传统的基于单GPU的训练平台,已经无法满足深度...

延津县15521592424： 英文中的paddle明轮翼指的是什么含义?？
殷田科德： 明轮翼是装在轮船上轮子状的驱动装置,见图.paddle动词可用于划桨,蹬脚踏车,名词可指一片木板,如船桨,乒乓球拍的木板也可以用这个词.

延津县15521592424： 如何评价百度开源的深度学习框架 Paddle？
殷田科德： 简单说一些第一印象(以目前的github repo为准).整体的设计感觉和Caffe心有灵犀,同时解决了Caffe早期设计当中的一些问题(比如说default stream).1. 很高质量的GPU代码2. 非常好的RNN设计3. 设计很干净,没有太多的abstraction,这一点比TensorFlow好很多.4. 高速RDMA的部分貌似没有开源(可能是因为RDMA对于cluster design有一定要求):5. 设计思路比较像第一代的DL框架,不过考虑到paddle已经有年头了,这样设计还是有历史原因的.

延津县15521592424： Paddle在汽车术语是什么意思 - ？
殷田科德： paddle 是船上用的桨, 很少用在汽车上,汽车上的踏板应该用pedal吧, 制动踏板:brake pedal, 离合踏板:clutch pedal, 油门踏板:accelerator pedal 如果想更好地理解,应该把整个句子放进来,看看用在什么语境中.

延津县15521592424： paddle是什么意思？
殷田科德： n. 短桨, 划桨, 明轮翼 vi. 划桨, 戏水, 涉水 vt. 用桨划, 搅, 拌

延津县15521592424： paddle streamer什么意思？
殷田科德： paddle steamer吧,明轮船,弥汽船的意思

你可能想看的相关专题

paddlepaddle与cuda的版本不对

paddlepaddle和pytorch区别

paddlepaddle框架好用吗

飞桨paddlepaddle

星空见康网

PaddlePaddle：在Serverless架构上十几行代码实现OCR能力

你可能想看的相关专题