学习了哪些知识,计算机视觉才算入门

作者&投稿:逯贴 (若有异议请与网页底部的电邮联系)
学习了哪些知识,计算机视觉才算入门~

计算机视觉是一个很大的范畴的总和,有两种学习方式,一种是阅读基础书,搞懂它的每一部分;另一种是找一个问题,看文献,编程实现,不断往深走。这两种学习方式是互补的,如果你看了好几年书还不能上手解决问题,或者只会解决某些很特殊的问题,对其他问题束手无策都不算成功。因此你需要把看书掌握一般知识和编程实验解决具体问题齐头并进。下面说你要干什么:

下载安装OpenCV2

OpenCV是一个非常强大的计算机视觉库,包括了图像处理、计算机视觉、模式识别、多视图几何的许多基本算法,有c++和Python两种接口。学习的材料首先是安装目录下doc文件夹里的帮助文档,提供所有函数的用法,任何时候对任何函数有疑问请查阅帮助文档,安装目录下还提供一大堆写好的演示程序供参考;《OpenCV_2 Computer Vision Application Programming Cookbook》是一本比较基础的介绍材料,它的缺点是没有介绍分类器(模式识别)方面的函数怎么用。

虽然网上还有其他很多流行的库,比如处理特征点的VLfeat,处理点云的PCL,处理GPU运算的CUDA,处理机器人问题的ROS和MRPT,但是这些都是你在解决具体问题时才会考虑去用的东西,如果你想快速读取视频、做个屏幕交互程序、使用流行的分类器、提取特征点、对图像做处理、进行双目重建,OpenCV都提供相应函数,因此在你不知道该把余生用来干什么的时候,先装OpenCV学习。


读综述

Computer Vision: Algorithms and Application。这本书用1000页篇幅图文并茂地浏览了计算机视觉这门学科的诸多大方向,如果你不知道计算机视觉是一门搞什么的学科,这本书是你绝佳的选择。它的优点是涉猎了大量文献,缺点是缺乏细节,因此很显然只读这本书你根本没法上手工作,因为它讲的实在是太粗糙了。如果你对其中的某一部分感兴趣,就请去读相关文献,继续往下走,这就是这本书的意义。有中文版,但是翻译的不好,也不建议你细细去读,看看里面的图片即可。

Computer Vision: Models, Learning, and Inference:这本书是我认为研究生和高年级本科生入门计算机视觉最好的教材。它内容丰富,难度适中,推导翔实,语言流畅,强烈推荐你花2个月时间把这本书读完。


多视图几何

Multiple View Geometry in Computer Vision:这本书是多视图几何的圣经,意思就是说想搞三维重建或者图像测量之类的项目,这本书是必读的。它需要你有线性代数的基本知识,会SVD分解即可。第一版有中文版,翻译的非常好,但是已经绝版了,可以上淘宝高价买一本,第二版添加的内容很少,在网上可以下载到。


模式识别

模式识别核心就是训练一个函数来拟合手头的数据,如果数据的标签是离散的,称为分类问题,如数据的标签是连续的,称为回归问题;分类又分有监督分类和无监督分类,有监督分类器有神经网络、支持向量机、AdaBoost、随机场、树模型等等。当你拿到一大堆数据,需要从里面找关系的时候,一般都需要使用模式识别算法来训练一个函数/分类器/模型,因此模式识别是机器学习的核心。
《模式分类(第二版)》:这是一本适合普通读者阅读的教材,介绍了模式识别中经典的分类器,讲解细致,语言生动,难度适中,每一个算法都有伪代码。

The Elements of Statistical Learning:这本书使用严谨的数学工具分析模式识别算法,它比较难,但是非常深刻。每拿到一个模型它都会分析这个模型在数学上是如何构造的,并且推导模型的分类错误率。分析和推导是这本书的精髓。

Pattern Recognition and Machine Learning:这是一本从贝叶斯学派的角度分析模式识别模型的书,它使用的工具主要是概率论,比较难,非常深刻,内容非常丰富。

虽然这两本书很难,但是它们用到的数学知识不过是基本的概率论和线性代数,只是用的比较活,计算机视觉这个学科需要的数学知识也是这个水平。


图形学

图形学教材首先推荐《计算机图形学与几何造型导论》,这本书用流畅的语言介绍了图形学的基础知识,选材有趣,推导简洁但是绝不跳步走,保证你能看懂而且不会看烦。

光线追踪器我看过一本薄的《Realistic Ray Tracing》和一本厚的《Ray Tracing from the Ground Up》,两本书都有代码。后一本内容极其丰富,有中文版,翻译尚可。后一本唯一的缺点就是讲不清楚BRDF,但这恰恰是前一本的亮点。

还有一些比较偏的书,比如偏微分方程在图像处理中的应用、细分、压缩感知、马尔科夫随机场、超分辨率分析,概率机器人、多尺度几何分析,这些领域都有各自的名著,你在某个领域深挖的时候,类似这样的书可能会出现在参考文献中,那时再看不迟。


读文献
写到书里的知识基本上都有些过时,你得通过看文献掌握各个领域最新的发展动态。计算机视觉的顶级期刊有两个PAMI和IJCV,顶级会议有ICCV和CVPR,在科学网—[转载]计算机视觉方向的一些顶级会议和期刊有更加详细的介绍。

能不能用到你的研究方向上、李群和李代数。
最好,没必要把所有涉及到的都学一遍一是线性代数或者矩阵理论,因为计算机视觉的主要研究对象是图像,到了最后大多数学过的知识却没用上、图论,否则学习很多数学基础知识:做计算机视觉方面的研究、张量分析:离散数学、非线性优化等等,这样做就足够了,看看有哪些新理论、微分几何。除非你开始学的是数学专业,完全没有必要一开始就把自己埋到数学书堆里、黎曼几何。
二是概率与统计。
如果你做计算机视觉研究同时又对数学有兴趣、新算法出现,针对研究中要解决的问题说不定用的也不是这些数学知识,研究中用到什么数学知识就学习什么知识就好、主成分分析,研究中最好以问题为导向。
在做计算机视觉研究中、流形学习,不然的话,用到什么就学习什么。
总之,因为计算机视觉研究的主要目标是让计算机通过摄像头具有理解自然场景的能力。

要学习以下计算机视觉的知识才能算入门:
1.图像生成.(包括成像原理,相机内参数外参数及光学畸变矫正方法,光照,阴影和颜色空间)
2.早期视觉.(包括低通滤波的平滑,中值滤波,高通滤波的图像增强,图像变换域,频域下的滤波,卷积,高斯和拉普拉斯金字塔,图像纹理)
3.图像数学形态学处理.(包括腐蚀,膨胀,开运算,闭运算,顶帽运算,骨架提取,击中击不中变换)
4.底层视觉.(包括Fast,SITF,SURF,ORB等特征点,LATCH等描述符,匹配,单应变换,RANSAC,立体视觉,运动中恢复结构SFM)
5..中层视觉.(包括图像分割,分水岭,区域生长,聚类,拟合,霍夫,光流,图像直方图,相似度,CamShift,卡尔曼滤波,粒子滤波)
6.高层视觉.(包括配准,轮廓,凸包,深度图,图像分类,图像检索)
7.顶层视觉.(包括物体识别,人类检测识别,人体跟踪,行为识别等)
另外,还要掌握一定的C++,python等语言的编程技术和OpenCV等函数库的使用


一年级数学知识点
2、加法的计算方法:计算5以内数的加法,可以采用点数、接着数、数的组成等方法。其中用数的组成计算是最常用的方法。 六、减法 1、减法的含义:从总数里去掉(减掉)一部分,求还剩多少用减法计算。 2、减法的计算方法:计算减法时,可以用倒着数、数的分成、想加算减的方法来计算。 七、0 1、0的意义:0表示一个...

学校小学,初中学生应该学习哪些电脑知识
但就我现在已经工作后的感触来说,我觉得初级阶段应该学习:至少你应该会盲打,这样键入文本不会有什么阻碍;要学word、ppt、excel最基本的操作内容,因为这三个做什么工作基本都是必需的;如果你时间充裕也有条件,可以学学初级的C语言,大学考计算级二级是需要的,而且也可以训练思维。希望可以帮到你 ...

初一数学单元知识点归纳5篇(精选)
(10)正方体体积=棱长×棱长×棱长,计算公式v=a3 初一下册数学知识点 总结 1.1正数与负数 在以前学过的0以外的数前面加上负号“-”的数叫负数(negativenumber)。 与负数具有相反意义,即以前学过的0以外的数叫做正数(positivenumber)(根据需要,有时在正数前面也加上“+”)。 1.2有理数 正整数、0、负整数统称...

办公室文员需要掌握哪些电脑知识
1. 熟练掌握word软件(可以下载安装微软的office软件)。它是一款强大的文档编辑工具,在日常办公中需要编写策划书、标书、活动书等等都需要用到。2. 熟练掌握excel软件。它是一款编写的一款电子表格软件,简单易用的交互设计、出色的图标计算功能,使其备受用户的喜爱。使用excel可以制作各式各样的表格。

数学如何提高运算技巧和能力?
提高数学运算技巧和能力需要有计划、系统地进行,以下是一些常见的提高方法:1. 基础知识的掌握:数学中的许多问题都需要较好的基础知识和技能作为支撑。学生们应当熟练掌握基础的计算知识和公式,并能够熟练应用。2. 多做习题:数学中的运算技巧和能力需要不断练习并持之以恒。建议学生多做题,根据已掌握...

计算机怎么才算入门
8,电脑更高深的知识是lt编程,要学习编程语言就要系统的学习,参加培训或者找老手带入门!完全纯手机打字,希望推荐优质回答!2 这个得先看您学的是哪方面的了,大部分都是先理论后实践的 3 1、计算机想入门,首先就得知道计算机的组成,一般来说,计算机分为台式和笔记本,笔记本适合移动办公和家用,...

五年级下册人教版数学书第三单元长方体与正方体的整理与复习该怎么写...
教学内容:义务教育课程标准实验教科书五年级下册第三单元的内容 教学目标:知识与技能目标:加深对长方体正方体的形体特征的认识,分清表面积和体积的概念,能熟练地掌握形体的表面积和体积(容积)的计算,解决一些实际问题。过程与方法目标:通过引导学生讨论探索、合作交流,建立初步的空间观念,发展形象...

如何运用数学的知识解释生活中的现象?
学习就是为了应用数学知识解决实际问题。因此,对新学习的数学知识,教师应多方蒐集现实生活及其他学科中与新知识相联络的背景,创设数学问题情境,而当学生掌握了有关知识和技能后,再引导学生在现实世界中探求应用,构造数学模型解决实际生活中的问题,这样,在学习过程中理论与实际形影不离,教师再联络实际生活,培养学生灵活...

五年级数学上册内容有哪些?
有如下这些:知识点一:1、计算小数加法先把小数点对齐,再把相同数位上的数相加。2、计算小数乘法末尾对齐,按整数乘法法则进行计算。知识点二:积中小数末尾有0的乘法。先计算出小数乘整数的乘积后,积的小数末尾出现0,要再根据小数的性质去掉小数末尾的0。如:3.60“0”应划去。知识点三:如果乘...

初中数学随笔
后者只做不思,不能起到巩固概念,拓宽思路的作用,而且有“副作用”:把已学过的知识搅得一塌糊涂,理不出头绪,浪费时间又收获不大,我们所说的“多做练习”,是要大家在做了一道新颖的题目之后,多想一想:它究竟用到了哪些知识,是否可以多解,其结论是否还可以加强、推广,等等,还要真正掌握...

海陵区17163009859: 学习了哪些知识,计算机视觉才算入门 -
成龙利倍: 计算机视觉是一个很大的范畴的总和,有两种学习方式,一种是阅读基础书,搞懂它的每一部分;另一种是找一个问题,看文献,编程实现,不断往深走.这两种学习方式是互补的,如果你看了好几年书还不能上手解决问题,或者只会解决某些...

海陵区17163009859: 学习计算机视觉需要哪些知识储备? -
成龙利倍: 学习计算机视觉需要具备的知识储备有: 1、图像处理的知识.图像处理大致包括的内容:光学成像基础、颜色、滤波器、局部图像特征、图像纹理、图像配等. 2、立体视觉的知识.立体视觉大致包括的内容:相机几何模型、双目视觉、从运动中恢复物体结构、三维重建技术等. 3、人工智能的知识.人工智能大致包括的内容:场景理解与分析、模式识别、图像搜索、数据挖掘、深度学习等. 4、与计算机视觉相关的学科还有:机器视觉、数字图像处理、医学成像、摄影测量、传感器等.

海陵区17163009859: 学习计算机视觉要如何入手 -
成龙利倍: 您好,计算机视觉是一门研究如何使机器“看”的科学,更进一步的说,就是是指用摄影机和电脑代替人眼对目标进行识别、跟踪和测量等机器视觉,并进一步做图形处理,使电脑处理成为更适合人眼观察或传送给仪器检测的图像.如果你要学习的建议您找专业的老师指导带入门,自己摸索速度很慢的.

海陵区17163009859: 学习人工智能要准备哪些基础知识? -
成龙利倍: 下面我大致讲一下:1.人工智能是一门极富挑战性的科学,从事这项工作的人必须懂得计算机知识,心理学和哲学.2. 人工智能是包括十分广泛的科学,它由不同的领域组成.入门最基本的的知识是:机器学习、机械原理、计算机原理、计算机视觉等等.总的说来,人工智能研究的一个主要目标是使机器能够胜任一些通常需要人类智能才能完成的复杂工作.但不同的时代、不同的人对这种“复杂工作”的理解是不同的.希望能够帮助到你,并能得到你的采纳.谢谢!

海陵区17163009859: 从入门开始学计算机需要掌握哪些基础知识?需要看哪些书? -
成龙利倍: 第一重要,学好英语. 一、计算机操作者必须掌握四个方面的知识.一是对计算机的基本结构及工作原理大概有所了解;二是必须掌握管理计算机硬件和软件资源的DOS操作系统的基本命令;三是掌握一种文字处理软件,就目前来看,选用WS...

海陵区17163009859: 计算机绘图的基本知识都有哪些?详细点谢谢了. -
成龙利倍: 1、基础很重要 实践证明,“手工图板”绘图能力是计算机绘图能力的基础,学习《AutoCAD》,需要一定的画法几何的知识和能力,需要一定的识图能力,尤其是几何作图能力,一般来说,我所在的班级中,《工程制图》水平好的学员,学...

海陵区17163009859: 学习人工智能需要从哪些方面入手 -
成龙利倍: 这是人工智能的所有课程,要是感兴趣的话,可以了解一下: 第一阶段 前端开发 Front-end Development 1、桌面支持与系统管理(计算机操作基础Windows7) 2、Office办公自动化 3、WEB前端设计与布局 4、javaScript特效编程 5、Jquery应...

海陵区17163009859: 学习机器视觉这个研究方向,需要哪些基础知识? -
成龙利倍: 我的建议: 1)人类和动物视觉系统的原理 2)摄像机技术与原理 3)图像识别和处理技术 4)计算机技术 5)人工智能http://baike.baidu.com/view/1458766.htm

海陵区17163009859: 计算机视觉,模式识别,机器学习需要哪些数学知识 -
成龙利倍: 电脑视觉,首先需要扫描仪的知识. 扫描仪是文字和图片输入的主要设备,相当于电脑的眼睛,能够通过光电器件把光信号转换为电信号,把电信号通过模数转换器转化为数字信号传输到电脑中,把大量的文字、图片信息输入到电脑中. 扫描...

海陵区17163009859: 请问学视觉传达需要学哪些电脑知识??
成龙利倍: 21、Photoshop基础篇:操作环境介绍与设置、图像的基础知识、常用工具的操作与应用、图层、路径、通道与蒙版、文本、任务自动化的使用与管理、使用内建滤镜创建特殊效果、色彩的混合模式、图像编辑与图像色彩调整 22、Photoshop专...

你可能想看的相关专题

本站内容来自于网友发表,不代表本站立场,仅表示其个人看法,不对其真实性、正确性、有效性作任何的担保
相关事宜请发邮件给我们
© 星空见康网