1. 计算机视觉是什么
计算机视觉是一门研究如何使机器“看”的科学,更进一步的说,就是是指用摄影机和电脑代替人眼对目标进行识别、跟踪和测量等机器视觉,并进一步做图形处理,使电脑处理成为更适合人眼观察或传送给仪器检测的图像。作为一个科学学科,计算机视觉研究相关的理论和技术,试图建立能够从图像或者多维数据中获取‘信息’的人工智能系统。这里所 指的信息指Shannon定义的,可以用来帮助做一个“决定”的信息。因为感知可以看作是从感官信号中提 取信息,所以计算机视觉也可以看作是研究如何使人工系统从图像或多维数据中“感知”的科学。
计算机视觉是使用计算机及相关设备对生物视觉的一种模拟。它的主要任务就是通过对采集的图片或视频进行处理以获得相应场景的三维信息,就像人类和许多其他类生物每天所做的那样。
计算机视觉是一门关于如何运用照相机和计算机来获取我们所需的,被拍摄对象的数据与信息的学问。形象地说,就是给计算机安装上眼睛(照相机)和大脑(算法),让计算机能够感知环境。我们中国人的成语"眼见为实"和西方人常说的"One picture is worth ten thousand words"表达了视觉对人类的重要性。不难想象,具有视觉的机器的应用前景能有多么地宽广。
计算机视觉既是工程领域,也是科学领域中的一个富有挑战性重要研究领域。计算机视觉是一门综合性的学科,它已经吸引了来自各个学科的研究者参加到对它的研究之中。其中包括计算机科学和工程、信号处理、物理学、应用数学和统计学,神经生理学和认知科学等。
(1)计算机网络视觉系统扩展阅读:
计算机视觉就是用各种成像系统代替视觉器官作为输入敏感手段,由计算机来代替大脑完成处理和解释。计算机视觉的最终研究目标就是使计算机能象人那样通过视觉观察和理解世界,具有自主适应环境的能力。要经过长期的努力才能达到的目标。因此,在实现最终目标以前,人们努力的中期目标是建立一种视觉系统,这个系统能依据视觉敏感和反馈的某种程度的智能完成一定的任务。例如,计算机视觉的一个重要应用领域就是自主车辆的视觉导航,还没有条件实现像人那样能识别和理解任何环境,完成自主导航的系统。
因此,人们努力的研究目标是实现在高速公路上具有道路跟踪能力,可避免与前方车辆碰撞的视觉辅助驾驶系统。这里要指出的一点是在计算机视觉系统中计算机起代替人脑的作用,但并不意味着计算机必须按人类视觉的方法完成视觉信息的处理。计算机视觉可以而且应该根据计算机系统的特点来进行视觉信息的处理。
但是,人类视觉系统是迄今为止,人们所知道的功能最强大和完善的视觉系统。如在以下的章节中会看到的那样,对人类视觉处理机制的研究将给计算机视觉的研究提供启发和指导。因此,用计算机信息处理的方法研究人类视觉的机理,建立人类视觉的计算理论。这方面的研究被称为计算视觉(Computational Vision)。计算视觉可被认为是计算机视觉中的一个研究领域。
2. 计算机视觉技术国内 国外发展历史及现状
1研究现状及存在的问题
水果实时分级系统主要功能是水果外部品质和内部品质的自动检测。水果的外部品质检测的项目有大小、形状、颜色、表面缺陷等,内部品质无损检测的项目为水果的硬度、糖含量、酸度、口味及某些内部缺陷等。
1.1水果外部品质的自动检测
水果的尺寸和颜色检测技术已比较成熟,且在国外已经实现自动化检测,在国内也有按重量或尺寸分级的系统。但果面的缺陷检测却一直成为水果实时分级的障碍。
果面缺陷检测的技术比较复杂,目前存在以下几方面难题。
1.1.1对水果整个表面进行实时视觉检测比较困难
在水果分选生产线上,输送机构输送水果并把水果整个表面呈现给摄像机,这是水果实时分级系统比较关键的组成部分,因为当水果通过时,要求视觉系统能快速检查每个水果的全部果面,即使很小的缺陷面积,也会使得水果级别发生很大变化。同时,设计的视觉分级系统必须满足高生产率的要求。在这方面,国外学者(Growe,1996,Tao,1996)[1,2]采用滚子输送带使水果一边移动一边自身转动,从而使安装在输送带上方的摄像机能采集到水果的多个面的图像,达到全表面检测的目的。但由于水果大小和形状不规则,造成水果旋转速度不一致且难以保证按同一轴线旋转。此外,水果旋转两端的表面部分摄像机无法采集到,因此,分级误差较大。
1.1.2快速而准确地测定水果表面的各种缺陷且与梗、萼凹陷区正确区分比较困难
Miller等(1991)[3]对桃子的分选试验表明:因不能正确区分水果表面的缺陷和梗、萼凹陷区,由此产生的分级误差为25%左右。Rehkugler等(1986)[4]利用机械定向机构使苹果梗、萼处于垂直方向并绕梗萼轴旋转,CCD线扫描摄像机可扫描苹果的整个表面且形成一幅图像,该方法的特点是由机械定向机构定位水果梗、萼区,摄像机对此区不需要再检查。但因为受定向机构速度的限制,还达不到实时分级的速度,试验结果为每分钟选30个苹果。Yang(1996)[5]利用结构光图像与散射光图像相结合来区分梗、萼区和缺陷区,综合两方面图像处理的结果,共抽取16个特征参数,再利用BP神经网络区分苹果的梗、萼区和缺陷区,分辨精度为95%,但还需要进一步把试验结果应用于实际水果分选生产线中。Growe等(1996)[1]采取在780 nm附近带域内,用结构光由一黑白摄像机进行水果表面的凹陷度检测;在750 nm带域内的散射光照射下,由一黑白摄像机进行水果表面的可疑缺陷区检测。水果的输送旋转装置及摄像机布置如图1a所示,采用的双锥滚筒输送带可使水果一方面沿水平方向作平移运动,另一方面又绕自身水平轴作旋转运动。两个黑白CCD摄像机用来采集750 nm附近的散射光图像和780 nm附近的结构光图像,水果旋转一周摄取两次图像。两个黑白摄像机采集的图像经过设计的接口电路后,被合成为一幅黑白图像,合成过程如图1b所示。图像的处理由流水线图像处理系统完成。试验结果表明:每个水果采集两幅图像时,缺陷检测的速度可达5个/s,但误差较大,如对于苹果,碰伤检测的准确率仅为51%。试验表明,要想得到较高的检测精度,每个水果应采集5幅以上的图像,结构光至少6条以上。此外,由于水果尺寸不同所造成各个水果旋转速度的不一致,也是产生测量误差的原因。徐娟(1997)[6]及Nakano(1997)[7]利用人工神经网络法对缺陷区和梗萼区进行区分,试验表明神经网络的区分准确率较低。在果面各种缺陷的快速检测方面,Throop(1997)[8]等人研究了多光谱测量技术,对10个品种的苹果的22种缺陷,在460~1 030 nm光谱范围内,每隔10 nm试验测定了它们的反射光谱特性,其中对3种苹果同一种缺陷测量的结果如图2所示。图中纵坐标的马氏距离反映了水果缺陷区与正常区反射强度的差别程度,距离越大,两者差别越大。由图中曲线可看出:在中心为540 nm、740 nm、1 030 nm三波段附近,3种苹果同一缺陷与正常区的反射强度的差别表现为最大或最小值,最后通过对3个波段的图像进行简单的减法和阈值处理,即可得到检测的缺陷,下一步应考虑实际应用的实现。
(a)(b)
图1图像采集布置图与图像合成示意图
(a)输送装置及摄像机布置(b) 图像合成示意图
图23种苹果同一缺陷在460~1 030 nm
范围内与正常区反射强度的差别情况
1.1.3球形水果表面引起光照强度在投影面内呈曲面分布,以及二维图像上的透视区域与水果实际表面存在的畸变,给图像的缺陷检测带来困难和造成误差
Tao(1996)[2]提出的球形变换法很好地解决了第一个问题。基本思想如图3所示:带缺陷的原始物体图像(OOI)与该物体反表面无缺陷的图像(IOI)相加得到变换后的物体图像(TOI),此图像具有平面物体图像的性质,而缺陷区低于该平面,然后经过简单阈值处理即可得缺陷区。何东健(1997)[9]提出了缺陷透视图像面积发生畸变的校正方法,但对复杂形状的缺陷区进行校正,还存在一定的困难。Nakano(1997)[7]利用一旋转平台使水果旋转,每旋转18°CCD摄像机采集一幅图像,苹果旋转一周可得20幅图像,为消除苹果球面面积的畸变,每幅图像只保留中间13 cm宽度的幅面,再全部合成一幅苹果整个表面的展开图像,此法非常有效,但在分选生产线上实现比较困难。
图3球形变换方法
1.1.4传统的图像处理及模式识别算法的速度不适合实时分选线的要求
国外一般采用高速图像处理硬件与简单有效的图像处理软件相结合的途径,来实现水果的实时分级。如Yang(1996)[5]利用的是Transputer系统、结构光法和洪水算法;Growe等(1996)[1]研制的系统,图像的大部分工作由流水线图像处理硬件系统完成;Tao(1996)[2]采用的是专用Merlin图像处理系统和简单有效的球形变换法,研制的苹果分选系统已应用到水果分选生产线上,其分选速度可达3 165个/min。国内研究者(刘禾,1998,徐娟,1997,杨秀坤,1997,何东健,1997)[6,9~11]大多利用一般的微机和图像采集卡,开发了一些图像处理和模式识别的新算法,如把人工神经网络、模糊理论、遗传算法、图像形态学、分形理论、小波理论及人工智能理论用于图像特征的抽取和识别。但由于图像处理的硬件速度太低,故只能限于静态水果图像分选的算法研究。此外,水果分级的算法应具备人工分级的一些优良性能,如学习与记忆功能,因为目前的一些分级算法的训练样本都比较少,而要分级的水果品种多变且量大。
1.2水果内部品质无损检测
反映水果内部品质的主要指标有硬度、糖含量、酸度、口味及内部缺陷等。目前国内外研究的主要方法和存在的问题如下。
1.2.1水果的硬度检测
水果的硬度可间接反映水果的成熟度、运输中的抗损坏性、储藏期等。目前用于水果硬度检测的方法主要有变形法和声学法。
变形法就是在一定时间内给水果施加一定的动态力或冲击力,然后根据测得的变形量确定水果的硬度。如Schmilovitch等(1995)[12]研制成功了枣子硬度自动检测系统,其原理是把枣子放在两平板之间,在上面板施加5~8 N的动态力,根据所测变形量的大小把枣子分成4个硬度等级。Delwiche(1991)[13]利用冲击法研制了苹果硬度自动检测系统,发现冲击力会造成苹果表面的轻微损伤。变形法只能测量水果表面的局部硬度,实际上,水果表面硬度变化较大,故限制了变形法的应用。
声学法包括声波脉冲响应法和超声波法,声波脉冲响应法(20~1 500 Hz)就是利用一麦克风测量受轻微敲击水果的声波强度,由此确定水果的硬度。Armstrong等(1993)[14]试验研究了所测声波强度与水果硬度的关系,发现二者有很好的相关关系。此法的优点是简单、无损,且能反映水果的整体硬度,缺点是必须注意周围噪声的绝缘及机械振动的消除,此外水果形状也影响测量精度。超声波(>20 000 Hz)法是根据超声波在水果等介质中传播时,能量衰减系数的大小来确定水果硬度。但由于水果内部含有较多气隙且各向异性,故超声波很难穿透整个水果。
1.2.2糖含量、酸度、口味的自动检测
糖含量、酸度比较有潜力的检测方法是近红外法(NIR)和磁共振法(MR)。近红外法又分穿透法、反射法和部分穿透法,部分穿透法原理如图4所示。穿透法对水果不适应,反射法一般用于水果表面特征的检测,因此常用的方法是部分穿透法。由图4可看出,在部分穿透法中,光线经过的路径比穿透法短,且入射光线与接收器有一夹角,此夹角的确定对测量起关键作用,此外二者之间必须加一隔板。884 nm和834 nm测得量的比值已用于桃子、苹果(Slaughter ,1995)[15]糖含量的自动测定。Slaughter等(1996)[16]对西红柿,在400~1 100 nm的光谱范围内进行部分穿透性测量试验,结果表明:800~1 000 nm范围的信息对糖含量的确定最有用,测得的相关系数r=0.92, 但酸度测量比较困难。Mizrach(1997)[17]利用超声波法试验研究了超声波衰减系数和芒果硬度、糖含量、酸度的关系,但其超声波测量探头必须与果面接触,故限制了在线的应用。因此,利用近红外多光谱技术测定水果内部糖含量及其他成分是很有前途的,为达到实时应用的目的,应进一步确定最合适的一两个波段并与计算机视觉技术结合。磁共振及磁共振成像(MRI)技术也是测定水果内部成分的有效方法,其依据是物质内部的某些原子核(H、C、P等)在外部磁场作用下,可与射频区域的电磁波辐射相互作用。Chen等(1996)[18]利用此法对鳄梨的成熟度和鲜杏梅的糖含量进行了一些研究,得到了较好的结果。此法的主要缺点是设备昂贵。
图4部分穿透法
与水果的口味相关的化学成分主要是可挥发性芳香化合物,当水果成熟时,就会在周围空气中散发这种挥发性芳香气体。Benady等(1995)[19]研制的电子传感器可以测量这种气体的浓度。
1.2.3水果内部缺陷的检测
西瓜的内部空心用超声波检测已比较成熟。其他缺陷的检测,目前国外正研究利用X射线法、磁共振和磁共振成像技术等方法测量,因成本高及安全性等问题,故很难在农业中推广应用。
2研究的途径及方向探讨
水果实时分级系统的进一步研究应从两方面入手,一方面要加快水果外部品质的计算机视觉实时分选技术的研究;另一方面也要进行水果内部品质的无损检测技术的研究。因为水果分级的主要目的是选出高质量的水果,故水果内外品质的检测技术都十分重要。
在水果的外部品质检测方面,应进行多种技术集成的应用研究。
(1) 对于水果整个表面机器视觉快速检测的问题,可采用机械与光学技术相结合,设计合理的传送机构,既保证水果在传送带上比较平稳地移动,又可由视觉系统快速检测到水果的全部表面。尽量减小因水果不规则运动造成的分级误差、损伤及图像的模糊。
(2) 对于果梗、萼区与缺陷的检测与视觉区分方面,应采用多光谱技术与机器视觉技术相结合,研究水果图像上可疑缺陷区的关键特征参数的抽取方法,得到简单、有效、快速的图像处理和识别方法。
(3) 在球形果面造成的光反射强度呈曲面分布及曲面成像面积的畸变问题,可从光照设计、图像合成及软件补偿3方面综合考虑。光照的充分设计可解决第一个问题;多幅图像的有效合成,可解决畸变问题。我们通过试验表明:一个水果至少应采集5幅图像,然后再合成为一幅,可基本保证水果整个表面上缺陷的有效检测,以避免畸变误差。软件补偿的方法必须简单而有效,以适合高速的要求。
(4) 在实时系统的图像处理器硬件设计方面,首先应采取先进的并行CPU芯片,如TMS320C80等;其次处理板的设计应与视觉系统结合起来考虑,如采集多路视觉信号的合成问题,机械机构与视觉系统的同步电路设计等。当然,也可引进国外比较成熟的高速图像处理主板,而其他技术可由国内自行开发,这样可以加快国内水果实时分级系统实现自动化的步伐。
(5) 在图像处理和识别的软件设计方面,应把传统方法与现代新方法(神经网络,并行算法,遗传算法,模糊技术,人工智能,图像形态学,分形学,小波变换等)结合起来,改变传统图像信息的超数据量表达方式,寻求图像表达与解释的新方法,力求图像处理和识别算法的快速性、有效性及鲁棒性。
在水果内部品质检测方面,声学振动法是实现硬度自动检测的有效方法,但应设法消除影响测量精度的因素,并进行在生产线上的应用开发;近红外局部投射法和磁共振法是水果糖含量、酸度等内部成分自动检测的有效方法。在国内,近红外局部投射法更有应用前景,应进一步研究其通用性、稳定性和实用性;内部缺陷的无损检测应进一步研究新原理和新方法,应采取自己开发和从国外引进相结合的方式。此外,应进行多种传感器测量信息集成技术的研究,这是水果内外品质实现实时自动检测与分级的有效途径。
3结语
利用各种现代技术的高度集成,在水果分选生产线上同时完成水果内外品质的检测与分级是将来进一步研究的方向和目的。随着科学技术的飞速发展,在我国近期有望实现农产品品质的自动化检测与分级。
3. 机器人和人类视觉系统一样吗,它们眼里是哪样的世界
计算机视觉是人工智能的子学科,而人工智能则是仿生学的一种。人工智能旨在模仿人(有时也包括其他动物)的行为和思维,而计算机视觉将模仿的对象集中在了人眼上,即模仿人“看”的行为。
换言之,计算机视觉是一门利用摄影机和计算机代替人眼进行图像获取、目标识别、跟踪、测量、理解和处理的学科。作为一门交叉学科,计算机视觉与许多学科有重要联系:机器学习、神经生物学、认知科学、信号处理(图像处理)等。在后面的介绍中,这些学科间的联系将变得更加清晰。
也许高级视觉才是计算机视觉中最有趣的一部分,因为它是人类视觉中至今还无法被完全解密的部分(也许连部分解密都谈不上)。当你站在杂乱、昏暗的酒桌前,从看到的图像中识别出沮丧的彼得时,整个过程只需要0.3秒。
事实上,现代处理器的运算速度远远高于人类视神经和大脑中神经突触的信息传递速度。但人类视觉的功能是如此的强大,以至于计算机视觉系统远远不能达到人类的水平。较新的研究表明,人类发达的视觉系统得益于一套大规模并行计算系统──不计其数的神经元形成的视觉通路,它就像一张有无数节点的计算网络,信息在其中往返传递。
高级视觉任务几乎都围绕着两个字展开:识别。识别是给对象贴上标签的过程,即给对象附上含有语义的名称或描述。这是一种高级的视觉活动,需要学习、联想等更高级的大脑活动的参与。
拿图像的分割任务来说,图像不仅被分割成独立的像素块,视觉系统还为每个像素块贴上“标签”,比如“窗子”、“桌子”、“酒瓶”、“彼得的脸”等。通过模板比对,视觉系统将彼得的脸和经验中的图像联系了起来,从而引起了系统的兴趣。
从彼得的脸上提取的特征中,视觉系统还解读出了彼得的沮丧。于是在随后的图像中,视觉系统都将注意力放在了彼得的脸上,试图跟踪该对象。视觉系统在继续跟踪的同时,将从图像中得到的信息发送给决策器。
即使是当代最成功的算法和视觉系统都无法像人类一般高效地识别物体。对我们来说,识别 “一个瓷杯”处于不同状态似乎并不怎么困难,但对计算机视觉系统来说却不容易。
杯子可以有不同的摆放姿势、不同的光照强度和颜色、出现在画面中的不同位置、可能有的部分被遮挡,如果按不同状态就是不同的杯子这一点来判断,那就可能误判为存在不计其数的各式各样的杯子(即外观的区别)。
在绝大多数计算机视觉系统中,目标都被要求符合一些限制条件,否则,计算机视觉将成为不可能的任务。由此可见,在杂乱、昏暗的酒桌一角发现彼得对计算机视觉系统来说是多不容易的一件事情。
对人类来说,识别并非与生俱来的本领。婴儿睁大眼睛看着陌生的世界,他们的视觉实践是从测距、分割开始的。幼儿几乎每时每刻都在努力学习如何给图片贴标签。他们学习得很快,低龄儿童不仅可以成功地识别物品,还可以在一定程度上察言观色,感受到由表情传达的情绪。通过奖励和带教,可以加速儿童的学习过程。
通过这样的启发,高级视觉还将依赖机器学习这门学科。机器学习是研究如何通过算法让计算机实现人类的学习过程,从而让计算机不仅能够实现简单枯燥的任务,还能够向智能迈进一步。
作为人工智能领域的核心学科,机器学习如百家争鸣,不断取得着新的成绩。当今重要的机器学习算法有人工神经网络、遗传算法、支持向量机、贝叶斯网络、强化学习等。
至今,计算机视觉系统最为成功的案例,莫过于手写数字识别。MNIST是使用最广泛的手写数字库,为各类识别算法提供了一比高下的平台。MNIST中含有七万幅边长为28个像素的图像。目前最出色的识别算法一般都可以达到1%以内的错误率。
然而,MNIST只是对目标的外观做了有限多的变化,并没有涉及到有如杯子在不同状态下的各种变化。而且,28×28=784个像素的图片实在很小,如果处理普通大小的照片,视觉系统的运算量就会呈指数级增长,甚至让超级计算机都无能为力。
因此,对于哪怕是当今世上最聪明的机器人来说,像人类一样看到酒吧里沮丧的彼得并上前安慰,也是天方夜谭。但计算机视觉是一门新兴的学科,随着处理器硬件和人工智能算法的发展,也许有朝一日机器人也可以达到人类的视觉功能。
4. 机器视觉系统由哪几部分构成
机器视觉系统的应用领域越来越广泛。在工业、农业、国防、交通、医疗、金融直至体育、娱乐等等行业都获得了广泛的使用,可以说已经深入到我们的生活、生产和工作的方方面面。
一个完整的机器视觉系统的主要工作过程如下:
(1) 工件定位检测器探测到物体已运动至接近摄像机视野的中心,向图像采集卡发送触发脉冲;
(2) 图像采集卡按事先设定的程序和时延,分别向摄像机和照明设备发出起动脉冲;
(3) 摄像机停止目前的扫描,重新开始新的一帧扫描;或者摄像机在起动脉冲来到之前处于等待状态,起动脉冲来到后起动一帧扫描;
(4) 摄像机开始新的一帧扫描之前,打开曝光机构,曝光时间可以事先设定;
(5) 另一个起动脉冲打开灯光照明,灯光开启时间应与摄像机曝光时间匹配;
(6) 摄像机曝光后,正式开始一帧图像的扫描和输出;
(7) 图像采集卡接收模拟视频信号并通过A/D将其数字化,或者直接接收摄像机数字化之后的数字视频;
(8) 图像采集卡将数字图像放到处理器或者计算机的内存中;
(9) 处理器对图像进行处理、分析、识别,获得测量结果,或逻辑控制值;
(10) 处理结果控制流水线的动作;或进行定位,纠正运动的误差等。
机器视觉系统的优点有:
1、非接触测量,对于观测者与被观测者都不会产生任何损伤,从而提高系统的可靠性。
2、具有较宽的光谱响应范围,例如使用人眼看不见的红外测量,扩展了人眼的视觉范围。
3、长时间稳定工作,人类难以长时间对同一对象进行观察,而机器视觉则可以长时间地作测量、分析和识别任务。
http://..com/question/431373928.html?oldq=1
5. 机器视觉系统都由哪几部分组成那位高人指点下
从字面意思就可看出机器视觉系统主要分为三部分:机器、视觉和系统。机器负责机械的运动和控制;视觉通过光源、工业镜头、工业相机、图像采集卡等来实现;系统主要是指软件,也可理解为整套的机器视觉设备。
机器视觉光源?
光源作为机器视觉系统输入的重要部件,它的好坏直接影响输入数据的质量和应用效果。由于没有通用的机器视觉光源设备,所以针对每个特定的应用实例,要选择相应的视觉光源,以达到最佳效果。常见的光源有:LED环形光源、低角度光源、背光源、条形光源、同轴光源、冷光源、点光源、线型光源、平行光源等。
工业镜头
镜头在机器视觉系统中主要负责光束调制,并完成信号传递。
镜头类型包括:标准、远心、广角、近摄和远摄等,选择依据一般是根据相机接口、拍摄物距、拍摄范围、CCD尺寸、畸变允许范围、放大率、焦距和光圈等。
工业相机
工业相机在机器视觉系统中最本质功能就是将光信号转变为电信号,与普通相机相比,它具有更高的传输力、抗干扰力以及稳定的成像能力。
按照不同标准可有多种分类:按输出信号方式,可分为模拟工业相机和数字工业相机;按芯片类型不同,可分CCD工业相机和CMOS工业相机,这种分类方式最为常见。
图像采集卡
图像采集卡虽然只是完整机器视觉系统的一个部件,但它同样非常重要,直接决定了摄像头的接口:黑白、彩色、模拟、数字等。
比较典型的有PCI采集卡、1394采集卡、VGA采集卡和GigE千兆网采集卡。这些采集卡中有的内置多路开关,可以连接多个摄像机,同时抓拍多路信息。
机器视觉软件
机器视觉软件是机器视觉系统中自动化处理的关键部件,根据具体应用需求,对软件包进行二次开发,可自动完成对图像采集、显示、存储和处理。在选购机器视觉软件时,一定要注意开发硬件环境、开发操作系统、开发语言等,确保软件运行稳定,方便二次开发。
6. 机器视觉行业如何设计机器视觉系统框架
如何设计机器视觉系统框架 --- 创科黎友在决定一个机器视觉系统的需求及应用时,很多因素需要考虑。机器视觉(或称为自动可视检测系统)一般包含了大量部件,这些部件直接影响系统的性能。为了获得这些子系统的优越性能,并无缝将他们接合在你的生产线上,最好花一些时间来学习视觉系统的组成、应用、以及正确的规划的重要性。 机器视觉的应用在对精度和可靠性都很高的重复性检测任务中,机器视觉广泛应用在这些生产流程中。一些常见的任务:在食物包装中检测数据代码;自动检测部件用于正确的安装;为机器人的捡起(pick)和放置(place)动作提供向导;在制药中效验药品的颜色;读取部件的条形码、以及在产品上的标识;还有更多更多。基于PC的机器视觉系统的基本组成 由于机器视觉应用非常广泛,在不同的系统里使用不同的部件,但是,我们可以将这些部件分成如下几类(见图1)。图1 通常的机器视觉系统的主要组成(附件1) 1. 摄像头和光学部件 –这一类通常含有一个或多个摄像头和镜头(光学部件),用于拍摄被检测的物体。根据应用,摄像头可以基于如下标准,黑白RS-170/CCIR、复**色(Y/C),RGB彩色,非标准黑白(可变扫描),步进扫描(progressive-scan)或线扫描。 2. 灯光 –灯光用于照亮部件,以便从摄像头中拍摄到更好的图像,灯光系统可以在不同形状、尺寸和亮度。一般的灯光形式是高频荧光灯、LED、白炽灯和石英卤(quartz-halogen)光纤。 3. 部件传感器 –通常以光栅或传感器的形式出现。当这个传感器感知到部件靠近,它会给出一个触发信号。当部件处于正确位置时,这个传感器告诉机器视觉系统去采集图像。 4. 图像采集卡 –也称为视频抓取卡,这个部件通常是一张插在PC上的卡。这张采集卡的作用将摄像头与PC连接起来。它从摄像头中获得数据(模拟信号或数字信号),然后转换成PC能处理的信息。它同时可以提供控制摄像头参数(例如触发、曝光时间、快门速度等等)的信号。图像采集卡形式很多,支持不同类型的摄像头,不同的计算机总线。 5. PC平台 –计算机是机器视觉的关键组成部分。应用在检测方面,通常使用Pentium III或更高的CPU。一般来讲,计算机的速度越快,视觉系统处理每一张图片的时间就越短。由于在制造现场中,经常有振动、灰尘、热辐射等等,所以一般需要工业级的计算机。 6. 检测软件 –机器视觉软件用于创建和执行程序、处理采集回来的图像数据、以及作出“通过/失败(PASS/FAIL)”决定。机器视觉有多种形式(C语言库、 ActiveX控件、点击编程环境等等),可以是单一功能(例如设计只用来检测LCD或BGA、对齐任务等等),也可以是多功能(例如设计一个套件,包含计量、条形码阅读、机器人导航、现场验证等等)。 7. 数字I/O和网络连接 –一旦系统完成这个检测部分,这部分必须能与外界通信,例如需要控制生产流程、将“通过/失败(PASS/FAIL)”的信息送给数据库。通常,使用一张数字I/O板卡和(或)一张网卡来实现机器视觉系统与外界系统和数据库的通信。 配置一个基于PC的机器视觉系统认真的计划和注意细节能帮助你确保你的检测系统符合你的应用需求。如下是你必需考虑的几点: 确定你的目标 –这可能是最重要的一步 枣决定在这个检测任务中你需要实现什么,检测任务通常分为如下几类: 1. 测量或计量 2. 读取字符或编码(条形码)信息。 3. 检测物体的状态 4. 认知和识别特殊的特性枣模式识别 5. 将物体与模板进行对比或匹配 6. 为机器或机器人导航检测流程可以包含只有一个操作或包含多个与检测任务相关的任务。为了确认你的任务,首先你应该明确为了最大限度检测部件你需要做的测试,也就是你能考虑到会出现的缺陷。为了明确什么哪个才是最重要的,最好做一张评估表,列出“必须做”和“可以做”的测试。一旦主要的对测试标准满意,随后可以将更多的测试加进去来改善检测过程,一定要记住,添加测试的同时也会增加检测的时间。确定你需要的速度 –系统检测每一个部件需要多少时间?这个不只是由PC的速度决定,还受生产流水线速度的影响。很多机器视觉包含了时钟/计时器,所以检测操作的每一步所需要的时间都可以准确测量,从这些数据,我们就可以修改我们的程序以满足时间上的要求。通常,一个基于PC的机器视觉系统每一秒可以检测20-25个部件,与检测部件的多少和处理程序以及计算机的速度有密切关系。聪明地选择你的硬件 –一套机器视觉系统的性能与它的部件密切相关。在选择的过程中,有很多捷径枣特别在光学成像上枣可能很大程度降低系统的效率。如下是在选择部件时你必须紧记的几个基本原则。 1. 摄像头摄像头的选择与应用的需求直接相关,通常考虑三点:a)黑白还是彩色;b)部件/目标的运动;c)图像分辨率。在检测应用中大部分使用黑白摄像头,因为黑白图像能提供90%可视数据,并且比彩色便宜。彩色摄像头主要用于一些需要分析彩色图像的场合里。根据部件在检测时是否移动,决定我们选择标准隔行扫描摄像头还是逐行扫描摄像头。另外,图像的分辨率必须足够高,以提供检测任务需要的足够的数据。最后,摄像头必须质量好和可以避免工业现场中的振动、灰尘和热的影响。 2. 光学部件和照明这个至关重要的因素往往被人所忽略。当你使用一个很差的光学部件或照明,就算你使用最好的机器视觉系统,它表现出的性能甚至比不上一个配上良好光学部件和适当照明的低能力系统。光学部件的目标是产生最好和最大可用面积的图像,并且提供最好的图像分辨率。照明的目标是照亮需要测量或检测的部分的关键特征。通常,照明系统的设计由如下因素决定:颜色、纹理、尺寸、外形、反射率等等。 3. 图像采集卡虽然图像采集卡只是完整的机器视觉系统的一个部件,但是它扮演一个非常重要的角色。图像采集卡直接决定了摄像头的接口:黑白、彩色、模拟、数字等等。使用模拟输入的图像采集卡,目标是尽量不变地将摄像头采集的图像转换为数字数据。使用不正确的图像采集卡可能得到错误的数据。工业用的图像采集卡通常用于检测任务,多媒体采集卡由于它通过自动增益控制、边沿增强和颜色增强电路来更改图像数据,所以不用在这个领域里。使用数字输入的图像采集卡的目标是将摄像头输出的数字图像数据转换并输送到PC中作处理。考虑各种变化:人类的眼睛和大脑可以在不同的条件下识别目标,但是机器视觉系统就不是这样多才多艺了,它只能按程序编写的任务来工作。了解你的系统能看到什么和不能看到什么能帮助你避免失败(例如将好的部件认为是坏的)或其它检测错误。一般要考虑的包括部件颜色、周围光线、焦点、部件的位置和方向和背景颜色的大变化。正确选择软件:机器视觉软件是检测系统中的智能部分,也是最核心的部分。软件的选择决定了你编写调试检测程序的时间、检测操作的性能等等。图2 DTVF是一个多功能、图形化编程的机器视觉软件(附件2)机器视觉提供了图形化编程界面 (通常称为“Point & Click”) 通常比其他编程语言(例如Visual C++)容易,但是在你需要一些特殊的特征或功能时有一定的局限性。基于代码的软件包,尽管非常困难和需要编码经验,但在编写复杂的特殊应用检测算法具备更大的灵活性。一些机器视觉软件同时提供了图形化和基于代码的编程环境,提供两方面最好的特征,提供了很多灵活性,满足不同的应用需求。通信和记录数据:机器视觉系统的总的目标是通过区分好和坏的部件来实现质量检测。为了实现这一功能,这个系统需要与生产流水线通信,这样才可以在发现坏的部件是做某种动作。通常这些动作是通过数字I/O板,这些板与制造流水线中的PLC相连,这样坏的部件就可以跟好的部件分离。例外,机器视觉系统可以与网络连接,这样就可以将数据传送给数据库,用于记录数据以及让质量控制员分析为什么会出现废品。在这一步认真考虑将有助于将机器视觉系统无缝与生产流水线结合起来。需要考虑的问题是: 1. 使用了什么类型的PLC,它的接口如何? 2. 需要什么类型的信号? 3. 现在使用或必须使用什么类型的网络? 4. 在网络上传送的文件格式是什么?通常使用RS-232端口与数据库通信,来实现对数据的纪录。为以后做准备:当你为机器视觉系统选择部件时,时刻记住未来的生产所需和有可能发生的变动。这些将直接影响你的机器视觉软硬件是否容易更改来满足以后新的任务。提前的准备将不仅仅节约你的时间,而且通过在将来重用现有的检测任务可以降低整个系统的价格。机器视觉系统的性能由最差的部分决定(就像一个木桶的容量由最短的一个木块决定),精度则由它能获取的信息决定。花时间和精力合理配置系统就可以建造一个零故障和有弹性的视觉检测系统。
7. 计算机视觉技术有哪些
【计算机视觉技术】包括以下几个方面:
1、识别技术
(1)基于内容的图像提取;
(2)姿态评估:对某一物体相对于摄像机的位置或者方向的评估;
(3)光学字符识别:对图像中的印刷或手写文字进行识别鉴别,通常的输出是将之转化成易于编辑的文档形式。
2、运动技术
(1)自体运动:监测摄像机的三维刚性运动。
(2)图像跟踪:跟踪运动的物体。
3、场景重建技术:给定一个场景的二或多幅图像或者一段录像,场景重建寻求为该场景建立一个计算机模型/三维模型。最简单的情况便是生成一组三维空间中的点。更复杂的情况下会建立起完整的三维表面模型。
4、图像恢复技术: 图像恢复的目标在于移除图像中的噪声,例如仪器噪声,模糊等。
【计算机视觉技术】是一门研究如何让计算机达到人类那样“看”的学科。更准确点说,它是利用摄像机和电脑代替人眼使得计算机拥有类似于人类的那种对目标进行分割、分类、识别、跟踪、判别决策的功能。计算机视觉技术是使用计算机及相关设备对生物视觉的一种模拟,是人工智能领域的一个重要部分,它的研究目标是使计算机具有通过二维图像认知三维环境信息的能力。是以图像处理技术、信号处理技术、概率统计分析、计算几何、神经网络、机器学习理论和计算机信息处理技术等为基础, 并通过计算机分析与处理视觉信息的技术。
8. 什么是计算机视觉
计算机视觉是一门研究如何使机器“看”的科学,更进一步的说,就是是指用摄影机和电脑代替人眼对目标进行识别、跟踪和测量等机器视觉,并进一步做图形处理,使电脑处理成为更适合人眼观察或传送给仪器检测的图像。
作为一个科学学科,计算机视觉研究相关的理论和技术,试图建立能够从图像或者多维数据中获取‘信息’的人工智能系统。这里所 指的信息指Shannon定义的,可以用来帮助做一个“决定”的信息。因为感知可以看作是从感官信号中提 取信息,所以计算机视觉也可以看作是研究如何使人工系统从图像或多维数据中“感知”的科学。
计算机视觉既是工程领域,也是科学领域中的一个富有挑战性重要研究领域。计算机视觉是一门综合性的学科,它已经吸引了来自各个学科的研究者参加到对它的研究之中。其中包括计算机科学和工程、信号处理、物理学、应用数学和统计学,神经生理学和认知科学等。
原理:
计算机视觉就是用各种成象系统代替视觉器官作为输入敏感手段,由计算机来代替大脑完成处理和解释。计算机视觉的最终研究目标就是使计算机能象人那样通过视觉观察和理解世界,具有自主适应环境的能力。要经过长期的努力才能达到的目标。因此,在实现最终目标以前,人们努力的中期目标是建立一种视觉系统,这个系统能依据视觉敏感和反馈的某种程度的智能完成一定的任务。例如,计算机视觉的一个重要应用领域就是自主车辆的视觉导航,还没有条件实现象人那样能识别和理解任何环境,完成自主导航的系统。因此,人们努力的研究目标是实现在高速公路上具有道路跟踪能力,可避免与前方车辆碰撞的视觉辅助驾驶系统。这里要指出的一点是在计算机视觉系统中计算机起代替人脑的作用,但并不意味着计算机必须按人类视觉的方法完成视觉信息的处理。计算机视觉可以而且应该根据计算机系统的特点来进行视觉信息的处理。但是,人类视觉系统是迄今为止,人们所知道的功能最强大和完善的视觉系统。如在以下的章节中会看到的那样,对人类视觉处理机制的研究将给计算机视觉的研究提供启发和指导。因此,用计算机信息处理的方法研究人类视觉的机理,建立人类视觉的计算理论,也是一个非常重要和信人感兴趣的研究领域。这方面的研究被称为计算视觉(Computational Vision)。计算视觉可被认为是计算机视觉中的一个研究领域。
以上内容来自于网络,希望对你有点帮助。
9. 计算机cv方向是什么
计算机视觉(Computer Vision)是指用计算机实现人的视觉功能——对客观世界的三维场景的感知、识别和理解。
这意味着计算机视觉技术的研究目标是使计算机具有通过二维图像认知三维环境信息的能力。因此不仅需要使机器能感知三维环境中物体的几何信息(形状、位置、姿态、运动等)而且能对它们进行描述、存储、识别与理解。可以认为,计算机视觉与研究人类或动物的视觉是不同的:它借助于几何、物理和学习技术来构筑模型,用统计的方法来处理数据。
人工智能的完整闭环包括感知、认知、推理再反馈到感知的过程,其中视觉在我们的感知系统中占据大部分的感知过程。所以研究视觉是研究计算机的感知重要的一步。
2发展的几个重要节点
视觉研究的开端-Hubel和Wiesel关于大脑视皮层细脑感受野的论述
感受野-(一个感觉神经元的感受野是指这个位置里适当的刺激能够引起该神经元反应的区域。感受野一词主要是指听觉系统、本体感觉系统和视觉系统中神经元的一些性质。)
1959年,Hubel和Wiesel猫实验的故事,把微电极埋进猫的视皮质细胞,之后在屏幕上打出一些光影和图形。通过固定猫的头部来控制视网膜上的成像,并测试细胞对线条、直角、边缘线等图形的反应。Hubel和Wiesel告诉我们视觉识别应该从简单的形状开始。
对于看到鱼和老鼠投像的猫来说,视觉处理的前期并不是对整体的鱼或者老鼠进行处理,视觉处理流程的第一步是对简单的形状的结构处理、边缘排列。只有当图片切换时的反应激烈。
二维到三维- Roberts积木世界让计算机理解三维场景
20世纪50年代主要分析二维图像,而Lary Roberts 1963年写的论文《block world》(积木世界),运用计算机程序,试图从图像中阐释出诸如立方体等多面体的这些边缘和形状。它根据线画图来理解由多面体构成的景物,并对物体形状物体的空间关系进行描述。
学科的诞生
计算机视觉真正的诞生时间是在1966年,MIT人工智能实验室成立了计算机视觉学科,标志着CV成为一门人工智能领域中的可研究的学科,同时历史的发展也证明了CV是人工智能领域中增长最快的一个学科。
视觉理论:视觉是分层的
20世纪80年代初,MIT人工智能实验室的David Marr出版了一本书《视觉》(全名《Vision: A Computational Investigation into the Human Representation and Processing of Visual Information》),他提出了一个观点:视觉是分层的。
他认为视觉是个信息处理任务,应该从三个层次来研究和理解,即计算理论、算法、实现算法的机制或硬件。
一、信息处理的计算理论,在这个层次研究的是对什么信息进行计算和为什么要进行这些计算。
二、算法,在这个层次研究的是如何进行所要求的计算,即设计特定的算法
三、实现算法的机制或硬件,在这个层次上研究完成某一特定算法的计算机构。
例如根据 Fourier 分析理论,任意连续函数可用它的 Fourier 频谱来表示,因此 Fourier 变换是属于第一层的理论,而计算Fourier 变换的算法是属于第二个层次的,至于实现快速,Fourier算法的阵列处理机就属于第三层次。
视觉理论使人们对视觉信息的研究有了明确的内容和较完整的基本体系,仍被看做是研究的主流;
3计算机视觉是一门交叉学科
计算机视觉技术是一种典型的交叉学科研究领域,包含了生物、心理,物理,工程,数学,计算机科学等领域,存在与其他许多学科或研究方向之间相互渗透、相互支撑的关系。在概念的理解中我们常常听到AI、图像处理、模式识别、机器视觉等词语,那么他们和计算机视觉之间是怎样的关系呢?
(图片来自网络)
计算机视觉与人工智能
人工智能技术主要研究智能系统的设计和有关智能的计算理论与方法。 人工智能可被分为三个阶段感知 、认知和动作执行。计算机视觉常被视为A I的一分支 。
计算机视觉与图像处理
图像处理中,人是最终的解释者;计算机视觉中,计算机是图像的解释者。图像处理算法在机器视觉系统的早期阶段起着很大的作用,它们通常被用来增强特定信息并抑制噪声。计算机视觉系统必须有图像处理模块存在。
(图片来自wikipedia)
计算机视觉与模式识别
模式识别是根据从图像中抽取的统计特性或结构信息,把图像分为设定的类别。图像模式的分类是计算机视觉中的一个重要问题。模式识别中的许多方法可以应用于计算机视觉中。
计算机视觉与机器视觉
计算机视觉技术的研究目标是使计算机具有通过一幅或多幅图像认知周围环境的能力(包括对客观世界三维环境的感知 、识别与理解)。 这意味着计算机不仅要模拟人眼的功能,而且更重要的是使计算机完成人眼所不能胜任的工作。而机器视觉则是建立在计算机视觉理论基础之上,偏重于计算机视觉技术的工程化,能够自动获取和分析特定的图像,以控制相应的行为。与计算机视觉所研究的视觉模式识别、视觉理解等内容不同,机器视觉技术重点在于感知环境中物体的形状、位置 、姿态 、运动等几何信息 。两者基本理论框架、底层理论、算法相似,只是研究的最终目的不同。所以实际中并不加以严格划分,对于工业应用常使用“机器视觉” ,而一般情况下则常用“计算机视觉“。(部分选自《基于 OpenCV 的计算机视觉技术实现》)
10. 计算机视觉与机器视觉的区别
1、定义不同
计算机视觉:计算机视觉是一门研究如何使机器“看”的科学,更进一步的说,就是是指用摄影机和电脑代替人眼对目标进行识别、跟踪和测量等机器视觉,并进一步做图形处理,使电脑处理成为更适合人眼观察或传送给仪器检测的图像。
机器视觉:机器视觉是人工智能正在快速发展的一个分支。简单说来,机器视觉就是用机器代替人眼来做测量和判断。机器视觉系统是通过机器视觉产品(即图像摄取装置,分CMOS和CCD两种)将被摄取目标转换成图像信号,传送给专用的图像处理系统,
得到被摄目标的形态信息,根据像素分布和亮度、颜色等信息,转变成数字化信号;图像系统对这些信号进行各种运算来抽取目标的特征,进而根据判别的结果来控制现场的设备动作。
2、原理不同
计算机视觉:计算机视觉就是用各种成象系统代替视觉器官作为输入敏感手段,由计算机来代替大脑完成处理和解释。计算机视觉的最终研究目标就是使计算机能象人那样通过视觉观察和理解世界,具有自主适应环境的能力。要经过长期的努力才能达到的目标。
因此,在实现最终目标以前,人们努力的中期目标是建立一种视觉系统,这个系统能依据视觉敏感和反馈的某种程度的智能完成一定的任务。例如,计算机视觉的一个重要应用领域就是自主车辆的视觉导航,还没有条件实现象人那样能识别和理解任何环境,完成自主导航的系统。
因此,人们努力的研究目标是实现在高速公路上具有道路跟踪能力,可避免与前方车辆碰撞的视觉辅助驾驶系统。这里要指出的一点是在计算机视觉系统中计算机起代替人脑的作用,但并不意味着计算机必须按人类视觉的方法完成视觉信息的处理。
计算机视觉可以而且应该根据计算机系统的特点来进行视觉信息的处理。但是,人类视觉系统是迄今为止,人们所知道的功能最强大和完善的视觉系统。如在以下的章节中会看到的那样,对人类视觉处理机制的研究将给计算机视觉的研究提供启发和指导。
因此,用计算机信息处理的方法研究人类视觉的机理,建立人类视觉的计算理论,也是一个非常重要和信人感兴趣的研究领域。这方面的研究被称为计算视觉(Computational Vision)。计算视觉可被认为是计算机视觉中的一个研究领域。
机器视觉:机器视觉检测系统采用CCD照相机将被检测的目标转换成图像信号,传送给专用的图像处理系统,根据像素分布和亮度、颜色等信息,转变成数字化信号,
图像处理系统对这些信号进行各种运算来抽取目标的特征,如面积、数量、位置、长度,再根据预设的允许度和其他条件输出结果,包括尺寸、角度、个数、合格 / 不合格、有 / 无等,实现自动识别功能。
3、应用不同
计算机视觉:人类正在进入信息时代,计算机将越来越广泛地进入几乎所有领域。一方面是更多未经计算机专业训练的人也需要应用计算机,而另一方面是计算机的功能越来越强,使用方法越来越复杂。
这就使人在进行交谈和通讯时的灵活性与在使用计算机时所要求的严格和死板之间产生了尖锐的矛盾。人可通过视觉和听觉,语言与外界交换信息,并且可用不同的方式表示相同的含义,而计算机却要求严格按照各种程序语言来编写程序,只有这样计算机才能运行。
为使更多的人能使用复杂的计算机,必须改变过去的那种让人来适应计算机,来死记硬背计算机的使用规则的情况。而是反过来让计算机来适应人的习惯和要求,
以人所习惯的方式与人进行信息交换,也就是让计算机具有视觉、听觉和说话等能力。这时计算机必须具有逻辑推理和决策的能力。具有上述能力的计算机就是智能计算机。
机器视觉:在国外,机器视觉的应用普及主要体现在半导体及电子行业,其中大概40%-50%都集中在半导体行业。具体如PCB印刷电路:各类生产印刷电路板组装技术、设备;单、双面、多层线路板,覆铜板及所需的材料及辅料;
辅助设施以及耗材、油墨、药水药剂、配件;电子封装技术与设备;丝网印刷设备及丝网周边材料等。SMT表面贴装:SMT工艺与设备、焊接设备、测试仪器、返修设备及各种辅助工具及配件、SMT材料、贴片剂、胶粘剂、焊剂、焊料及防氧化油、焊膏、清洗剂等;
再流焊机、波峰焊机及自动化生产线设备。电子生产加工设备:电子元件制造设备、半导体及集成电路制造设备、元器件成型设备、电子工模具。机器视觉系统还在质量检测的各个方面已经得到了广泛的应用,并且其产品在应用中占据着举足轻重的地位。
除此之外,机器视觉还用于其他各个领域。