热门搜索:大学毕业论文 硕士毕业论文 博士毕业论文 硕士英语论文 硕士mba论文 无忧论文网

当前位置:无忧论文网 > 期刊资讯 > 计算机 >

目标轮廓整合之视觉皮层神经计算机理及网络方式研究

  • 发布日期:2013-12-23
  • 责任编辑:lgg
  • 论文字数:35960
  • 点击:
  • 论文编号:fb201312221131248206
  • 论文类型:硕士毕业论文
  • 论文价格:150

第一章  绪论


1.1 课题研究背景和意义
视觉系统对场景目标的提取(即所谓的图形-背景分割)和描述的效率及性能取决于它对视场中的目标轮廓及其对应封闭区域的检测能力。发生在初级视觉的从一系列非连续边沿段形成对目标轮廓的连贯而完整知觉的过程即目标轮廓组织/整合。在二十世纪早期,Gestalt 学派就注意到了“连续性”和“封闭性”的重要性;其后的一系列研究进一步表明,相比开放轮廓,封闭轮廓在感知过程中的作用无可替代——封闭轮廓不仅仅是线段,它更是对目标外形和表面区域的界定,使用封闭性可以引导目标区域表面的构建、视网膜盲点区域的边界提取、以及为完成局部遮挡目标识别提供必要的信息等。然而,作为解决图像自动分割这一问题关键的轮廓组织整合仍然是当今计算机视觉中最具挑战性的课题之一[1]。为提取图像目标的完整轮廓,研究者们以 Marr 的视觉计算理论为基础尝试了各种可能及可行的数学手段。比较有代表性的目标轮廓提取方法如基于Mumford-Shah 能量泛函模型的方法[2~3]、以 Snake 模型或水平集等为代表的主动轮廓模型及其派生方法[4~5]、基于数字滤波的方法[6]以及基于统计的各种方法[7~8]等等。这些方法试图以普通的代数或几何方法提取目标的轮廓曲线,这在某些理想化条件下(如要求图像不同背景区域、不同目标区域不重叠,不相交;图像的噪声可以忽略等)或能得到可以接受甚至令人满意的结果,但在一般的现实场景下,都不可避免会表现出它们的局限性,算法的效率和处理的效果均显著降低。显然生物视觉(尤其是人类自身的视觉)系统在解决该问题时的表现堪称完美——快速而准确、通用且鲁棒。这预示着人类以及生物的视觉系统采用了特殊的信息加工机制,因而,模拟生物视觉的机理,建立相应的人工神经网络模型以实现或者部分实现生物视觉的功能是人们在解决机器视觉问题时更具吸引力的思路。事实上,以 20 世纪三十年代 Gestalt 心里学派的感知组织理论[9]以及六十年代 Hubel 等人[10~12]提出的感受野概念为标志,人们在神经生理和视觉心理等方面开始了不懈地深入研究;工程应用方面,则是有越来越多的专家学者投身到针对生物视觉的建模和模拟的研究中。基于生物视觉机理的机器视觉方法正日益展现出它的独特魅力。


1.2 课题的国内外研究现状
近几十年神经生理和心理学的研究表明,人类的视觉系统是一个多通道并行交叉、多级互联的复杂非线性信息计算系统[13];目标轮廓的组织整合完成于初级视觉皮层但紧密依赖于整个视觉网络,它不是一个独立的生理过程,与其它生理过程如图像分割等有着互为缠绕的关系,是自底而上和自顶而下两个互逆过程平衡的结果。迄今,大量的心理物理学实验[14~16]、神经生理的观察数据[17~19]以及基于这些实验和数据的计算模型[20~30]都显示,发生在视觉皮层的目标轮廓组织整合可能是由于皮层具有相似方位调谐特性的神经细胞的侧连接暨侧相互作用所引起的[31~33]。在大多数的这些计算模型中,这种侧相互作用都是以一种基于特定的连接约束[21~23],或基于由诸如相对方位差、距离、曲率以及曲率变化等几何描述而构建的预定规则集[20]的硬编码方式来表达的。这些模型[20~30]分别对面向目标轮廓组织整合的局部机制进行了有效模拟,试验结果则显示,它们作用于某些典型的心理测试图或者自然图像时均能取得预期的效果。
另一方面的研究[34~36]表明,婴儿时期的视觉能力,在克服噪声干扰等方面与成年期视觉系统之间存在较大的差距:他们的视觉系统能够建立视场中的方位关联,而由于缺乏其它视觉线索,只能对具有良好的连续性轮廓线段实现感知(这可能是由于婴儿的皮层细胞侧连接方式只能支持更短的组织距离)。解剖学上的发现[37]和行为数据[38] 则表明 V1 细胞之间水平连接的成熟包括一个轴突之间的连接已经建立但是尚未完成精确调谐的过程,从而进一步直接证明了视觉系统具备可塑性。那么,作为目标轮廓组织整合的物理机制基础的侧连接方式是如何发育形成的呢?Yoonsuck 等[39]就不同视觉皮层区域差异化的轮廓整合性能[40]的发育机制用基于数据驱动的自组织原理进行了解释和模拟。Grossberg 等[41、42]则模拟了存在于 V1 区的层间及层内相关细胞之间的包含了上述侧连接在内的各种连接的发育机制,该模型模拟的稳定发育由第 6 层与第 4 层之间和 2/3 层内部的激励与抑制连接的生长情况控制。模型中 6 层→4 层通道除了保持对来自 LGN 细胞的输入对比度的敏感性,它还重叠了来自 2/3 层细胞的反馈抑制信号(轮廓的组织通过 2/3 层内活性超过阈值的细胞之间相互连接方式来表达),并接受来自 V2细胞及其它视觉皮层的注视信号的调制且将该自顶而下的信号传送到 LGN 细胞。通过计算表明[41],V1 区 2/3 层双极细胞对真实和虚拟轮廓上的同方位刺激都能产生响应,这与神经生理实验数据[33]一致。Pieter R. Roelfsema 等则将注视性反馈信号引入强化学习机制建立了具有生物学基础的视皮层网络学习模型AGREL[43],该模型在有监督学习与仿生强化学习理论之间建立了有效连接。此外,基于“无强激励回路假设”模型[44]认为一个强激励反馈回路会导致皮层的不可控振荡,并据此解释视觉调制电路的存在。然而,大量的数学定理证明了具有强激励反馈的神经网络可以轻易地收敛于稳定状态而不至于振荡[45]。所以,调制电路可以帮助婴幼儿期的神经发育和成年期神经网络的学习似乎更能让人接受。北京大学心理学系和机器感知与智能教育部重点实验室、香港大学心理学系以及明尼苏达州立大学的研究人员则利用功能性核磁共振技术研究视皮层可塑性,并取得了支持上述模型和解释的关键性进展[46]。


第二章    基于视觉皮层机制的目标轮廓整合神经网络模型


2.1 目标轮廓整合的视觉皮层计算机制
神经生物学的研究成果表明:人类的视觉系统是一个多通道并行交叉、多级互联的复杂非线性信息计算系统[13,47]。Grossberg 的模型提出了轮廓整合神经网络层状模型,层状的模型可以让大脑通过这种层状之间的这种回路灵巧,很好的控制兴奋与抑制环路之间的平衡,简单的解决问题[49]。Neumann 的模型提出神经元之间长距离增强,信息的反馈和彼此之间周期性的相互作用可以完成轮廓的整合,并认为 LGN 层和方位选择细胞(简单细胞)与复杂细胞的共同作用能够完成长距离增强和短距离抑制从而整合轮廓信息[25]。Zhaoping. Li 的研究表明轮廓整合的最终完成最有可能发生在更高级视觉皮层[52],但是 Li 的研究主要停留在V1区的2/3层,对视觉皮层其他层的功能分析不足。在学习机制方面,Grossberg等[41、42]则模拟了存在于V1区的层间及层内相关细胞之间的包含了上述侧连接在内的各种连接的发育机制,该模型模拟的稳定发育由第 6 层与第 4 层之间和 2/3层内部的激励与抑制连接的生长情况控制。模型中 6 层→4 层通道除了保持对来自 LGN 细胞的输入对比度的敏感性,它还重叠了来自 2/3 层细胞的反馈抑制信号(轮廓的组织通过 2/3 层内活性超过阈值的细胞之间相互连接方式来表达),并接受来自V2细胞及其它视觉皮层的注视信号的调制且将该自顶而下的信号传送到 LGN 细胞。通过计算表明,V1 区 2/3 层双极细胞对真实和虚拟轮廓上的同方位刺激都能产生响应,这与神经生理实验数据[33]一致。Pieter R. Roelfsema 等则将注视性反馈信号引入强化学习机制建立了具有生物学基础的视皮层网络学习模型 AGREL[43]。但是其对强化学习与轮廓整合神经网络的融合机制没有进行深入的探讨。


第三章 轮廓整合皮层神经网络.........17
3.1 强化学习....... 17
3.2 轮廓整合皮层神经网络的 Q 学习算法....... 22
3.3 本章小结 ...... 31
第四章 实验结果分析和比较 .......32
4.1 实验图像的选取及其分析 .... 32
4.2 实验中轮廓整合模型参数的设置..... 33
4.3 典型实验图像的轮廓整合实验结果及其分析....... 34
4.4 轮廓整合的定量评价方法 .... 35
4.5 人工优化参数和强化学习自适应调整参数........ 36
4.6 本文算法和 CANNY算法轮廓提取.... 38
4.7 本章小结 ...... 40
第五章 总结与展望 .........41
5.1 总结..... 41
5.2 展望 .... 42


结论


本文旨在用模拟生物视觉机理的方法研究计算机视觉中的目标轮廓组织/整合问题——即从生物视觉的功能分析入手对其物理机制进行数学建模,并对所建立的网络模型在目标轮廓组织整合的鲁棒性等方面进行定量分析。主要做了以下工作:
(1)以神经生理学研究为基础,建立轮廓整合的神经网络模型。在综合现有视觉成果的基础上对目标轮廓整合的皮层神经机制进行梳理的基础上给出轮廓整合的皮层神经网络框架,然后分析了视觉皮层(V1 和 V2 区)各神经细胞的时空特性及功能。通过上述分析得出,V1 区和 V2 区 2/3 层的侧抑制作用是轮廓能够整合的重要原因。V2 区 2/3 层的侧抑制相对 V1 区来说,范围更广,整合的区域也就更大。其它层的主要功能是对输入图像信号进行增强、平滑以及提取目标轮廓信息,总的来说就是完成对视觉信号的处理、传递和反馈。
(2)根据对学习和信息选择机制、强化学习的基本算法以及轮廓整合神经网络的研究与分析,制定了轮廓整合皮层神经网络的强化学习方案,包括皮层神经网络的 Q 学习的状态描述、奖励信号定义及回报函数子网络模型的构建以及动作描述和动作决策子网络的表达等。强化学习的状态、行为、奖励和信度等要素表达及其关系计算均由皮层神经网络表达实现。强化学习与轮廓整合神经网络融合后,模型便可以自适应的调整皮层神经网络的参数,使轮廓整合的效果达到最优(轮廓的平滑性和封闭性最优)。
(3)对本文模型的轮廓整合实验结果进行了定性和定量的分析与比较。定性分析得出本文算法能够整合一般的断续线段和某些虚拟轮廓。定量的分析与比较表明强化学习和轮廓整合神经网络融合后,模型对目标轮廓的整合能力更强;本文算法的轮廓提取效果要优于 Canny 算子。


参考文献
[1]G. Papari, P.Campisi, N.Petkov, and A. Neri. A biologically motivatedmultiresolution approach to contour detection[J], EURASIP Journal on Advances inSignal Processing, 2007, 1:119~137.
[2] S. Gao, Tien D. Bui. Image segmentation and selective smoothing by usingMumford-Shah model[J], IEEE Transactions on Image Processing, 2005, 14(10):1537~1549.
[3]Fang Li, Michael K. Ng, Chunming Li . Variational fuzzy Mumford–Shah modelfor image segmentation[J]. SIAM Journal on Applied Mathematics, 2010, 70(7):2750~2770.
[4] Ann A. Jarjes, K.Q Wang, G. J. Mohammed. GVF snake-based method foraccurate pupil contour detection[J]. J. Inform. Technol., 2010, 9: 1653~1658.
[5]H.Shan, Jianwei Ma. Curvelet-based geodesic snakes for image segmentation withmultiple objects[J]. Pattern Recognition Letters, 2010, 31:355~360.
[6]Jesmin F. Khan. A customized Gabor filter for unsupervised color imagesegmentation[J]. Image and Vision Computing, 2009, 27(4):489~501.
[7] Wilson S. Geisler, Jeffrey S. Perry. Contour statistics in natural images: groupingacross occlusions[J]. Vision Neurosci., 2009, 26(1): 109~121.
[8] Michael Randolph Maire. Contour detection and image segmentation[J]. PHDdissertation(Jitendra Malik, chair), University of California Berkeley, 2009.
[9]Agnè Desolneux, Lionel Moisan, Jean-Michel Morel. Gestalt theory andcomputer vision[J].Springer Netherlands, 2004.
[10] D. H. Hubel, T. N. Wiesel. Receptive fields and functional architecture ofmonkey striate cortex[J]. Physiol., 1968, 195(1):215~243.

发布写论文需求
发布发表需求
发布发表转让

无忧论文网 网站公告

[无忧论文网]是专业论文写作润色及发表论文网站,提供论文精简,论文写作,专业辅导写职称论文,专业辅导写毕业论文,专业辅导写留学生论文等。
100%品质,100%通过,是您写作的理想合作网站。我们的客户风雨同舟,帮广大客户解决各类写作和发表难题。