[vb怎么把image改圆形]100 如何把那个窗口改成叶片式的?

当前位置: >>
彩色图像分割算法的研究与实现
重庆大学 硕士学位论文 彩色图像分割算法的研究与实现 姓名:张晓芸 申请学位级别:硕士 专业:计算机软件与理论 指导教师:朱庆生
重庆大学硕士学位论文中文摘要摘要图像处理应用广泛,其中数字图像处理技术更是被广泛应用于生活的各方各 面。图像分割作为“数字图像处理工程” (简称为图像工程)中由图像底层处理过 渡到图像分析的关键步骤,一直是图像技术研究中的热点和焦点。在过去的很多 年里,多数的研究都致力于单色图像的分割,随着近年来个人计算机处理能力的 迅速提高,彩色图像的分割引起人们越来越多的关注。但是很多原有的分割灰度 图像的算法并不适合于直接分割彩色图像,所以进一步研究专门用于彩色图像分 割的方法,并且使它具有通用性和更好的处理效果是研究人员所追求的目标。 围绕彩色图像分割这一课题,本文的研究工作主要包括以下几个方面: 1. 从色彩空间和分割方法两方面分析讨论了彩色图像分割方法。 首先对多年来彩 色图像分割领域中出现的彩色空间进行了归纳和总结, 指出了各类彩色空间在 彩色图像分割中的特点。然后针对当前主流的彩色图像分割算法进行了分类、 分析、归纳和总结,掌握原理并指出了各类方法的优缺点。最后指出,根据分 割问题的特点,选择恰当的分割方法和最佳的色彩空间,设计出有效、可行的 针对某类问题的分割算法是解决分割问题的有效途径之一。 2. 主分量分析技术通常用于数据压缩和统计特征的提取。 本文研究了主分量分析 的基本理论,进行了主分量变换的实验;找到了主分量分析应用于图像聚类分 割的切入点: 即主分量分析所得最大特征值对应的特征向量方向即像素的最佳 延伸方向。 3. 基于 PCA 技术和模糊 C-均值算法,提出了一种针对存在光斑和阴影(受光 照条件影响)的彩色图像的有效分割方法。论文首先分析了为什么要使用模糊 聚类的技术;然后讨论了聚类空间对聚类结果的影响,着重介绍了本文聚类时 所用的“指定分割区域色彩特征空间” ,分析了采用该空间的理论和实验依据; 为了进一步提高分割准确性,根据主分量分析的统计原理,我们进一步对聚类 数据进行了权重变换,并在 FCM 中引入簇分布方向性的计算。给出了算法详 细的流程步骤,并进行了实验。实验证明,本文中提出的方法是有效的,对于 处理带有亮斑、阴影的彩色图像能够对指定色彩的区域获得较好的分割结果。 最后在总结全文的基础上,提出了若干有待进一步深入研究和探讨的问题。 关键词:彩色图像分割,主分量分析,模糊 C-均值聚类,特征空间I 重庆大学硕士学位论文英文摘要ABSTRACTImage Processing has far-ranging application in our life, and the most attentions have been gained by digital image processing. Image segmentation in image project which be taken as a crucial step transiting from image process in low level to image analysis in high level holds the important position in the research of image techniques. In the past, most efforts has been exerted in monochromatic image segmentation, but now, as the rapid improvement of processing ability of personal computer, the color image segmentation has attracts more and more attentions. However, most of the old segmenting methods applied to monochromatic image cannot be applied to color image segmenting directly, so, researches in developing new algorithms is necessary and the generality and better segmenting effects is the goal of researches. The paper has studied on color image segmentation technique, and the primary tasks of the paper are as follows:(1) The current and mainstream color image segmentation algorithms havediscussed in two aspects. Firstly, the color spaces which have recently appeared in color image segmentation field have been analysed and summarized, then we concluded the characteristics of them when used in segmentation. Secondly, the mainstream segmenting algorithms have been analyzed, classified and summarized. Then we compared the advantages and disadvantages of them. At last, we point out that the effective way to segment the color image is taking the features of the specific segmenting problem into account, choosing appropriate color space and a suitable segmentation method corresponding to this color space.(2) Principal component analysis (PCA) is used in data compressing and statisticalfeatures extracting. And then, the basic theory of PCA is discussed and the corresponding experiments are done. Based on the analysis and experiments, we concluded that the fact that the direction of the vector related to the most value is the direction of the pixels’ distribution can be applied to image segmenting.(3) On the basis of PCA and Fuzzy C-Means Clustering (FCM), a new algorithmwhich can be applied to segment the color image with shadows and faculae is proposed. We explained why we choose the fuzzy cluster method first. Then the limitations caused by space which data clusters in are analyzed, and ‘ the desired image color eigenspace’used in the new methods are described in detail. The reason that we useII 重庆大学硕士学位论文英文摘要eigenspace instead of color space is also explained carefully. Later, in order to better the segmenting effects, we further applied the weight transforming to the data and induced the concept of direction of cluster distribution to FCM. In the end, the detailed algorithm and experiments were given. Our experiments demonstrate that our method is effective and can obtain preferable results when segmenting color images with shadows and faculae. In the very end, based on a summary of the research results, several questions for further research and exploration are proposed. Keywords: color image segmentation, principal component analysis Fuzzy C-Means Clustering, eigenspaceIII 重庆大学硕士学位论文1 绪论1 绪 论1.1 图像处理概述信息是自然界物质运动总体的一个重要方面,人们认识世界和改造世界就是 要获得各种各样的信息。图像信息是人类获得外界信息的主要来源,因为大约有 70%的信息是通过人眼获得的,而人眼获得的都是图像信息。在近代科学研究、 军事技术、工农业生产、医学、气象及天文学领域中,人们越来越多地利用图像 信息来认识和判断事务,解决实际问题。例如:由于空间技术的发展,人造卫星 拍摄了大量的地面和空间的照片,人们可以利用照片获得地球资源、获得地球资 源、全球气象和污染情况等;在医学上,医生可以通过 X 射线层析照相,观察到 人体各部位的断层图像;在工厂,技术人员可以利用电视图像管理生产。由此可 见图像信息的重要性。获得图像信息非常重要,但目的不仅仅是为了获得图像, 而更重要的是将图像信息进行处理,在大量复杂的图像中,找出我们所需要的信 息。因此图像信息处理在某种意义上讲,比获得图像更为重要,尤其是在当今科 学技术迅速发展的时代,对图像信息处理提出了更高的要求,以便更加迅速、准 确、可靠地获得有用的信息[1]。 图像是指景物在某种成像介质上再现的视觉信息。图像是具有特定信息的某 种集合体,本质上可认为图像是数据的集合。为了研究和分析图像,需对图像进 行必要的处理,常用的图像处理的方法可分为下列几种[1,2]: 1. 光学模拟处理(光信息处理) 它是建立在傅立叶光学的基础上,进行光学滤波、相关运算、频谱分析等, 可以实现图像质量的改善、图像识别、图像的几何畸变光治理的矫正、光信息的 编码和存储、图像的伪彩色化、三维图像的显示、对非光学信号进行光信息处理 等。光信息处理的优点是实时,能进行二维并列运算,借助于全息图可作三维并 列运算,运算速度很快,处理的图像信息客量可以特别大,处理系统也比较简单。 其不足是处理精度较低,灰阶少(最高为 64 级) ,处理缺乏灵活性,处理过程中 功能不全,没有判断功能,没有数量概念等。 2. 电学模拟处理 把光强度信号转换成电信号,然后用电子学的方法,对信号进行加、减、乘、 除、进行浓度分割、反差放大、彩色合成、光谱对比等,电视视频信号中常应用 它。近期发展较快的电荷耦合器件(CCD)模拟处理方法,根据 CCD 的特性有 三种处理功能:①模拟延迟,改变时钟脉冲频率就能实现模拟延迟;②多路调制 把并列输入的信号转换成串行的时序信号,或者建立它的反变换,可实现数据信1 重庆大学硕士学位论文1 绪论息的重新排列; ③它能作各响应的滤波器, 而滤波器就是一个信号处理装置。 CCD 模数处理在设备、成本方面都有很大的优越性,在滤波技术方面较计算机更易于 实现。 3. 数字处理(计算机数字处理) 图像的数字处理是在以计算机为中心的包括各种输入、输出及显示设备在内 的数字图像处理系统上进行的,是将连续的模拟图像变成离散的数字图像后,再 建立在特定的物理模型和数学模型的基础上而编制的程序(软件)控制下,所进 行并实现种种要求的处理。数字图像处理的发展取决于硬件的研制、软件的开发 和必要的科学储备。当前,图像处理总的发展研究趋势是以数字处理为主,因为 这种方法有许多优点。例如:处理精度高、灰阶多(256 级以上) 、能进行复杂的 非线性运算、处理非常灵活、功能齐全、使用和保存方便、通用性和重复性好等。 但与光信息处理相比,处理速度、图像的容量等受到计算机的限制,处理设备也 较复杂。 利用计算机对图像信息的处理,按其处理特点可以基本分成两大类:一类是 以最终恢复原图像为前提的信息压缩处理和用原图像相异的形式有效地表现和提 示图像的图像变换处理。基于图像数据压缩的图像传输和存储,通过图像变换来 改善图像的增强和恢复,都属于这一类。其要求是尽可能地不丢失信息。因为无 论是压缩处理和图像变换处理,最终要以图像形式表示,如果大量丢失信息,重 建的图像将产生极大的失真。这一类是数字图像处理的基本内容。对图像进行分 割、描述和分析亦可纳入数字图像处理的范畴。另一类对图像的处理,主要是特 征信息的抽取,其处理的最终目的是为了识别。即对于那些用于判别景物的特征 信息给予抽取,而其它信息则尽量舍弃,达到高度的信息压缩,并根据提取的特 征信息进行分类和识别,这一类图像处理,属于数字模式识别的范畴。 4. 光学-计算机混合处理 混合处理是先用光学办法对图像作预处理,再用数字方法做精处理。因而兼 备了二者的优点,在某些场合得到应用。1.2 数字图像处理技术前文中已经提到了图像数字处理的好处,即:处理精度高、灰阶多(256 级 以上) 、能进行复杂的非线性运算、处理非常灵活、功能齐全、使用和保存方便、 通用性和重复性好等。另一方面,随着计算机广泛普及,网络建设的愈加完善, 计算机处理能力的提高,越来越多的图像信息都以数字形式进行存储、处理、传 播。数字图像处理技术已应用于我们生活的各方各面,如:工农业生产、军事国 防、医学研究、医疗服务,企业管理、教育以及气象服务等等领域。2 重庆大学硕士学位论文1 绪论由于图像数字处理的重要性和广泛性,本文仅对数字图像进行了研究,在以 后的章节里,提到的图像处理如果不特别声明都是数字图像处理。1.2.1 图像的数字化一般的图像(即模拟图像)是不能直接用数字计算机来处理的。为了使图像 能够被数字计算机处理,首先必须将模拟图像转换为数字图像,即需要对图像进 行数字化,把模拟图像分割成如图 1.1 所示的像素矩阵,每个像素的亮度、色度 值都用一个整数来表示。像素(抽样点)灰度、色度 等的分布 图片数字化…………… …………… …………… …………… …………… …………… ……………数字图像 矩阵图 1.1 图像数字化 Figure 1.1 digitalization of image图像的数字化可以分为抽样与量化两个步骤。抽样就是把在时间和空间上连 续的图像转换为离散的抽样点(即像素)集合的一种操作。由于图像是一种二维 分布信息,要对它完成抽样,就需要将二维信号变为一维信号,再对一维信号进 行抽样。具体做法是:先沿垂直方向按一定的间隔从上到下顺序地沿着水平方向 直线扫描的方式,取出各水平行上灰度值的一维扫描线,然后对该一维扫描线信 号按一定的间隔抽样得到离散信号。 若抽样结果每行像素为 M 个, 每列像素为 N 个,则整幅图像大小为 M ? N 个像素。 在进行抽样时,抽样点的间隔的选取是一个非常重要的问题,它决定了抽样 后的图像忠实于原图像的程度。图像中细节越多,则抽样间隔就应该越小。根据 1 一维抽样定理[3],若一维信号以 g (t ) 的最大频率为 ? ,若用 T ? 为间隔进行抽 2w 样后,则根据抽样结果 g (i ) , i ? ? ? 1,0,1, ? 就能完全恢复 g (t ) ,即3 重庆大学硕士学位论文1 绪论g (t ) ? ?g (i ) S (t ? iT ) ,其中 S (t ) ?sin(2??t ) 。 2??t经过抽样后,模拟图像己经在时间、空间上离散化为像素。但是抽样结果所 得到的像素值仍然是连续量,需要把抽样后得到的这些连续量表示的像素值离散 化为整数值,即量化。图 1.2 给出了量化的过程,即若连续灰度值用 z 来表示, 则对于满足 z i ? z ? z i ?1 的 z 值都量化为 qi ,qi 称为像素的灰度值,z 与 qi 的差称为 量化误差。若每个像素的灰度值量化后都用一个字节来表示,则由白-灰-黑的 连续变化的灰度值可以量化为 0―255 共 256 个灰度级。黑色 0 1 2 ┊ ┊ ┊ 128 ┊ ┊ ┊ 白色 从白到黑 颜色的连 续变换图 1.2 量化 Figure 1.2 quantificationzi-1 z ┊ ┊ zi+1qi-1 qi qi+1 灰色连续的 灰度值量化值 (整数值)254 255 灰度级 的分配量化可以分为等间隔量化与非等间隔量化,实际上一般采用等间隔量化。 一幅数字化后的图像的数据量为: M (每列象素数)? N (每行像素数)? b (灰度量化所占用位数)bit。抽样点数越多,量化级数越多,图像数字化的质量 越高, 但是该图像的数据量也就越大。 为了使一幅图像既能得到满意的视觉效果, 又能使其数据量最小,一般需要针对图像的具体内容来确定相应的 M 、 N 和 b 的 值。 一幅 M ? N 个像素的数字图像,其像素灰度值可用 M 行 N 列的矩阵 F 来表 示,如图 1.3 所示。这样,对数字图像的各种处理就可以变成对矩阵 F 的各种运 算。4 重庆大学硕士学位论文1 绪论N列像素? ? ? F ?? ? ? ? ? f1,1 f 2,1 ? ? f M ,1 f1, 2 f 2, 2 ? ? f M ,2 ? ? ? ? ? ? f1, N ? ? f 2, N ? ? ? ? ? ? f M ,N ? ?M 行 像 素数字图像 (M× N 像素)图 1.3 数字图像的矩阵表示 Figure 1.3 the matrix representation of digital image1.2.2 数字图像处理的内容数字图像处理技术的内容大致可以分为以下几个方面[4,5,6]: 1. 图像变换: 一般指利用正交变换(诸如傅立叶变换、余弦变换、沃尔什变换、小波变换 等等)的性质和特点,将图像转换到变换域中进行处理,如由时间域或空间域的 图像转换到频率域的变换处理以改善图像的质量,同时还因为大多数变换都有快 速实现的方法,从而大大提高了处理运算的速度。该部分主要研究各种变换模型 和处理方法。 2. 图像增强: 指利用各种数学方法和变换手段提高图像中的对象与非对象的对比度与图像 清晰度,对象指所需研究的目标,非对象指对象以外的背景。从而突出接收系统 所感兴趣的部分,例如:若强化图像高频分量,则可使图像中目标轮廓清晰、细 节明显等等。该部分主要研究各种增强模型和处理方法。 3. 图像复原: 在景物成像过程中,由于目标的高速运动、介质散射、系统畸变、噪声干扰 等因素,致使最后形成的图像存在种种恶化。把恶化了的图像恢复到能真实反映 原景物图像的处理,称为图像复原。该部分主要研究各种校正模型和处理方法。 4. 图像压缩: 把数字化的图像数据按一定规则进行排列或运算的过程,称为图像编码。利 用图像本身的内在特性,通过某种特殊的编码方式,达到减少原图像数据时空占 用量的处理叫做图像压缩编码。该部分主要研究各种高效压缩编码方法。5 重庆大学硕士学位论文1 绪论5. 图像分析: 数字图像处理的一个重要任务就是对图像进行分析和理解。它主要包括以下 几个方面:图像分割(把图像分割成不同的区域,或将不同的东西分开) ;特征提 取(找出分开后各区域的特征) ;图像的识别与分类(识别图像中要找的东西,或 者对图像中不同的特征进行分类) ;对整个图像进行分析、描述和解释(对于不同 区域进行描述,或者找到不同区域之间的相互联系,进而找出相似结构,或者把 相关区域连接起来组成一个有意义的结构) 。1.2.3 数字图像处理的应用在社会生产和科研活动中,人们要频繁地接触到图像,例如照片、图画、书 报、医学 X 光片和卫星遥感图像等。图像是人们认识客观世界的重要知识来源。 随着计算机的高速化和大容量化,图像信息的处理己成为可能。另外;由于摄像 设备的小型化和高精度化,图像的质量有了显著改善。随着这些技术的进步,图 像处理在工作站及个人计算机等小型机上己可以实现。数字图像处理主要利用计 算机来实现, 随着计算机软硬件技术的突飞猛进, 以及数字处理方法的长足发展, 使得数字图像处理技术无论在科学研究、工业生产、军事国防及现代管理决策部 门等各行各业都得到越来越多的应用,其场合广阔、内容众多、形式新颖、门类 齐全、应用可以说是方兴未艾,正向着实时化、大型化、小型化、远程化等多方 面迅猛发展。如表 l.l 所示,简单列出了数字图像处理的一些应用领域[6]。表 1.1 数字图像处理的应用领域 Table 1.1 the application area of digital image processing 领域 物理、化学 生物、医学 环境保护 地质 农林 海洋 水利 气象 通讯 工业 法律、公安 交通 军事 宇航 文化 应用内容 结晶分析、谱分析 细胞分析、染色体、血球分类、X 光分析、CT 水质和大气污染调查 资源勘探、地图绘制 植物分类调查、农作物估产 鱼群调查 河流分布、水利水害调查 云图分析、灾难性检测等 传真、电视、可视电话、图像通讯 工业探伤、计算机视觉、自动控制、机器人 指纹识别、人像鉴定 铁路选线、交通指挥、汽车识别 侦察、图像制导、图像融合 星际探险照片处理等 多媒体、动画特技6 重庆大学硕士学位论文1 绪论1.3 图像分割的定义及研究意义1.3.1 图像分割的定义多年来人们对图像分割提出了不同的解释和表达,借助集合概念对图像分割 可给出如下比较正式的定义[7]: 令集合 R 代表整个图像区域,对 R 的分割可看做将 R 分成 N 个满足以下五个 条件的非空子集(子区域) R1 , R2 , ? , R N : (1) ? Ri ? R ;i ?1 N(2) 对所有的 i 和 j , i ? j ,有 Ri ? R j ? ? ; (3) 对 i ? 1,2, ? , N ,有 P( Ri ) ? TRUE ; (4) 对 i ? j ,有 P ( Ri ? R j ) ? FALSE ; (5) 对 i ? 1,2, ? , N , Ri 是连通的区域。 其中 P( Ri ) 是对所有在集合 Ri 中元素的逻辑谓词, ? 代表空集。 下面先对上述各个条件分别给予简略解释。条件(l)指出在对一幅图像的分 割结果中全部子区域的总和(并集)应能包括图像中所有像素(就是原图像) ,或 者说分割应将图像中的每个像素都分进某个子区域中。条件(2)指出在分割结果 中各个子区域是互不重叠的,或者说在分割结果中一个像素不能同时属于两个区 域。条件(3)指出在分割结果中每个子区域都有独特的特性,或者说属于同一个 区域中的像素应该具有某些相同特性。条件(4)指出在分割结果中,不同的子区 域具有不同的特性,没有公共元素,或者说属于不同区域的像素应该具有一些不 同的特性。条件(5)要求分割结果中同一个子区域内的像素应该是连通的,即同 一个子区域内的任两个像素在该子区域内互相连通,或者说分割得到的区域是一 个连通组元。 最后需要指出,实际应用中图像分割不仅要把一幅图像分成满足上面五个条 件的各具特性的区域而且需要把其中感兴趣的目标区域提取出来。只有这样才算 真正完成了图像分割的任务。1.3.2 图像分割在数字图像处理中所处的层次及研究意义图像分割是一种重要的图像技术,它不仅得到人们广泛的重视和研究,也在 实际中得到大量的应用。图像分割在不同领域中有时也用其他名称,如目标轮廓 技术,阈值化技术,图像区分或求差技术,目标检测技术,目标识别技术,目标 跟踪技术等,这些技术本身或核心实际上也是图像分割技术。7 重庆大学硕士学位论文1 绪论为了弄清图像分割在数字图像处理中所处的层次,我们引入并使用“图像工 程”这个概念。图像技术在广义上是各种与图像有关技术的总称。图像技术种类 很多,跨度很大,但可以将它们归在一个整体框架DD“图像工程”[8]之下。图 像工程是一个对整个图像领域进行研究应用的新科学,它的内容非常丰富,根据 抽象程度和研究方法等的不同可分为三个有特点的层次(如图 1.4 所示) :图像处 理、图像分析和图像理解。符号图像理解参数测量操作对象目标图像分析目标表达图像分割像素图像处理图 1.4 图像分割在图像工程中的位置 Figure 1.4图像处理着重强调在图像之间进行变换以改善图像的视觉效果。图像分析则 主要是对图像中感兴趣的目标进行监测和测量,以获得它们的客观信息从而建立 对图像的描述。图像理解的重点是在图像分析的基础上,进一步研究图像中各目 标的性质和它们之间的相互联系,并得出对原始成像客观场景的解释,从而指导 和规划行动。 图像处理、图像分析和图像理解具有不同的操作对象,可参考图 1.4。图像处 理是比较低层的操作, 它主要在图像像素级上进行处理。 图像分析则进入了中层, 它侧重于对像素集合-目标的表达测量描述。图像理解主要是高层操作,基本上 是对从描述中抽象出来的数据符号进行运算推理。 在对图像的研究和应用中,人们往往仅对图像中的某些部分感兴趣。这些部 分常称为目标或前景(其他部分称为背景) ,它们一般对应图像中特定的、具有独 特性质的区域。为了辨识和分析目标,需要将它们分离提取出来,在此基础上才 有可能对目标进一步利用。图像分割就是指把图像分成各具特性的区域并提取出 感兴趣目标的技术和过程。这里特性可以是像素的灰度、颜色、纹理等,预先定 义的目标可以对应单个区域,也可以对应多个区域。8 重庆大学硕士学位论文1 绪论图像分割是由图像处理过渡到图像分析的关键步骤,在图像工程中占据重要 的位置。一方面,它是目标表达的基础,对特征测量有重要的影响。另一方面, 因为图像分割及其基于分割的目标表达、特征提取和参数测量等将原始图像转化 为更抽象更紧凑的形式,使得更高层的图像分析和理解成为可能。 在实际生产生活中,图像分割的应用也非常广泛,几乎出现在有关图像处理 的所有领域,并涉及各种类型的图像。例如,在遥感应用中,卫星云图的处理; 在医学应用中,脑部 MR 图像分析;在交通图像分析中,违章车辆车牌区域的分 割;在面向对象的图像压缩和基于内容的图像检索中图像兴趣区域的提取。在这 些应用中,图像分割通常是为了进一步对图像进行分析、识别、压缩编码等,区 域提取的准确性将直接影响后继任务的有效性,因此分割的方法和精确程度是至 关重要的。1.4 论文的选题和研究意义多年来,对图像分割的研究一直是图像技术研究中的热点和焦点,人们对其 的关注和投入不断提高。它是一种重要的图像分析技术,是从图像处理到图像分 析的关键步骤,也是计算机视觉领域低层次视觉中的主要问题,图像分割结果是 图像特征提取和识别等图像理解的基础, 对图像的加工主要处于图像处理的层次, 图像分割后,对图像的分析才成为可能。另外,图像分割在实际中也得到了广泛 的应用,在计算机视觉和图像识别的各种应用系统中占有相当重要的地位,也是 研究计算机视觉系统、字符识别和目标自动获取等图像识别和理解系统首先要解 决的问题。只要需对图像目标进行提取,测量等都离不开图像分割。 虽然几乎自数字图像处理问世不久就开始了图像分割的研究,吸引了很多研 究人员为之付出了巨大的努力,在不同的领域也取得了相当的进展与成就,人们 至今还一直在努力发展新的、更有潜力的分割算法,以期实现更通用、更完美的 分割结果。目前,针对各种具体问题己经提出了许多不同的图像分割算法[9],对 图像分割的效果也有很好的分析结论。但是,由于图像分割问题所面向领域的特 殊性,而且问题本身具有一定的难度和复杂性,到目前为止还不存在一个通用的 方法,也不存在一个判断分割是否成功的客观标准。对于寻找一种能够普遍适用 于各种复杂情况的准确率很高的分割算法,还有很大的探索空间。对图像分割的 深入研究不仅会不断完善对自身问题的解决,而且必将推动模式识别、计算机视 觉、人工智能等计算机科学分支的发展。 从上面的分析可以, 图像分割技术的研究是非常具有学术价值和实用意义的。 但是过去的研究多数都致力于单色图像的分割,即从单色图像中提取出感兴趣的 目标。随着计算机处理速度的大幅提高以及现实生活的发展需要,彩色图像的分9 重庆大学硕士学位论文1 绪论割越来越引起人们的关注。这是因为对于单色图像的分割来说明亮度 (lightness) 是惟一的可用信息,而彩色图像除了提供明亮度外,还有色调和颜色的深浅,显 而易见,彩色图像比单色图像具有更大的信息量。因此,对彩色图像进行分割是 符合人类视觉特性的,而且具有更为广阔的应用空间。 虽然单色图像分割已经发展出了很多算法,但是很多用于单色图像分割的方 法并不适合于直接分割彩色图像, 所以进一步研究专门用于彩色图像分割的方法, 并且使它具有通用性和更好的处理效果是人们努力的方向。 所以这篇论文选择彩色图像分割作为研究内容,同时,彩色图像分割作为图 像分割的分支,其研究意义也不言而喻。1.5 本文的主要工作及内容安排我们知道要完成图像理解等高级处理,图像分割是必不可少的一步。本文针 对彩色图像的分割问题进行了研究,本文的研究内容主要包括: 1. 针对当前主流的彩色图像分割算法进行了分析、分类、归纳和总结,首先对 多年来彩色图像分割领域中出现的彩色空间进行了总结,指出了各类彩色空 间在彩色图像分割中的优缺点,为人们进行彩色图像分割时选择合适的彩色 空间提供了依据。 2. 在本文中讨论直方图阈值法、聚类法、基于区域的分割方法、边缘检测的分 割方法、基于模糊集理论的方法、基于神经网络的方法、基于模型的分割和 基于物理的分割方法,并且分析了各类方法的优缺点。为人们在不同的应用 场合及不同的图像数据条件下选择不同的分割算法提供了一定的依据。 3. 4. 5. 学习了主分量分析的理论知识,进行了主分量变换的实验;找到了主分量分 析应用于图像分割的切入点。 学习了聚类分析的有关知识,重点学习和掌握了模糊 C-均值聚类算法,对 算法的基本原理深入理解, 在理解和把握主分量分析技术和模糊 C-均值聚类算法的基础上,提出了结 合以上两种技术的一种新的分割方法,该方法对于存在阴影和亮斑的图像能 够取得较好的分割效果。 论文的内容的具体安排如下:第一章介绍了图像处理、数字图像处理、图像 分割的有关知识,说明彩色图像分割研究的重要意义。对论文的内容以及组织安 排进行大纲性的介绍。第二章从色彩空间和分割方法两个方面入手,对多年来彩 色图像分割领域出现的主流方法进行了分析和总结。 第三章介绍了 PCT 技术的基 本原理,实现方法和用于表示图像的优缺点,给出了生动的图像说明。第四章介10 重庆大学硕士学位论文1 绪论绍了聚类分析、基于目标的聚类方法的知识,指明模糊 C-均值聚类是典型的基 于目标的聚类,详细分析了模糊 C-均值聚类算法的理论基础和算法流程。以三 章、四章的知识为基础,在第五章中我们对综合应用主分量分析和模糊 C-均值 聚类知识的一种新的分割方法进行详细地阐述,这种方法适用于存在阴影的彩色 图像分割。对算法的原理和流程都进行了仔细的分析和描述。第六章是全文的总 结和展望。1.6 本章小结图像处理应用广泛,其中数字图像处理技术更是被广泛应用于生活的各方各 面。图像分割作为“数字图像处理工程” (简称为图像工程)中由图像底层处理过 渡到图像分析的关键步骤,一直是图像技术研究中的热点和焦点。在过去的很多 年里,多数的研究都致力于单色图像的分割,随着近年来个人计算机处理能力的 迅速提高,彩色图像的分割引起人们越来越多的关注。但是很多原有的分割灰度 图像的算法并不适合于直接分割彩色图像,所以进一步研究专门用于彩色图像分 割的方法,并且使它具有通用性和更好的处理效果是我们所追求的目标。本文的 研究重点是彩色图像分割技术。在这一章的最后一小结里我们对本文的研究内容 以及文章安排做了简单的介绍。11 重庆大学硕士学位论文2 彩色图像分割的研究2 彩色图像分割的研究2.1 引言人的视觉对亮度的感觉一般只有 20 级左右, 而彩色图像除了提供亮度外, 还 有色调和饱和度,比灰度图像能提供更多的信息。而且人眼对色调或者彩色的深 浅可区分 130 级左右,即人眼可区分的颜色可达到 35 万之多。随着技术的进步, 采集和处理彩色图像的硬件更容易得到,从而就可以处理由于高维的彩色空间带 来的计算机复杂性。同时颜色也是模式识别和计算机视觉中必不可少的成分。因 此,彩色图像分割越来越吸引了人们的注意。并且在许多多媒体应用中,彩色图 像分割也有广泛用途,例如;在数字化图书馆中为了有效地浏览大量图像和视频 的收集物,它们都需要被编目录、排序和存储,颜色和纹理在图像和视频中是两 个最重要的基于内容的信息恢复特征,因此,颜色和纹理的分割经常用于索引和 管理数据;另一个多媒体应用中的例子是网络中信息的传播,今天,大量的多媒 体数据流在 Internet 上传送,但是由于带宽的限制,必须对数据进行压缩,因此 也要求对图像和视频进行分割。 迄今为止, 已经出现了很多关于灰度图像分割的方法, 本文对此就不再赘述。 同时,在过去的十多年里彩色图像的分割方法也有了显著的增长,灰度图像的分 割为彩色图像分割的发展提供了肥沃的土壤,因为大多数彩色图像分割的方法都 是在灰度图像分割方法的基础上发展起来的, 即通过利用 RGB 彩色空间或它的线 性的、非线性的变换把灰度图像分割方法推广到处理彩色图像上来。但是,彩色 图像分割和灰度图像分割方法又有明显的不同:因为对于灰度图像分割,亮度 (lightness)是惟一的可用信息;而彩色图像除了提供明亮度外,还有色调和颜色的 深浅,彩色图像比单色图像具有更大的信息量。在分割时,如何充分利用彩色图 像提供的信息是研究的重点和难点。 但是,总的说来,对彩色图像进行分割有两个首要的问题需要考虑[10]即:① 选择什么样的彩色空间;②采用什么样的分割方法。在这一章,我们首先介绍各 种色彩空间及它们之间的相互转换,讨论并总结各种空间在应用于图像分割领域 时的优缺点。然后介绍了现有的主流彩色图像分割算法,包括:直方图阈值法、 色彩空间聚类方法、基于区域的分割方法、边缘检测的分割方法、基于模糊集理 论的方法、基于神经网络的方法、基于模型的方法和基于物理的方法。对这些方 法的原理,应用时的重点难点,以及各自的特点都进行了较为详尽的分析,其中 还指出了部分灰度图像分割方法在推广到处理彩色图像分割时面临的问题。最后 对全章进行总结,指出了彩色图像分割方法发展的前景。12 重庆大学硕士学位论文2 彩色图像分割的研究2.2 彩色空间的表示2.2.1 RGB 彩色空间红色( R ) 、绿色( G )和蓝色( B )被称作三种基本的颜色,人类感知到 的颜色就是这三种基本颜色联合产生的。利用这三种基本颜色,通过它们的线性 或非线性表示能得到其它彩色空间的表示。彩色空间 RGB 、 HSI 、 CIE L?u ? v 等 都在彩色图像分割中经常被用到,但是它们没有一种彩色空间能超越其它所有彩 色空间适合于处理所有的彩色图像,因此在彩色图像分割中选择最好的彩色空间 仍然是困难之一[11]。 下面我们利用光分别通过三个红、 绿、 蓝颜色过滤器得到的亮度值来表示红、 绿、蓝三个颜色分量,如下式所示:R ? ? E (? ) S R (? )d??G ? ? E (? ) S G (? )d??B ? ? E (? )S B (? )d??其中, S R 、 S G 、 S B 是三个颜色过滤器, E (? ) 表示射入过滤器的光或射线,? 是波长。 RGB 彩色空间用图像表示如图 3.1 所示,是一个立方体,立方体中每个点的坐标都能用 R 、 G 、 B 三个值表示。G Green (0,255,0) Cyan (0,255,255)Yellow (255,255,0)White (255,255,255)Black (0,0,0) Blue (0,0,255) BRed R (255,0,0) Magneta (255,0,255)色度学规则:①通过 R 、 G 、 B 这三种颜色能产生任何颜色,并且这三种颜 色结合后产主的颜色也是唯一的;②如果两个颜色是相等的,这三个颜色分量再13 重庆大学硕士学位论文2 彩色图像分割的研究乘以或者除以相等的数,得到的颜色仍然相等;③混合色的亮度等于每种颜色亮 度的和。 在电视系统和数码相机中, RGB 是最常用的彩色模型。 RGB 适合于颜色的 显示,但是由于 R 、 G 、 B 三分量的高相关性,它不适合于彩色图像的分割和分 析。所谓高相关性,就是如果强度发生变化,所有的三个颜色分量都会相应地发 生变化。此外,在 RGB 空间里无法用空间距离衡量两种颜色的相似性。 下面将介绍从 RGB 空间经线性或非线性变换得到其它色彩空间。2.2.2 由 RGB 空间线性变换得到的空间1. YIQ 空间YIQ 是美国国家电视系统委员会(NTSC)定义的一种彩色电视信号传送格式,它能从 RGB 彩色空间经过线性变换得到的: 0.114 ?? R ? ? Y ? ? 0.299 0.587 ? ? ? ?? ? ? I ? ? ? 0.596 ? 0.274 ? 0.322 ?? G ? ? Q ? ? 0.211 ? 0.523 0.312 ?? B ? ? ? ? ?? ? 其中 0 ? R ? 1 , 0 ? G ? 1 , 0 ? B ? 1 。Y 分量表示颜色的亮度信息;适合于彩色图像中的边缘检测方法, I 和 Q 联合起来表示图像的色调和饱和度。 YIQ 彩色空间部分地去掉了红、绿、蓝的高相 关性,并且 YIQ 为线性变换形式,比非线性变换形式需要更少的计算机时间。但 是由于 YIQ 是线性变换形式,所以也存在相关性,只是没有 RGB 彩色空间的相关 性高。 2. YUV 空间YUV 是适合于欧洲电视系统的一种彩色表示,YUV 和 YIQ 彩色空间类似,差别仅在子在空间上多旋转了 33°。它的线性变换式如下: 0.587 0.114 ?? R ? ? Y ? ? 0.299 ? ? ? ?? ? ?U ? ? ? ? 0.148 ? 0.289 0.437 ?? G ? ? V ? ? 0.615 ? 0.515 ? 0.100 ?? B ? ? ? ? ?? ? 其中, 0 ? R ? 1 , 0 ? G ? 1 , 0 ? B ? 1 。YUV 彩色空间也是部分地去掉了红、绿、蓝的高相关性,比非线性变换形式需要更少的计算机时间。但是由于 YUV 同样也是线性变换形式,所以也存在相关 性,只是没有 RGB 彩色空间的相关性高。 3. I 1 I 2 I 3 空间 参考文献[12]中 Y.ohta 等针对区域分割进行了系统的实验,得到了一系列有 效的颜色特征。在区域分裂的每一步,通过 R 、G 、 B 的 Karhunen-Loeve 变换, 计算得到新的颜色特征。他们应用了 8 张彩色图片,分析了 100 多种颜色特征,14 重庆大学硕士学位论文2 彩色图像分割的研究发现了一组有效的颜色特征,如下所示: ( R ? G ? B) I1 ? , 3 R?B I2 ? , 2 (2G ? R ? B ) I3 ? 4 Y.0hta 等根据分割的质量和变换的计算复杂性,比较了 I 1 I 2 I 3 和其它七种彩 色空间即 RGB 、YIQ 、 HSI 、 Nrgb 、 CIE L?u ? v ? 、 CIE L? a ? b ? 认为 I 1 I 2 I 3 更有效。 I 1 I 2 I 3 也是部分地去掉了红、绿、蓝的高相关性,计算时间少,能用于彩色图像 处理,但是和前两种彩色空间一样,由于线性变换的存在,所以也仍然存在相关 性,只是没有 RGB 彩色空间的相关性高。2.2.3 由 RGB 空间非线性变化得到的空间1. 标准化的 RGB ( Nrgb ) 为了在彩色图像分割时,使颜色不依靠光强度的变化而变化,一个有效的方 法是均一地得到光谱分布上强度的变化。下是得到标准化的彩色空间,其形式如 下:R , R?G ? B G g? , R?G? B B b? R?G? B r?因为 r ? g ? b ? 1 ,当给出两个分量的时候,第三个分量也就决定了,通常我 们只使用其中的两个分量[13]。 参考文献[14]中 Nevatia 定义了另一个标准化的彩色表示空间,如下所示: Y ? c1 R ? c 2 G ? c3 B ,R , R?G? B G T2 ? R?G ? B T1 ?其中,c1 ? c 2 ? c3 ? 1 ,c1 ,c 2 ,c3 是常量,能够共同表示图像中像素的强度。 同时我们可以看到 T1 和 T2 仅被 R 、 G 、 B 分量的百分比决定,因此,它们能表示 一幅图像的真实的颜色信息,并且和图像的强度无关,这是标准化 RGB 彩色系统 的优点之一。 又因为颜色值被限制到狭小的范围内, 所以能方便地表示彩色平面。 标准化彩色模型减小了分布对颜色变化的敏感性, 对强度的变化也相对稳健。 但是标准化彩色模型的一个明显的缺点是;如果标准化彩色模型在低强度区,噪15 重庆大学硕士学位论文2 彩色图像分割的研究声就比较大。这是由于 Nrgb 也是由 RGB 空间线性变换得到的。 2. HSI 空间HSI (hue-saturation-intensity)系统是图像处理中另外一个常用的彩色空间,其中 H 、 S 、 I 分别表示色调,饱和度,亮度或者强度, HSI 能直观地反 映人类感知颜色的方式, 这是因为人类的视觉系统能够更容易地区分不同的色调, 而且对不同的强度或饱和度的区别也不能说明颜色的不同。 HSI 的一些变体如:HSB (hue-saturation-brightness) 、 HSL (hue-saturation-lightness) 、 HSV (hue-saturation-value) 。 HSI 系统把亮度信息和颜色信息分离开。用 H 和 S 表示颜色信息, I 表示一幅图像中像素的整体亮度,而不管颜色是什么。色调 H 代表了基本的颜色,为光 谱波长分布中波峰的位置。饱和度 S 是对颜色纯度的测量,表明白光和色调混合 的数量,它是波峰相对整个光谱分布的高度。 HSI 彩色空间可以用一个圆柱体来 表示,如图 3.2 所示。一般地,色调 H 由角度表示,其取值范围:0°~360°, 如 0°表示红色,60°表示黄色,120°表示绿色,240°表示蓝色,300°表示品 红色或绛红色。饱和度 S 分量是 HSI 彩色空间中轴线到彩色点的半径的长度,彩 色点离轴线的距离越近,其越亮。强度 I 用在轴线方向上的高度表示,圆柱体的 轴线描述了灰度级,例如,强度取最小值时为黑色,强度取最大值时为白色。每 个和轴线正交的切面上,强度值都相等。IntensityWhiteBG Saturation R Hue Black R图 2.2 HIS 彩色空间 Figure 2.2 HSI color space16 重庆大学硕士学位论文2 彩色图像分割的研究从 RGB 到 HSI 的变换为:? ? 3 (G ? B ) ? H ? arctan? ? ( R ? G ) ? ( R ? B )) ? , ? ? ( R ? G ? B) , 3 min( R, G, B ) S ? 1? I I?上面三个式子中如果饱和度为零,色调就没有定义,如果强度为零,饱和度 就没有定义。 我们可以把灰度图像分割的算法应用到 HSI 系统的强度分量上。如果只分割 不同颜色的物体时,就可以仅应用分割算法到色调分量上,对有阴影的图像就十 分有效。利用这种方法虽然我们能客易地在色调域内设定阈值分割物体,但是转 换这些阈值到 RGB 彩色空间是十分困难的事情。也可以分别在色调、饱和度和强 度分量上运用阈值法,得到一些区域后,再利用各种区域生长算法。当亮度在不 同的像素间或者不同的图像间发生变化的时候, 利用色调进行分割是特别有效的, 而且在一维空间进行色调分割比在 RGB 彩色空间进行图像分割省时。 但是色调有 一个无法消除的奇点[15],当输入的 R 、 G 、 B 分量发生轻微的变化时,在进行变 换的过程中就会有较大的跳变,在颜色的表示中,奇点可能引起不连续,在奇点 附近色调值在数值上不连续,这就是在许多分割算法中,具有低饱和度的像素被 落下,没有到任何区域的原因。也就是如果强度值太大或太小,在区分颜色的过 程中色调和饱和度就不太起作用了。 3. CIE 彩色空间CIE 彩色空间是由国际照明委员会(Commission International de l’ Eclairage)于 1920 年开发并在其基础上演变产生的。它有三个基本量,用 X 、 Y 、 Z 表示, 通过 X 、 Y 、 Z 能够表示任何一种颜色, X 、 Y 、 Z 的值能够利用 R 、 G 、 B 线 性表示出来,其中 NTSC 接受器系统的变换矩阵如下: ? X ? ? 0.607 0.174 0.200 ?? R ? ? ? ? ?? ? ? Y ? ? ? 0.299 0.587 0.114 ?? G ? ? Z ? ? 0.000 0.066 1.116 ?? B ? ? ? ? ?? ? 一旦知道了 X 、 Y、 Z 的变换形式, 就会产生许多 CIE 空间, 其中 CIE ( L?u ? v ? ) 空间和 CIE ( L? a ? b ? )空间是两个典型的例子,它们都能通过 X 、 Y 、 Z 非线性 变换得到。CIE ( L? a ? b ? )的定义形式如下:17 重庆大学硕士学位论文2 彩色图像分割的研究? Y ? ? 3 L? ? 116? ? Y ? ? 16 , 0 ? ? ? X Y ? ?, 3 3 a ? ? 500? ? ? X Y0 ? 0 ? ? ? Y Z ? ? 3 3 b ? ? 200? ? ? Y ? Z 0 ? ? 0上式中 值。Y X Z ? 0.01 , ? 0.01 , ? 0.01 , X 0 , Y0 , Z 0 分别是标准白时的 Y0 X0 Z0CIE ( L?u ? v ? )的定义形式如下:? Y ? ? 3 L? ? 116? ? Y ? ? 16 , ? 0?u ? ? 13L? (u ? ? u 0 ) , v ? ? 13L? (v ? ? v 0 )上式中u? ?Y ? 0.01 , Y0 , u 0 , v0 分别为标准白时的值,并且有 Y04X , X ? 15Y ? 3Z 6Y v? ? , X ? 15Y ? 3Z在这两个彩色空间中每一个点我们都能看成( L? ,a ? ,b ? )或( L? ,u ? ,v ? ) 三维彩色空间中的一点,因此两个颜色的区别我们能够通过两个彩色点间的欧几 里得距离表示,这两个彩色点的区别描述如下: 对 CIE ( L? a ? b ? )空间:?E ab ? (?L? ) 2 ? (?a ? ) 2 ? (?b) 2 ,对 CIE ( L?u ? v ? )空间:?E uv ? (?L? ) 2 ? (?u ? ) 2 ? (?v) 2在彩色图像分割中,利用欧几里得距离表达人类感知颜色区别的能力是十分18 重庆大学硕士学位论文2 彩色图像分割的研究重要的, ( L? , a ? , b ? )和( L? , u ? , v ? )是两个相似的颜色模型,它们能很好 地满足人眼睛对计算机处理的敏感性。 然而 RGB 或者 XYZ 彩色空间就不具有上面 的特性。我们利用 CIE 空间和彩色点区别公式去定义 HSI 空间,也能很方便地得 到色调,饱和度和强度。 对 CIE ( L? a ? b ? )空间: I ? L? , H ? arctan( a? ), b?S ? (a ? ) 2 ? (b ? ) 2对 CIE ( L?u ? v ? )空间: I ? L? , u? H ? arctan( ? ) , vS ? (u ? ) 2 ? (v ? ) 2 。在这两个 CIE 空间中, 具有相同的 L? 值, 它表示颜色的亮度或者强度。 CIE 和RGB 相比,更能独立地和简单地控制颜色和强度信息:由于在 CIE 彩色空间内能够基于几何的距离公式比较颜色,因此能有效地进行小的颜色差别的测量。但是 由于同样是非线性变换,所以仍然存在奇点的问题。2.2.4 线性彩色空间和非线性彩色空间的比较J.Kender 在参考文献[16]中指出非线性彩色转换空间如 HSI ,标准化彩色空 间等都有不可消除的奇点问题,在值的分配问题上存在伪模式,建议我们应该使 用线性变换空间像 YIQ 等。但是通过前面的分析可以看到线性彩色空间的三个分 量具有高的相关性,三个分量相互联系,都在很大程度上依靠强度。因此线性彩 色空间很难区别彩色图像中的强光照射区、阴影和遮蔽区等,而且如果利用线性 彩色空间,图像分割不得不在三维空间中进行,通常在每个分量上进行一次,因 此很难结合这些分量上的内在信息。 然而非线性彩色空间就不存在这方面的问题, 例如在 HSI 空间中,如果饱和度不是太低,就可以利用色调在一维空间中进行分 割,大大降低了计算时间,而且彩色图像中的强光照射区、阴影和遮蔽区等也能 被很好地处理。 彩色空间 RGB 、 HSI 、 CIE L?u ? v 等都在彩色图像分割中经常被用到,但是19 重庆大学硕士学位论文2 彩色图像分割的研究它们没有一种彩色空间能超越其它所有彩色空间适用于处理所有的彩色图像,因 此在彩色图像分割中选择最好的彩色空间仍然是困难之一。表 2.1 对上文介绍的RGB 空间以及经线性变换或非线性变换得到的色彩空间的特点进行了总结归纳。表 2.1 色彩空间特点对比表 Figure 2.1 the contrasting of color spaces 色彩空间 优点 易于显示 美国电视系统有效编码色彩信息 部分去除 RGB 的相关性 减少运算时间 Y 分量适合于边缘检测 欧洲电视系统有效编码色彩信息 部分去除 RGB 的相关性 减少运算时间 部分去除 RGB 的相关性 适用于图像处理 色像的彩分量独立于图亮度 适合于表示调色板 对亮度变化不敏感 基于人类对色彩的感觉 在光照发生变化时很有用,因为 H(Hue) 分量对光线,阴影不敏感 H(Hue) 分量可用于区分具有不同颜 色的物体 能够使色彩和强度保持独立 CIE 空间的几何距离能衡量颜色差异 而且在衡量小颜色差异时非常有效 缺点 由于三个分量间的高相关性 不适用于彩色图像分割 由于线性变换,分量之间仍存在 相关性,但比 RGB 空间少的多RGBYIQYUV由于线性变换,分量之间仍存在 相关性,但比 RGB 空间少的多 由于线性变换,分量之间仍存在 相关性,但比 RGB 空间少的多 由于非线性变换, 在强度很低时会产生很多噪声 奇异点不可去除 由于非线性变换,在低饱和度时 颜色的数值不稳定I1 I 2 I 3NrgbHSICIE像其它非线性变换一样 有奇异点问题存在2.3 彩色图像分割的方法2.3.1 直方图阈值法直方图阈值法广泛应用于单色图像的分割。在利用阈值法来分割图像时有一 定的假设(换句话说,是基于一定的图像模型的) ,即图像具有单峰灰度分布的目 标和背景组成,处于目标或背景内的相邻像素间的灰度值是高度相关的,但处于 目标和背景交界处两边的像素在灰度值上有很大的差别。如果一幅图像满足以上 的条件,它的灰度直方图基本上可以看作是由分别对应若干目标和背景的若干单 峰直方图混合构成的。在灰度直方图上相邻峰之间的谷则对应阈值,选择合适的 阈值就可以对图像进行分割[8]。20 重庆大学硕士学位论文2 彩色图像分割的研究由于彩色图像不仅只有灰度这一个属性,所以使用直方图阈值法会出现很大 的不同。大多数方法都是对彩色图像的每个分量(属性)分别采用直方图阈值法。 由于彩色信息通常由 R 、G 、 B 或它们的线性/非线性组合来表示,所以用三维数 组来表示彩色图像的直方图并在其中选出合适的阈值,并不是一件轻松的工作[17],另一方面,确定图像中目标的数目计算量也很大。解决以上问题的方法之一就是找到有效的在三维色彩空间里存储和处理信息的方法。文献[18]使用二叉树来 存储彩色图像的三维直方图,二叉树上每个节点带有两个值,一个是 RGB 值,一 个是以该 RGB 值作为中心的区域内像素的个数。 方法之二就是把三维空间投影到 一个维数较低的空间,在维数较低的空间选择阈值对图像进行分割。文献[19]提出 了一种多维直方图选取阈值的方法,选取的阈值来自于三个不同的色彩空间,RGB 、 YIQ 和 HSI 。对于 9 个分量分别绘出对应直方图,在具有最优峰的直方图上选出阈值并分割图像,这样就产生 2 个新的待分割图像,如此迭代,以获得最 终的分割结果。 阈值分割的优点是实现简单,对于不同类的物体灰度值或其它特征值相差很 大时,它能很有效地对图像进行分割。但是对于彩色图像,如何使用颜色信息获 得对分割有效的直方图是一个需要仔细思考的问题。 类似于灰度图像,彩色图像的阈值分割也存在以下缺点:①对于图像中不存 在明显色差或颜色范围有较大重叠的图像分割问题难以得到准确的结果;②由于 它仅仅考虑了图像的色彩信息而不考虑图像的空间信息,阈值分割对噪声和灰度 不均匀很敏感。所以该方法还是经常和其它方法结合起来运用。2.3.2 色彩空间聚类通常,分别对每个分量采用阈值法,对有些图像难以获得准确的分割。这时 如综合考虑多个属性则可以解决这一问题。对于彩色图像,色彩空间就是一个典 型的特征空间,因此在色彩空间进行聚类是一个很直接的想法,而且像素的颜色 信息在空间都成簇分布。 基于聚类技术的基本原理是将一幅彩色图像聚为特征空间中的几簇,每一簇 都对应着图像中的目标。聚类分割方法通常按如下步骤进行:首先是把彩色图像 中的象素按照某种聚类规则对应到特征空间中的簇去, 当所有的像素都处理完后, 在把特征域中的簇映射回空间域,实现图像的分割。 聚类是一种无监督的(unsupervised)的统计方法。因为没有训练样本集,聚 类算法迭代地执行图像分类和提取各类的特征值。从某种意义上说,聚类是一种 自我训练的分类。其中,K 均值[20]、模糊 C 均值(Fuzzy C-Means)[21]、EM (Expectation-Maximization) 和分层聚类方法[22]是常用的聚类算法。 K 均值算法 先对当前的每一类求均值,然后按均值对像素进行重新分类(将像素归入均值最21 重庆大学硕士学位论文2 彩色图像分割的研究近的类) ,对新生成的类再迭代执行前面的步骤。模糊 C 均值算法从模糊集合理 论的角度对 K 均值进行了推广。EM 算法把图像中每一个像素的灰度值看作是几 个概率分布(一般用 Gaussian 分布)按一定比例的混合,通过优化基于最大后验 概率的目标函数来估计这几个概率分布的参数和它们之间的混合比例。分层聚类 方法通过一系列连续合并和分裂完成, 聚类过程可以用一个类似树的结构来表示。 图像分割是根据一定的相似性准则对像素进行分类,利用数据聚类方法对彩 色图像进行分割具有直观、易于实现的特点[10],并且能够把 3 个彩色分量,作为一 个整体进行考虑,分割效果较好。因此,聚类空间的选择非常重要。例如,在 RGB 空间聚类,由于 R 、 G 、 B 分量间的高相关性,在分割时,就会把具有相同颜色 但是亮度不同的一个物体划分为不同区域。 聚类方法存在的主要问题有:①聚类分析不需要训练集,所以聚类时需要提 供初始参数,初始参数(特别是聚类数目)的设定对最终分类结果影响较大;② 聚类也没有考虑空间关联信息,因此也对噪声敏感。2.3.3 基于区域的分割方法基于区域的分割方法, 主要包括区域生长、 区域分裂合并和以上方法的组合。 区域生长的基本思想是将具有相似性质的像素集合起来构成区域。先对每个 需要分割的区域找一个种子像素作为生长的起点,然后将种子像素周围邻域中与 种子像素有相同或相似性质的像素 (根据某种事先确定的生长或相似准则来判定) 合并到种子像素所在区域中。将这些新像素当作新的种子像素继续进行上面的过 程,直到再没有满足条件的像素可被包括进来。该区域就长成了。在实际应用此 方法时需要解决三个问题:①选择或确定一组能正确代表所需区域的种子像素; ②确定在生长过程中能将相邻像素包括进来的准则;③制定让生长过程停止的条 件或规则。种子像素的选取常可借助具体问题的特点进行。利用迭代的方法从大 到小逐步收缩是一种典型的方法,它不仅对 2-D 图像而且对 3-D 图像也适用。 如在军用红外图像中检测目标时,由子一般情况下目标辐射较大,所以可选用图 中最亮的像素作为种子像素。要是对具体问题没有先验知识,则常可借助生长准 则对每个像素进行相应计算。如果计算结果呈现聚类的情况则接近聚类重心的像 素可取为种子像素。生长准则的选取不仅依赖于具体问题本身,也和所用图像数 据的种类有关。此外还需考虑像素间的连通性和邻近性,否则有时会出现无意义 的分割结果。一般生长过程在进行到再没有满足生长准则需要像素时停止。但常 用的基于灰度、纹理、彩色的准则大都基于图像中的局部性质,并没有充分考虑 生长的“历史” 。为增加区域生长的能力常需考虑一些与尺寸、形状等图像和目标 的全局性质有关的准则。在这种情况下常需对分割结果建立一定的模型或辅以一 定的先验知识。22 重庆大学硕士学位论文2 彩色图像分割的研究区域生长算法的优点是易于实现、计算简单。与阈值分割类似,区域增长也 很少单独使用,往往是与其它分割方法一起使用。区域生长的缺点是:①它需要 人工交互以获得种子点,这样使用者必须在每个需要抽取出的区域中植入一个种 子点;②区域增长方式也对噪声敏感,导致抽取出的区域有空洞或者在局部体效 应的情况下将分开的区域连接起来。为解决这些问题,发展了很多方法,例如在 参考文献[23]中 Mangin J.F.等人提出了一种同伦的(homotopic)区域生长方法,以 保证初始区域和最终抽取出的区域的拓扑结构相同。 区域分裂合并的思想是可以从整幅图像开始通过不断分裂得到各个区域。实 际应用中常先把图像分成任意大小且不重叠的区域,然后再合并或分裂这些区域 以满足分割的要求。在这类方法中,常需要根据图像的统计特性设定图像区域属 性的一致性测度,其中最常用的测度多基于灰度统计特征,另外也可借助区域的 边缘信息来决定是否对区域进行合并或分裂。分裂合并方法不需要预先指定种子 点,它的研究重点是分裂和合并规则的设计。但是,分裂合并技术可能会使分割 区域的边界被破坏。 对于存在明显相似准则的图像来说,区域生长,区域分裂合并能取得较好的 分割结果,因为在分割过程中不仅考虑了颜色信息而且考虑了空间关联信息;同 时,由于准则的统计特性,可以有效消除孤立噪声的干扰,具有很强的鲁棒性。 然而以上方法的缺点是:生长和分裂合并只能串行进行;分割结果受初始种子点 的选择以及生长或分裂合并的过程顺序的影响。2.3.4 边缘检测的分割方法边界检测的方法广泛应用于灰度图像的分割,这类方法主要基于图像灰度级 的不连续性,它通过检测不同区域之间的边界来实现图像的分割,这与认得视觉 过程有些相似。依据执行方式的不同,这类方法又分为串行边缘检测技术和并行 边缘检测技术。在串行边缘检测技术中,当前像素点是否属于待检测的边缘,取 决于先前像素的验证结果;而在并行边缘检测技术中,一个像素点是否属于待检 测的边缘,取决于当前正在检测的像素点以及该像素点的一些相邻像素点,这样 该模型可以同时用于检测图像中的所有像素点,因而称之为并行边缘检测技术。 1. 串行边缘检测 串行边界查找方法通常是查找高梯度值的像素,然后将他们连接起来形成曲 线表示对象的边缘。串行边界查找方法在很大程度上受起始点的影响,以前检测 像素的结果对下一像素的判断也有较大影响。其困难是如何连接高梯度的像素, 因为在实际图像中他们通常不相邻。另一个问题是噪声的影响,因为梯度算子具 有高通特性,噪声通常也是高频的,因此可能造成一些错误边缘像素的检测。问 题三是中止准则的确定。23 重庆大学硕士学位论文2 彩色图像分割的研究最有代表性的串行边缘检测方法是将边缘检测的问题转化为图论中寻求最小 代价路径的问题。为求得最小代价,通常有两种方法;一种是贪婪法,即通过在 图中进行全局搜索寻找对应最小代价的路径,这种方法的计算量太大;另外一种 是动态规划的优化方法,为加快运算速度只求次优解。在此方法的基础上,为解 决医学图像的分割,Falcao AX 等人在检测过程中引入了人机交互作用和判断力, 提出了 live wire 分割算法。该算法为用户提供对分割过程的有效控制,使用户能 在必要的时候方便地干预及影响分割的过程,从而保证分割的准确性。另外,它 还使用户必须干预的次数和每次干预的时间尽可能少,既发挥人的判断力,又充 分利用了计算机的运算性能,从而使分割方法具有实用性[24]。中国科学院自动化 研究所在这方面也做了很大工作,将基于模糊连接度的区域分割方法与 live wire 算法相结合,将物体边缘的查找限制在用基于模糊连接度的区域增长算法对图像 做过度分割得到的可能的边缘范围内,极大地提高了 livewire 算法的速度和分割 的可靠性。 2. 并行边缘检测 主要是指并行微分算子方法。 并行微分算子法对图像中灰度的变化进行检测, 通过求一阶导数极值点或二阶导数过零点来检测边缘。常用的一阶导数算子有梯 度算子、Prewitt 算子和 Sobel 算子,二阶导数算子有 Laplacian 算子,还有 Kirsch 算子和 Wallis 算于等非线性算子。这类算法存在的问题主要是:梯度算子不仅对 边缘信息敏感,而且对图像噪声也很敏感,因此对于灰度渐变的图像不能找到正 确的边界。 为减少噪声对图像的影响,通常在求导之前先对图像进行滤波。常用的滤波 器主要是高斯(Gaussian)函数的一阶和二阶导数,Canny J 认为高斯函数的一阶 导数是她求得的最优滤波器的较好近似。 计算机视觉的创始入 Marr 首先提出, 采 用 Laplacian 算子求高斯函数的二阶导数得到 LOG(Laplacian of Gaussian)滤波 算子。近年来研究的滤波器还有可控滤波器,BD样条滤波器等。 除了以上提到的两类方法,近年来还提出基于曲面拟合的方法[25],基于边界 曲线拟合的方法[26],基于反应-扩散方程的方法,基于形变模型的方法等。 ①基于曲面拟合的方法的基本思想是将灰度看成高度,用一个曲面来拟合一 个小窗口内的数据,然后根据该曲面来决定边缘点。 ②基于边界曲线拟合的方法用平面曲线来表示不同区域之间的图像边界线, 试图根据图像梯度等信息找出能正确表示边界的曲线从而得到图像分割的目的, 而且由于它直接给出的是边界曲线而不像一般的方法找出的是离散的、不相关的 边缘点,因而对图像分割的后继处理如物体识别等高层处理有很大帮助。即便是 用一般的方法找出的边缘点,用曲线来描述它们以便于高层处理也是经常被采用24 重庆大学硕士学位论文2 彩色图像分割的研究的一种有效的方式。 ③基于反应─扩散方程的方法是从传统意义上的 Gaussian 核函数多尺度滤波 来的。 后来很多研究人员继续讨论了反应─扩散方程在图像处理中的作用。 Zhu S. C.等人把马尔科夫随机场模型与反应─扩散方程联系起来,通过极小化 Gibbs 分 布的能量函数推导出反应─扩散方程,而所用到的 Gibbs 分布的能量函数是通过 将原图像用 LOG 算子或 Gabor 滤波器等进行滤波得到的[27]。 ④基于形变模型的方法综合利用了区域与边界信息,是目前研究最多、应用 最广的分割方法,可以宣称是过去几年计算机视觉领域的成功关键。在基于模型 的技术中,形变模型提供了一种高效的图像分析方法,它结合了几何学、物理学 和近似理论。他们通过使用从图像数据获得的约束信息(自底向上)和目标的位 置、大小和形状等先验知识(自顶向下) ,可有效地对目标进行分割、匹配和跟踪 分析。从物理学角度,可将形变模型看成是一个在施加外力和内部约束条件下自 然反应的弹性物体。 对于灰度图像,灰度边缘是灰度值不连续(或突变)的结果,灰度值不同取 决于亮度值(brightness)的变化。然而在彩色图像中,边界所包含的信息远比灰 度图像丰富的多。例如,亮度(brightness)相同、色度(hue)不同的目标间的 边界也是应当被检测出来的。对应地,彩色图像边界定义为三维色彩空间里的不 连续处。对“不连续性”的处理大致可以分为 3 类:①在色彩空间定义“距离” , 用色彩之间的距离作为是否连续的量度;②彩色空间由三个灰度图像构成,对每 个灰度图像分别进行边缘检测,最后用某种规则综合边缘检测结果;③对彩色图 像的三个分量各自形成的边界设定 “一致性约束条件” , 同时保证三个分量形成的 边界具有最大不相关性,对三个分量的边界综合分析得出彩色图像的边界。 有一点值得注意的是:边缘检测不能得到最终的分割结果,因为单独的边缘 检测只能产生边缘点,而不是一个完整意义上的图像分割过程,这样边缘点信息 需要后续处理或与其他分割算法结合起来,才能完成分割任务。2.3.5 基于模糊集理论的方法前面提到的方法对于分割区域采用明晰的决策,然而图像中的区域并不常常 是明确定义的,图像分割问题是典型的结构不良问题:在每一个图像分析和模式 识别的层次都有可能引起不确定性,而决策在任何一个层次都是基于前一层次的 结果,这样一个分割和识别系统应该有适当的弹性来处理各个层次的不确定性, 使系统能够保留每一层次上尽可能多的信息。而模糊集理论具有描述结果不良问 题的能力:它提供了一种代表和处理不确定性和模糊性的机制,在模糊集合中, 图像中每一个象素点的成员关系值描述了它属于一个区域或边界的隶属度,这样 我们可以避免过早的给其下一个明确的判决。所以研究者将模糊理论引入到图像25 重庆大学硕士学位论文2 彩色图像分割的研究处理与分析领域,其中包括用模糊理论来解决分割问题。 基于模糊理论的图像分割方法包括模糊阈值分割方法、模糊聚类分割方法和 模糊连接度分割方法等。 ①模糊阈值技术利用不同的 S 型隶属函数来定义模糊目标,通过优化过程最 后选择一个具有最小不确定性的 S 函数,用该函数表示目标以及属于该目标像素 之间的关系。这样得到的 S 型函数的交叉点为阈值分割需要的阈值,这种方法的 困难在于隶属函数的选择。Cheng H D 等人将模糊测度函数的概念引入最大熵原 则,提出了模糊 C-分类最大熵原则[28]。 ②传统聚类分割技巧的一个问题是仅由两个值 0 和 1 来决定一个象素是否属 于一个聚类, 这就要求两个聚类的边界是十分明确的, 然而实际的情况并非如此, 为解决这一问题,有人提出了模糊集合方法 FCM。FCM 方法是一种迭代最优化 方法, 它是基于计算数据点和聚类中心的距离以决定数据点与每一个聚类的关系。 聚类的中心点根据聚类结果更新。在迭代过程中用客观标准函数来得到最小化聚 类数据点和聚类中心点的距离,并使各聚类中心点间的距离最大化, 从而得到最优 聚类。这种方法计算量大,不具备实时性。模糊 C 均值聚类方法常被用于医学图 像的分割。 ③Udupa J K 等人明确地阐述了如何更加有效地利用模糊理论来解决实际问 题,提出了几点建议,从而提出用模糊连接度的概念刻画对象,认为目标是以某 种凝聚力凝聚在一起而形成物体的[29]。他们提出的方法在医学图像的分割问题中 得到了较好的结果,但此方法需要选择阈值和初始种子点,并且模糊连接度中参 数的选择问题,都值得进一步研究。2.3.6 基于神经网络的方法在 20 世纪 80 年代后期,图像处理、模式识别和计算机视觉的主流领域,受 到人工智能发展的影响,出现了将更高层次的推理机制用于识别系统的做法。这 种思路也开始影响图像分割方法,即基于神经网络模型(ANN)的方法。 神经网络模拟生物特别是人类大脑的学习过程,它由大量并行的节点构成, 每个节点都能执行一些基本的计算。学习过程是通过调整节点之间的连接关系以 及连接的权值来实现。神经网络技术的产生背景也许是为了满足对噪声的鲁棒性 以及实时输出要求的应用场合而提出的,一些研究人员也尝试了利用神经网络技 术来解决图像分割问题。典型方法如:Blanz 和 Gish 利用前向三层网络来解决分 割问题,在该方法中,输入层的各个节点对应了像素的各种属性,输出层结果为 分割的类别数[30]。Babasuchi N 等人则使用了多层网络并且用反向传播方法对网 络进行训练[31],在他们的方法中,输入为图像的灰度直方图,输出为用于阈值分 割的阈值,这种方法的实质是利用神经网络技术来获取用于图像分割的阈值,进26 重庆大学硕士学位论文2 彩色图像分割的研究而进行图像分割。 这些神经网络方法的出发点是将图像分割问题转化为诸如能量最小化、分类 等问题,从而借助神经网络技术来解决问题,其基本思想是用训练样本集对神经 网络模型进行训练以确定节点间的连接和权值,再用训练好的神经网络模型去分 割新的图像数据。这种方法的一个问题是网络的构造问题,这些方法需要大量的 训练样本集,然而收集这些样本在实际应用中是非常困难的。神经网络模型同样 也能用于聚类或形变模型,这时神经网络模型的学习过程是无监督的。由于神经 网络存在巨量的连接,所以很容易引入空间信息。但是使用目前的串行计算机去 模拟神经网络模型的并行操作,计算时间往往达不到要求。2.3.7 基于模型的技术近来相当多的工作都针对基于随机模型的分割技术来展开。若图像的区域被 归结为随机场模型,则分割问题可以归为求统计最优问题。和以往的技术相比, 基于随机模型的技术能够提供更精确的图像区域特征。事实上,各种各样的随机 模型均能够合成同现实世界中自然景物非常相似的彩色纹理。正因为这种特性和 优化公式,使得当图像区域复杂或者通过简单的技术很难划分时,应用基于模型 的技术会得到非常好的分割结果。此技术大部分的方法都是采用类似于 Markov 随机场(MRF,Markov random field)或 Gibbs 随机场等空间交互模型来对图像 建模。 还有一种方法就是 MAP(Maximum a position)方法,此方法一般用来解决存 在噪声情况下的图像的分割问题,并且稳健性比较好。为了提高条件概率模型, 有人提出了一种自适应的 MAP 算法[32]。 当类的均值空间独立并且先验概率分布被忽略时,可采用与 K 均值 (K-means) 相类似的非自适应彩色聚类算法。采用基于最随机模型技术对彩色图像(特别是 对自然景物图像)分割的结果在大部分情况下都非常理想。但是,由于需要大量 的计算,而且算法很复杂,因此需要在计算机复杂度和良好的分割结果之间做一 个平衡。2.3.8 基于物理的技术基于物理模型的技术是在生成彩色矩阵时采用彩色图像信息处理中的底层物 理模型。基于物理的分割方法是从图像的产生过程和人眼视觉系统角度出发,根 据图像中得到的颜色数据获得景物中物体的材料或形状信息进而分割。一般是采 用由双色反射模型(DRM,Dichromatic Reflection Model)空间测量的彩色方差 进行分类,从而实现图像分割。这种技术是在目标的边界处而不是图像中亮和暗 的边缘处来进行分割。 一幅图像的形成总是三方面因素相互的、 复杂的作用过程, 这些因素包括:景色的光学特性、 光源和光传感器。 估计三方面因素对图像的影响27 重庆大学硕士学位论文2 彩色图像分割的研究是图像分析及计算机视觉主要目标之一,人的视觉系统基本能解决这个问题,那 就是颜色恒常性(Color Constancy) 。有人分析了灯光、阴影以及相机特性(比如 彩色剪辑、彩色平衡、彩色镜头失调等)对彩色图像分割的影响[33]。也有人用此 技术来对塑料目标进行分割得到了非常精确的结果[34]。但在 DRM 中存在着一些 严格的假设,比如亮度条件和物体类型。对于大部分的实际场景图像来说,这些 条件都是不具备的。因此,采用 DRM 进行分割处理的算法一般是用在可控的环 境下。 近来也出现了大量的用混和技术进行图像处理的介绍[35,36],这些技术主要是 综合以上各种技术的优点,克服其单独使用时的缺点。一个办法就是首先把彩色 图像分成彩色区域和非彩色区域,然后再结合边缘检测和区域生长等方法实现较 好的图像分割。 这需要把其他彩色空间转换为 HSI 彩色空间。 这主要是由于 HSI 彩 色空间和人的彩色视觉非常相近,区分彩色区域和非彩色区域主要取决于色调和 饱和度。 综上所述,要解决彩色图像分割问题,要处理好以下几个问题: 1. 怎样把每个像素作为整体运用彩色信息。一些灰度图像的分割方法能够直接 应用到彩色空间的每一个分量,再用某种方法将各个分量的结果综合起来得 到最后的分割结果。但是,当把彩色映射到三个分量的时候,彩色信息被分 散的很厉害,以致彩色图像变成了简单的多谱图像,人类能感知的彩色信息 大量丢失。所以如何综合、充分利用图像的彩色信息进行分割非常重要。 2. 进行分割时怎样选择彩色空间的表示形式。因为每个彩色空间都有它的优点 和劣势,没有一个彩色空间超越其它的所有彩色空间适合于分割所有的彩色 图像,因此若想要获得最佳的分割结果必须采用适合于此分割方法的最佳彩 色空间,这一直是众多学者研究的热点。 3. 选择合适的分割算法。分割算法的种类很多,怎样根据分割问题的特点、色 彩空间的选择,确定恰当的分割算法也是一个值得深究的问题。 上述 3 个问题并不是孤立的,也不存在解决的先后次序。在解决具体的分割 问题时,通常是综合考虑三方面的因素,选择合适的色彩空间以及与之相配的, 能够获得较好分割效果的分割算法。 需要指出的是,虽然存在多种多样的彩色图像分割方法,但是迄今为止,不 存在一个可以解决任何分割问题的算法。同时大量实验表明,没有一种分割方法 对所有的颜色特征都是有效的,同样也没有任何一种颜色坐标对所有的分割方法 都有效。所以,根据需要解决分割问题的特点,选择恰当的分割方法和最佳的色 彩空间,设计出有效、可行的针对某类问题的分割算法是解决分割问题的有效途28 重庆大学硕士学位论文2 彩色图像分割的研究径之一。2.4 本章小结由于彩色图像比灰度图像提供更多的信息,以及近年来个人计算机的处理能 力的迅速提高,彩色图像分割受到越来越多的关注。彩色图像大多数都是在灰度 图像分割算法的基础上发展起来的,即利用灰度图像分割算法和不同的彩色空间 对彩色图像进行分割。但是由于彩色图像的信息更加丰富,其分割方法有其特殊 性,其中,有两个方面的因素需要仔细考虑:①选择什么样的彩色空间;②采用 什么样的分割方法。本章分别就这两个问题进行仔细的分析:首先讨论了各种常 用的色彩空间以及它们之间的转换和应用时的特点;然后讨论了 8 类常见的分割 算法的原理,特点,以及在解决分割问题时需要深入分析的要素。最后指出在解 决具体图像分割问题时,要综合分析考虑三方面的因素,即:怎样把每个像素作 为整体运用彩色信息;进行分割时怎样选择彩色空间的表示形式;选择怎样的分 割算法。同时指出,迄今,彩色图像分割还没有一种通用的方法,所有现存的彩 色图像分割的方法都是针对某种情况的专门方法,也就是说,没有一种算法和彩 色空间适应于所有彩色图像。所以,根据需要解决分割问题的特点,选择恰当的 分割方法和最佳的色彩空间,设计出有效、可行的针对某类问题的分割算法是解 决分割问题的有效途径之一。29 重庆大学硕士学位论文3 主分量分析(PCA)技术3 主分量分析(PCA)技术3.1 什么是主分量分析一幅多频带图像(multiband image) 、多光谱图像(multispectral image)或彩 色图像有几个相同尺寸的图像分量,每一图像分量对应一频谱分量。每一个图像 分量都是带有特定频谱的灰度图像,其灰度值表示该像素在这个频带上的亮度。 一个典型的例子就是有三个频带的红( R ) 、绿( G ) 、蓝( B )彩色图像。每幅 图像都有三个频带,对应三幅灰度图像分量。换句话说,彩色图像上的每个像素 都有三个分量值,用三维空间的向量表示。其中,每个频带对应三维空间中的一 个坐标分量。显然,彩色图像的像素在彩色空间形成点簇。 如果我们只拿其中一个频谱分量来进行处理,那么我们将会选择那个带有细 节最多,拥有最大对比度且灰度值分布最广的频谱分量。像素值的最佳延伸方向 可能并不是某个坐标轴方向,而是另一个方向,为了识别这个方向,我们就要对 图像进行主分量分析(principal component analysis)即执行 K-L 变换[37]。(a)( b)图 3.1 主分量变换示意图 Figure 3.1 the illustration of PCA 说明:彩色图像的像素在彩色空间簇状分布。点簇的最佳延伸方向并不平行于任一坐标轴主分量分析(即 K-L 变换)是一个坐标系的变换。变换使得新坐标系三个轴 的方向分别与像素点簇分布的最大延伸方向一致。新坐标系中不同坐标轴上的点 是不相关的,这就是说,由像素的三个分量所构成的三个灰度图像是完全不相关 的。30 重庆大学硕士学位论文3 主分量分析(PCA)技术3.2 主分量分析的原理主分量分析(principal component analysis)即 K-L 变换,也称 Hotelling 变 换。是图像处理中的一种最优正交变换,人们常将它用于统计特征提取[38]。 对于 N ? N 的矩阵 A, 存在 N 个标量 ? k ,k ? 0,1, ? , N ? 1 , 使得 A ? ? k I ? 0 成 立, 这 N 个标量 ? k , 称为矩阵 A 的特征值, 使得 AVk ? ? k Vk 成立的 N 个向量 Vk 的 集合称为 A 的特征向量。 特征向量是 N 维向量, 每个特征向量对应于一个特征值,N 个特征向量构成一组正交基。Hotelling 提出的一种去掉随机向量元素之间相关性的线性变换,既是主分量 方法。之后,Karhunen 和 Loeve 发展了用于连续信号的类似变换。 假定 X 是一个 N ? 1 的随机向量(X 的每一个元素都是一个随机变量) 。X 的 ? 均值向量和协方差矩阵可以由其 L 个样本 xl 估计,即mx ? 1 L ? xl L l ?1C x ? E ( x ? m x )( x ? m x ) T ???1 L x l x lT ? m x m T ? x L l ?1协方差矩阵 C x 是 N ? N 的实对称阵,对角元素是每个随机变量的方差,其它 非对角元素是随机变量间的协方差。因 C x 是是对称阵,总能找到一组标准正交特 征向量。 按对应特征值的大小降序排列 C x 的特征向量, 以其为行元素构成矩阵 R, 定义一个变化: ? y ? R( x ? m x )? ? ? 将任意向量 x 变为 y , 变换生成的向量 y 是一个零均值的随机向量, 其协方差矩阵为C y ? RC x R T由于 R 的列向量是 C x 的特征向量,所以, ??1 ? Cy ? ? ? ? ??2? ? ? ? ? ? ?N ?31 重庆大学硕士学位论文3 主分量分析(PCA)技术? 可见 C y 的非对角线元素全为 0, y 的各元素间是不相关的。因此,该变换消除了 各分量间的相关性。此外, C y 具有和 C x 相同的特征向量,最大特征值对应的特 征向量方向即是像素点簇分布的最大延伸方向,包含有最多的图像信息。3.3 彩色图像如何实现主分量分析为了实现主分量分析,必须先把数据的协方差矩阵对角化。随机实验的自协 方差函数为C (i, j ) ? E ?( xi ( K , l ) ? xi 0 )( x j (k , l ) ? x j 0 )?其中 xi (k , l ) 为像素点 (k , l ) 在 i 频带的值, xi 0 为 i 频带的平均值, x j (k , l ) 为像 素点 (k , l ) 在 j 频带的值, x j 0 为 j 频带的平均值。上述公式也可表示为:C (i, j ) ? 1 N2?? ( x (k , l ) ? xk ?1 l ?1 iNNi0)( x j (k , l ) ? x j 0 )由于图像有 R 、 G 、 B 三个频带,所以变量 i 和 j 只有三种取值,协方差矩阵 为 3 ? 3 矩阵。又由于数据不相关,所以 C 是一个对角化的矩阵,即当 i ? j 时有C (i, j ) ? 0 。 为了达到这个目的,必须用由原数据的协方差矩阵的特征向量构成的变换矩阵对数据进行变换。处理步骤如下: 1) 在彩色空间中找到分布点的均值,记为 ( R0 , G0 , B0 ) 2) 在每个相应的频带上减去平均灰度值。这等价于把 RGB 坐标系的中心移 动至点分布的中心(见图 3.1 中的坐标值 R ?G ?B ? ) 。 3) 算出分布的自相关矩阵 C (i, j ) (其中, i 和 j 的值为 R 、 G 、 B ) 。 4) 找出矩阵 C (i, j ) 的特征值并降序排列。用相应的特征向量作为行,得到 特征向量矩阵 A。 ?R? ? P1 ? ? ? ? ? ? ? 5) 用矩阵 A 变换原分布。用 y ? Ax 把三维向量 x ? ? G ? 变换为 y ? ? P2 ? , ?B? ?P ? ? ? ? 3? 即 y k ? ?i a ki xi 。 这是一个线性变换。新的“颜色”是由原来三种颜色亮度值的线性组合,所 以第一个主分量包含图像的大部分信息。32 重庆大学硕士学位论文3 主分量分析(PCA)技术3.4 使用主分量变换表示图像的优缺点3.4.1 优点使用主分量来表示图像的优点有以下两个方面: 1) 使用一定的比特数,每一个频带传输的信息是最大的,因为频带是不相 关的,而且一个频带的信息不能通过其他频带预测得到。 2) 如果采用单色图像,可以只取第一主分量,这样不但能保证图像有最大 的对比度,而且能保证用单个频带能传输最可能多的信息。 图 3.2(见后页)显示了一个主分量分析的例子。虽然初看起来,图 3.2(e) 并没有什么特殊的地方,但是通过仔细观察,我们会发现第一主分量图像结合了 R、G、B 三个频带的最好特征:比如:图 3.2(b)中左上角的绿色山地的对比度 高于图 3.2(c)和图 3.2(d) ;图 3.2(d)中右下角的草地的对比度要高于 3.2(b) 和 3.2(c)的;而在图 3.2(e)中,上述两个地方都有很好的对比度。在图 3.2 (b) 、 (c)和(d)中间的灰色空地和周围建筑对比度极小,但在 3.2(e)中,该 区域存在明显对比。3.4.2 缺点主分量分析的缺点是: 由主分量分析构成的频带,其上的灰度值没有物理意义,他们并不代表任何 自然的颜色。由此,不能简单地用像素的灰度值来对像素进行分类。这个性质在 根据象素灰度值进行分类的遥感应用中,表现的相当准确。例如,在一个主分量 频带中,代表水的像素可能会比图像中代表其他内容的像素更暗或更亮,这个性 质在不同的光谱频带中具有一致性。3.5 本章小结彩色图像的像素在彩色空间簇状分布,而像素值的最佳延伸方向通常不是坐 标轴的方向。为了识别像素值的最佳延伸方向,就要对图像进行主分量分析,即 执行 K-L 变换。进行主分量分析后,就能够得到对应数据的一组特征向量,其中 对应最大特征值的特征向量方向上分布了图像的绝大部分信息。对于这一点,在 文章中我们给出了详细的图像说明。对于如何进行主分量分析变换,论文也给出 了详尽的说明。最后我们总结了主分量分析用于表示图像的优缺点。这章的知识 为我们后来把主分量技术运用于彩色图像分割奠定了理论基础。33 重庆大学硕士学位论文3 主分量分析(PCA)技术(a)原图像(b)红分量(c)绿分量(d)蓝分量(e)第一主分量34 重庆大学硕士学位论文3 主分量分析(PCA)技术(f) 第二分量(g)第三分量 图 3.2 一幅彩色图像的主分量分析 Figure 3.2 principal component analysis of a color image35 重庆大学硕士学位论文4 模糊C-均值聚类算法4 模糊 C-均值聚类算法4.1 聚类分析聚类分析按照某个相似测试将未标记的样本集分成若干个类,使同一类中的 样本尽可能地相似,不同类中的样本尽可能地不相似。确定数据集中样本相似性 的常用方法是欧式距离。按照聚类结果表现方式的不同,现有的聚类分析算法可 以分为:硬聚类算法、模糊聚类算法和可能性聚类算法[39]。 1. 在硬聚类算法中,分类结果用样本对各类的隶属度表示。样本对某个类别的 隶属度只能是 0 或 1。 样本对某个类别的隶属度为 1 表示样本属于该类; 样本 对某个类别的隶属度为 0 则表示样本不属于该类。样本只能属于所有类别中 的某一个类别。早期的聚类算法都是硬聚类算法。传统的硬聚类算法包括:C -均值、ISODATA、FORGY、WISH 等。硬聚类方法具有花费时间少的优点, 缺点是:硬聚类割断了样本与样本之间的联系,无法表达样本在性态和类属 方面的中介性,使得所得的聚类结果偏差较大,并且容易陷入局部最优解。 2. 在模糊聚类算法中,分类结果仍旧用样本对各类的隶属度表示,只是样本对 某个类别的隶属度在区间[0,l ]内取值,样本对所有类别的隶属度之和为 1。模糊聚类产生于六十年代末,是聚类分析与模糊集理论相结合的产物。模 糊聚类估计到了样本与样本之间的联系,认为每一个样本与聚类中心都有一 个隶属关系。模糊聚类能够有效地对类与类之间有交叉的数据集进行聚类, 所得的聚类结果明显要优于硬聚类,能更加客观和准确地反应现实世界的实 际情况。同与硬聚类算法相比,提高了算法的寻优概率,但模糊聚类的速度 要比硬聚类慢。 3. 可能性聚类算法中,分类结果以样本对各类的典型程度表示。样本对某个类 别的典型程度在区间[0,1]内取值。可能性聚类算法是聚类分析与可能性 理论的结晶。 第一个可能性聚类算法是 R. Krishnapuram 和 JM. Keller 在 1993 年提出的。可能性聚类不仅顾及到每个样本与各个聚类中心的隶属关系,而 且考虑到样本的典型性对分类结果的影响,能够对含有噪声的数据集进行聚 类,抑制噪声能力很强。研究表明:可能性聚类与传统的鲁棒性统计理论有 密切的关系。可能性聚类对初始化非常敏感,需要借助其他方法(如模糊聚 类技术)对数据集进行预处理。但是可能性聚类算法也容易陷入局部极值。 聚类分析己经在模式识别的应用中取得丰硕成果,并在图像处理、计算机视 觉、模糊控制等相关领域的应用中取得长足进展。在模式识别中,聚类分析被应 用于语音识别、字符识别、雷达信号识别,文本识别等方面。在图像处理中,聚36 重庆大学硕士学位论文4 模糊C-均值聚类算法类分析方法被应用于灰度图像的分割、彩色图像的分割、纹理图像的分割、图像 边缘的检测、图像增强、恢复与压缩等方面。在计算机视觉中,聚类分析被应用 于物体边界的检测与曲线拟合。聚类分析方法还被应用于机器自动化和工具状态 检测。在模糊控制中,聚类分析方法主要用于控制规则的提取,系统建模。此外, 聚类分析还被应用于其他多个领域,如:用聚类方法进行气候分类、食品检验和 水质分析。 聚类分析的研究方向主要有三个:基于模糊关系的聚类算法研究(包括聚合 法和分裂法) 、目标函数聚类算法研究和聚类神经网络的研究。其中,基于目标函 数的聚类方法己成为聚类分析的主流。这一方面是由于将聚类问题表述成优化问 题易于与经典数学的非线性规划领域联系起来,可用现代数学方法来求解。另一 方面是由于算法的求解过程比较容易用计算机来实现。围绕着目标函数的优化问 题,目前主要形成三大方向:①一是建立合适的目标函数表达式,用数学规划方 法求解最优值,如硬 c-均值聚类算法,模糊 c-均值聚类算法及其推广形式,可 能性 C-均值聚类算法及其推广形式等。 这类方法的主要缺陷是对初始化较敏感, 易于陷入局部极小点,收敛速度较慢;②二是将传统的聚类技术与神经网络相结 合,借助神经网络的并行实现以提高算法的收敛速度。目前,针对硬聚类已提出 Kohonen 聚类神经网络等,针对模糊聚类己提出模糊 Kohonen 聚类神经网络等; ③三是将传统的聚类技术与现代优化方法相结合,以克服算法对初始化敏感,易 于陷入局部极小点的问题。如与模拟退火算法结合,与遗传算法结合,与进化策 略结合。4.2 基于目标函数的聚类方法[40]4.2.1 什么是基于目标函数的聚类方法?模糊聚类问题可以用数学语言描述为:把一组给定的模式 O ? ?o1 , o2 , ?, on ? 划 分为 c 个模糊子集(聚类) S1 , S2 ,?, Sc 。如果用 u jq (1? j ? c,1? q ? n) 表示模式 o q 隶属 于模糊子集 S j 的程度, 那么就得到了这组模式的模糊 c 划分 U ??ujq | 1? j ? c,1? q ? n?。 完成这样一组无类别标记模式集模糊划分的操作就是模糊聚类分析。为了获得有 意义的分类,需要定义划分的准则,如相似性或相异性准则 D (?) 等。假定每个模 糊子集 S j (1 ? j ? c) 都有一个典型模式 p j , 常被称作聚类原型, 这样任一模式 o q 与 模糊子集 S j 的相似性可以通过模式 o q 与聚类原型 p j 间的失真度 d jq ? D(o q , p j )37 重庆大学硕士学位论文4 模糊C-均值

我要回帖

更多关于 jquery 修改image src 的文章

 

随机推荐