Efficient Graph

Stella981
• 阅读 855

转自:https://blog.csdn.net/ttransposition/article/details/38024557#commentBox



图像分割—基于图的图像分割(Graph-Based Image Segmentation)

Reference:

Efficient Graph-Based Image Segmentation,IJCV 2004,MIT Code

图像分割—基于图的图像分割(OpenCV源码注解)

       最后一个暑假了,不打算开疆辟土了,战略中心转移到品味经典,计划把图像分割和目标追踪的经典算法都看一看,再记些笔记。

       Graph-Based Segmentation 是经典的图像分割算法,作者Felzenszwalb也是提出DPM算法的大牛。该算法是基于图的贪心聚类算法,实现简单,速度比较快,精度也还行。不过,目前直接用它做分割的应该比较少,毕竟是99年的跨世纪元老,但是很多算法用它作垫脚石,比如Object Propose的开山之作《Segmentation as Selective Search for Object Recognition》就用它来产生过分割(oversegmentation)。还有的语义分割(senmatic segmentation )算法用它来产生超像素(superpixels)具体忘记了……

图的基本概念

因为该算法是将照片用加权图抽象化表示,所以补充图的一些基本概念。

是由顶点Efficient Graph(vertices)和Efficient Graph(edges)组成,表示为Efficient Graph,顶点Efficient Graph,在本文中即为单个的像素点,连接一对顶点的边Efficient Graph具有权重Efficient Graph,本文中的意义为顶点之间的相似度,所用的是无向图

Efficient Graph

树:特殊的图,图中任意两个顶点,都有路径相连接,但是没有回路。如上图中加粗的边所连接而成的图。如果看成一团乱连的珠子,只保留树中的珠子和连线,那么随便选个珠子,都能把这棵树中所有的珠子都提起来。如果,i和h这条边也保留下来,那么顶点h,i,c,f,g就构成了一个回路。

最小生成树(MST, minimum spanning tree):特殊的树,给定需要连接的顶点,选择边权之和最小的树。上图即是一棵MST

Efficient Graph

本文中,初始化时每一个像素点都是一个顶点,然后逐渐合并得到一个区域,确切地说是连接这个区域中的像素点的一个MST。如图,棕色圆圈为顶点,线段为边,合并棕色顶点所生成的MST,对应的就是一个分割区域。分割后的结果其实就是森林。

 

相似性

既然是聚类算法,那应该依据何种规则判定何时该合二为一,何时该继续划清界限呢?

对于孤立的两个像素点,所不同的是颜色,自然就用颜色的距离来衡量两点的相似性,本文中是使用RGB的距离,即Efficient Graph

当然也可以用perceptually uniform的Luv或者Lab色彩空间,对于灰度图像就只能使用亮度值了,此外,还可以先使用纹理特征滤波,再计算距离,比如,先做Census Transform再计算Hamming distance距离。

全局阈值à自适应阈值

上面提到应该用亮度值之差来衡量两个像素点之间的差异性。对于两个区域(子图)或者一个区域和一个像素点的相似性,最简单的方法即只考虑连接二者的边的不相似度。

Efficient Graph

如图,已经形成了棕色和绿色两个区域,现在通过紫色边来判断这两个区域是否合并。那么我们就可以设定一个阈值,当两个像素之间的差异(即不相似度)小于该值时,合二为一。迭代合并,最终就会合并成一个个区域,效果类似于区域生长:星星之火,可以燎原。

Efficient GraphEfficient Graph

显然,上面这张图应该聚成右图所思的3类,高频区h,斜坡区s,平坦区p。如果我们设置一个全局阈值,那么如果h区要合并成一块的话,那么该阈值要选很大,但是那样就会把p和s区域也包含进来,分割结果太粗。如果以p为参考,那么阈值应该选特别小的值,那样的话,p区是会合并成一块,但是,h区就会合并成特别特别多的小块,如同一面支离破碎的镜子,分割结果太细

显然,全局阈值并不合适,那么自然就得用自适应阈值。对于p区该阈值要特别小,s区稍大,h区巨大。

对于两个区域(原文中叫Component,实质上是一个MST,单独的一个像素点也可以看成一个区域),本文使用了非常直观,但抗干扰性并不强的方法。先来两个定义,原文依据这两个附加信息来得到自适应阈值。

一个区域的类内差异Efficient Graph

Efficient Graph

可以近似理解为一个区域内部最大的亮度差异值,定义是MST中不相似度最大的一条边。

两个区域的类间差异Efficient Graph

Efficient Graph

即连接两个区域所有边中,不相似度最小的边的不相似度,也就是两个区域最相似的地方的不相似度。

那么直观的判断是否合并的标准:

Efficient Graph

等价条件

Efficient Graph

    解释: Efficient GraphEfficient Graph分别是区域Efficient GraphEfficient Graph所能忍受的最大差异,当二者都能忍受当前差异Efficient Graph时,你情我愿,一拍即合,只要有一方不愿意,就不能强求。

    特殊情况,当二者都是孤立的像素值时,Efficient Graph,所有像素都是"零容忍"只有像素值完全一样才能合并,自然会导致过分割。所以刚开始的时候,应该给每个像素点设定一个可以容忍的范围,当生长到一定程度时,就应该去掉该初始容忍值的作用。原文条件如下

Efficient Graph    增加项Efficient Graph:

Efficient Graph

其中Efficient Graph为区域Efficient Graph所包含的像素点的个数,如此,随着区域逐渐扩大,这一项的作用就越来越小,最后几乎可以忽略不计。那么Efficient Graph就是一个可以控制所形成的的区域的大小,如果,Efficient Graph那么,几乎每个像素都成为了一个独立的区域,如果Efficient Graph,显然整张图片都会聚成一块。所以,Efficient Graph越大,分割后的图片也就越大。

当然,可以采用中位数来应对超调,不过这就变成了一个NP难问题,证明见原文

形状相似

前面提到的用颜色信息来聚类,修改相似性衡量标准,可以聚类成我们想要的特定形状。比如我们希望得到很多长条形的区域,那么可以用聚类后的所形成的区域的面积/周长 + 亮度值的差 衡量两个子图或者两个像素之间的相似度。因为长条形的面积/周长会比较小。

算法步骤

Step 1: 计算每一个像素点与其8邻域或4邻域的不相似度。

Efficient Graph

如左边所示,实线为只计算4领域,加上虚线就是计算8邻域,由于是无向图,按照从左到右,从上到下的顺序计算的话,只需要计算右图中灰色的线即可。

Step 2:按照不相似度non-decreasing排列(从小到大排序得到Efficient Graph

Step 3: 选择Efficient Graph

Step 4: 对当前选择的边Efficient Graph进行合并判断。设其所连接的顶点为Efficient Graph。如果满足合并条件:

(1)Efficient Graph不属于同一个区域Efficient Graph

(2)不相似度不大于二者内部的不相似度。Efficient Graph则执行Step 5。否则执行Step 6

Step 5: 更新阈值以及类标号。

更新类标号:将Efficient Graph的类标号统一为Efficient Graph的标号。

更新该类的不相似度阈值为:Efficient Graph

注意:由于不相似度小的边先合并,所以,Efficient Graph即为当前合并后的区域的最大的边,即Efficient Graph

Step 6: 如果Efficient Graph,则按照排好的顺序,选择下一条边转到Step 4,否则结束。

结果

Efficient Graph

Efficient GraphEfficient Graph

Segmentation parameters: sigma = 0.5, k= 500, min = 50.

Sigma先对原图像进行高斯滤波去噪,sigma即为高斯核的Efficient Graph

k: 控制合并后的区域的大小,见前文

min: 后处理参数,分割后会有很多小区域,当区域Efficient Graph像素点的个数Efficient Graph小于min时,选择与其差异最小的区域Efficient Graph合并即Efficient Graph

性质讨论

结果虽然不是很好,但有很好的全局性质,结论很有意思,有兴趣的可以看看。

首先要说明的是,对于任何图像,始终存在一种分割方法,使得分割的结果既不过细,也不过粗。但是并不唯一

引理

如果step 4 时,Efficient Graph,但并没有合并,即Efficient Graph,那么肯定有一个区域已经分割好了,比如Efficient Graph,那么区域Efficient Graph的范围就不会再有增加,它将会成为最终的分割区域中的一个区域。

Proof:

假设,Efficient Graph,由于边是按照non-decreasing排序,所以剩下的连接Efficient Graph的边的不相似度肯定都不低于Efficient Graph,最小的边都不行,其余的边自然是靠边站了。

不过,原文说只能只有一个已经分割好了,但是我觉得还有一种情况,Efficient Graph 并且Efficient Graph,那么这两个区都应该分好了才对呀。

Not Too fine

分割太细,也就是本来不应该分开的区域被拦腰截断,但是本算法是能保证有情人终成眷属的,绝对不会干棒打鸳鸯拆散一对是一对的事。

Proof:

Efficient Graph

反证法:如上图。本不应该分割,则应该满足条件Efficient Graph。如果分开了,那么必定存在一条边Efficient Graph导致二者没有合并,那么由前面的引理,必定存在一个区域成为最终分割结果的一部分,假设为A部分,再回溯到判断这条边的时候,必定有,Efficient Graph,从而Efficient Graph,由于是按non-decreasing 顺序,所以A部分和B部分最小的边就是Efficient Graph,那么Efficient Graph与假设条件矛盾。

Not Too coarse

分割太粗,也就是本应该分开的区域没有分开。但本算法能保证当断则断,不会藕断丝连。

反证法:如上图。本应该分割,则应满足条件Efficient Graph。假设还是Efficient GraphEfficient Graph为连接A,B最小的边。如果合并了,由于Efficient Graph,而且是non-decreasing 顺序,所以在判定边Efficient Graph之前A区域已经形成。如果分割过粗,则判定这条边时最小的边满足Efficient Graph,则必定Efficient Graph使得二者合并了。和条件矛盾。

等权边处理先后次序的影响

如果两条边Efficient GraphEfficient Graph的权值相同,那么排序时候,谁排前头,谁落后面有影响吗?结论是木有。

Proof:

Case1Efficient GraphEfficient Graph连接的区域相同,即Efficient GraphEfficient Graph连接的都是区域Efficient Graph,那么它俩谁在前面都没关系。

Case2Efficient GraphEfficient Graph连接的区域完全不同,比如Efficient Graph连接区域,Efficient GraphEfficient Graph连接区域Efficient Graph,那么谁先谁后,都不影响Efficient Graph是否合并,也不影响Efficient Graph是否合并。

Case3Efficient Graph连接Efficient Graph,Efficient Graph连接Efficient Graph

Case3-1:Efficient Graph在先,Efficient Graph在后,并且,Efficient Graph使得Efficient Graph合并,交换二者处理顺序,先处理Efficient Graph,后处理Efficient Graph。如果Efficient Graph不合并Efficient Graph,那不影响Efficient Graph合并Efficient Graph;如果Efficient Graph合并Efficient Graph,那么合并后的Efficient Graph,照样合并。

Case3-2:Efficient Graph在先,Efficient Graph在后,并且,Efficient Graph不合并Efficient Graph,交换二者处理顺序,先处理Efficient Graph,后处理Efficient Graph。如果是Efficient Graph。那Efficient Graph是否合并Efficient Graph,都不会使得Efficient Graph合并;如果Efficient Graph,那同样也有Efficient Graph,同样也没影响。

补充:

彩色图片

对于彩色图片,上文是将R,G,B作为距离,整张图片只进行一次分割,原文说对每一个通道都进行一次分割,最后对结果取交集,也就是说图片中的两个点要划分到同一个区域,则在R,G,B三个通道的划分结果中,它俩得始终在同一个区域。原文说这样效果更好……不过他的程序是采用一次分割。

Nearest Neighbor Graphs

前文是只用了空间位置Efficient Graph来构件图的连接关系,缺点是明显的,空间不相邻,色彩完全一样也白搭,于是中间稍微有断开都会分成多个部分。于是另一种更为平等的策略是二者一块考虑,先映射到特征空间Efficient Graph,再构建图。此时有连接关系的就不一定是4/8邻域了,由于有Efficient Graph对边,因此如果考虑所有边的连接关系的话,太恐怖了!原文是对每个像素点找10个欧氏距离最近的点即10最近邻,构建图,当然,另外一种方法不是固定邻居数目,而是限定距离范围。

Efficient Graph


那么类内距离Efficient Graph的解释就和直观了,类内最短的距离,那么会以这条边为半径,在特征空间构成一个超球体,不过会和别人有相交。

Efficient Graph同样还是两个类直接的最短距离。

找10-NN太累,原文采用近似算法ANN《Approximate nearest neighbor searching》来找10近邻,快。

剩下的和上面一样,但是有一点我没明白,就是Efficient Graph的更新,比如上图,肯定是用绿色这条线更新,那么Efficient Graph的意义就不再是包含集合所有点的最短半径了,求解?

结果如下:可以看到被栏杆分开的草地也连在一块了,下面的花朵也属于同一个类别

                                         Efficient Graph


Efficient Graph

图像分割—基于图的图像分割(OpenCV源码注解)


点赞
收藏
评论区
推荐文章
blmius blmius
3年前
MySQL:[Err] 1292 - Incorrect datetime value: ‘0000-00-00 00:00:00‘ for column ‘CREATE_TIME‘ at row 1
文章目录问题用navicat导入数据时,报错:原因这是因为当前的MySQL不支持datetime为0的情况。解决修改sql\mode:sql\mode:SQLMode定义了MySQL应支持的SQL语法、数据校验等,这样可以更容易地在不同的环境中使用MySQL。全局s
Easter79 Easter79
3年前
swap空间的增减方法
(1)增大swap空间去激活swap交换区:swapoff v /dev/vg00/lvswap扩展交换lv:lvextend L 10G /dev/vg00/lvswap重新生成swap交换区:mkswap /dev/vg00/lvswap激活新生成的交换区:swapon v /dev/vg00/lvswap
皕杰报表之UUID
​在我们用皕杰报表工具设计填报报表时,如何在新增行里自动增加id呢?能新增整数排序id吗?目前可以在新增行里自动增加id,但只能用uuid函数增加UUID编码,不能新增整数排序id。uuid函数说明:获取一个UUID,可以在填报表中用来创建数据ID语法:uuid()或uuid(sep)参数说明:sep布尔值,生成的uuid中是否包含分隔符'',缺省为
待兔 待兔
4个月前
手写Java HashMap源码
HashMap的使用教程HashMap的使用教程HashMap的使用教程HashMap的使用教程HashMap的使用教程22
Jacquelyn38 Jacquelyn38
3年前
2020年前端实用代码段,为你的工作保驾护航
有空的时候,自己总结了几个代码段,在开发中也经常使用,谢谢。1、使用解构获取json数据let jsonData  id: 1,status: "OK",data: 'a', 'b';let  id, status, data: number   jsonData;console.log(id, status, number )
Wesley13 Wesley13
3年前
Java获得今日零时零分零秒的时间(Date型)
publicDatezeroTime()throwsParseException{    DatetimenewDate();    SimpleDateFormatsimpnewSimpleDateFormat("yyyyMMdd00:00:00");    SimpleDateFormatsimp2newS
Wesley13 Wesley13
3年前
mysql设置时区
mysql设置时区mysql\_query("SETtime\_zone'8:00'")ordie('时区设置失败,请联系管理员!');中国在东8区所以加8方法二:selectcount(user\_id)asdevice,CONVERT\_TZ(FROM\_UNIXTIME(reg\_time),'08:00','0
Wesley13 Wesley13
3年前
00:Java简单了解
浅谈Java之概述Java是SUN(StanfordUniversityNetwork),斯坦福大学网络公司)1995年推出的一门高级编程语言。Java是一种面向Internet的编程语言。随着Java技术在web方面的不断成熟,已经成为Web应用程序的首选开发语言。Java是简单易学,完全面向对象,安全可靠,与平台无关的编程语言。
Stella981 Stella981
3年前
Django中Admin中的一些参数配置
设置在列表中显示的字段,id为django模型默认的主键list_display('id','name','sex','profession','email','qq','phone','status','create_time')设置在列表可编辑字段list_editable
Wesley13 Wesley13
3年前
MySQL部分从库上面因为大量的临时表tmp_table造成慢查询
背景描述Time:20190124T00:08:14.70572408:00User@Host:@Id:Schema:sentrymetaLast_errno:0Killed:0Query_time:0.315758Lock_
Python进阶者 Python进阶者
10个月前
Excel中这日期老是出来00:00:00,怎么用Pandas把这个去除
大家好,我是皮皮。一、前言前几天在Python白银交流群【上海新年人】问了一个Pandas数据筛选的问题。问题如下:这日期老是出来00:00:00,怎么把这个去除。二、实现过程后来【论草莓如何成为冻干莓】给了一个思路和代码如下:pd.toexcel之前把这