中国科学院机构知识库网格
Chinese Academy of Sciences Institutional Repositories Grid
图像分类及其在毒品图像过滤中的应用

文献类型:学位论文

作者谢年华
学位类别工学博士
答辩日期2011-05-27
授予单位中国科学院研究生院
授予地点中国科学院自动化研究所
导师胡卫明 ; 凌海滨
关键词图像分类 图像识别 毒品图像过滤 大麻图像过滤 不良信息检测 Image Category Classification image recognition drug image filtering cannabis image filtering harmful information filtering
其他题名Image Category Classification and Its Application to Cannabis Image Filtering
学位专业计算机应用技术
中文摘要图像分类技术是模式识别领域的一个重要研究方向。而毒品图像过滤则可以看作一种特殊的图像分类技术。通用的图像分类技术对建立快速有效的信息检索和管理系统有着重要的意义,而毒品图像过滤技术则可以自动地过滤互联网上的毒品信息,净化互联网环境,保证互联网的信息安全。 通用的图像分类技术是毒品图像识别与过滤技术的基础,而专用的毒品图像过滤技术的研究又可以给通用的图像分类技术提供很好的借鉴和参考。二者之间具有十分紧密的联系。因此,本文主要围绕图像分类技术及毒品图像过滤技术展开研究,主要工作包括: 1. 提出了一种基于比例的直方图距离测度。传统的直方图距离测度都是基于直方图bin与bin之间的差值进行计算的。我们认为,描述同一个物体的两个直方图在不同bin的比例关系上具有较高的相似度,可以对部分匹配有较好的鲁棒性。因此,该算法利用了直方图内部的共生比例信息,通过衡量不同直方图内部的比例信息来计算直方图相似度。算法对图像分类中的部分匹配问题较为鲁棒,适用于图像分类中背景噪声较大的情况。 2. 提出了一种显著性驱动(Saliency-driven)的非线性扩散滤波(Non-linear Diffusion Filtering)。算法将显著性检测技术与非线性扩散滤波技术结合,产生图像的非线性尺度空间。在这个尺度空间中,非线性扩散可以保留甚至增强某些较为显著的图像结构,例如线条、边缘等。而显著性技术可以估计前景图像和背景图像区域。我们将图像的显著性作为图像中梯度的权重,据此可以把非线性扩散滤波和显著性结合起来。在非线性扩散滤波过程中,显著性区域的图像梯度将会被增强,而不显著区域的图像梯度将会减弱。由此,当尺度增加时,不显著区域信息将会逐步的淡出而显著区域的信息将会被保留,甚至一些重要图像结构,例如线条,边缘等将会被增强。接下来,一幅图像就可以被表达为它的尺度空间中不同尺度的图像集合。进而通过多尺度信息融合框架,可以较为有效地提升图像分类的性能。 3. 针对三类大麻图像的不同特点,分别提出了三种大麻毒品图像过滤算法。对于大麻植物图像,我们在Adaboost分类框架下提出了一种新的基于自相似性的弱分类器;对于大麻烟叶图像,我们采用SIFT特征及改进的词包模型进行识别;针对吸毒工具图像的特点,我们采用金字塔梯度直方图特征与SVM分类器,取得了较好的效果。 4. 提出了一种图像集分类方法并用于大麻网站的识别与过滤。将网站看作图像的集合,我们将大麻网站过滤问题抽象为图像集分类问题。由于网站中存在的大量的图像样本,我们采用集合核(Set Kernel)对不同的图像集之间计算相似度,可以大大简化计算复杂度。接着,我们从两方面进一步提高了此核:第一,考虑到不同的视觉单词的区分能力是不同的,我们以不同视觉单词单独的分类错误率为依据给每个视觉单词一个权重。第二,通过指数核与此核的结合使得最终的核具有分类非线性样本的能力。我们将我们提出的方法应用于毒品网站分类任务中。在这个任务中,我们搜集了一个包含600个网站共计200,000图像的图像集数据库。在实验中,我们将我们提出的方法与不同的最新方法进行了比较...
英文摘要Image category classification is an active and important research area in pattern recognition. Cannabis image filtering can be treated as a special case of image category classification. Image category classification is of significance to information retrieval and management. Similarly, cannabis image filtering is of great importance for the proper development of Web culture. Image category classification is the base of cannabis image filtering, meanwhile cannabis image filtering can be a good reference for image category classification. There exists very close relationship between image category classification and cannabis image filtering. Therefore, in this thesis, we focus on the image category classification and its application to cannabis image filtering. The main contributions of this thesis are summarized as follows: 1. A new histogram dissimilarity based on ratios of bins is proposed. Traditional histogram dissimilarities are all based on the differences between bins in histogram. We believe that the ratios between bins within a histogram represent the intra co-occurrence information of this histogram, which is robust to partial matching. Therefore, our algorithm uses this intra ratio information to measure the dissimilarity between different histograms. Our new histogram dissimilarity is robust to partial matching and large background noise. 2. A saliency-driven non-linear diffusion filtering is proposed. Our algorithm, which combines the saliency detection and non-linear diffusion filtering, can be used to generate the non-linear scale space. In the scale space, a non-linear diffusion can preserve or even enhance the semantically important image structures such as edges, lines, etc. Saliency techniques can estimate the foreground and background image areas. We integrate a saliency map with the non-linear diffusion by using the saliency map as the weights of image gradients. During the diffusion progress, the image gradients in salient regions are increased while those in non-salient regions decreased. Accordingly, when the scale increases, the background information gradually fades out while the foreground information is preserved and some important structures in foreground are enhanced. Then an image can be represented by its multi-scale images. Finally, a multi-scale information fusion framework can be used to improve the system performance. 3. Three algorithms are proposed for cannabis image filtering based on the different characteris...
语种中文
其他标识符200818014629095
源URL[http://ir.ia.ac.cn/handle/173211/6352]  
专题毕业生_博士学位论文
推荐引用方式
GB/T 7714
谢年华. 图像分类及其在毒品图像过滤中的应用[D]. 中国科学院自动化研究所. 中国科学院研究生院. 2011.

入库方式: OAI收割

来源:自动化研究所

浏览0
下载0
收藏0
其他版本

除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。