大学生创新创业训练计划项目中期进展报告 - 大学生创新创业管理与.doc
《大学生创新创业训练计划项目中期进展报告 - 大学生创新创业管理与.doc》由会员分享,可在线阅读,更多相关《大学生创新创业训练计划项目中期进展报告 - 大学生创新创业管理与.doc(28页珍藏版)》请在三一文库上搜索。
1、大学生创新创业结题报告项目名称:基于C#的图像内容检索技术研究应用项目成员:万深展、王昊阳、杨玉鹏、吴莹怡、张洁、沈沁清 指导教师:胡春燕摘 要随着多媒体技术及Internet网络的迅速发展,大容量存储设备和数字化设备的出现和广泛应用,图像、视频数据呈现几何技术的增长趋势,于是出现了大容量的图像/视频数据库。一般的文字搜索引擎已经不能满足用户需求。如何高效、快速地从图像资源中获取有用的图像成了信息检索技术研究的热点。通过本次设计,熟悉C#的图像处理及图像的信息存储形式。创建基本的图像数据库,实现数据库中图像数据的读取,设计相关关键子,生成相关特征图,实现基于内容的检索检索和基于语义字段的检索。
2、本文第一章介绍了图像内容检索技术的概述,图像内容检索技术的应用领域以及图像内容检索技术的发展趋势。第二章主要介绍了主题框架,系统流程分析,系统功能模块分析和系统主界面设计。在第三章,具体介绍了图像内容检索技术程序算法上的具体说明。分别有图像熵、颜色直方图、灰度平均值、上确届距离、加权距离和不变矩阵。在附录中,介绍了程序的使用流程,主程序源代码。本文通过学习基于内容的图像检索技术,阐述了系统设计和数据测试的插图,边阐述理论,边演示系统,边进行探索,使研究过程具体而又直观。目 录摘 要 第1章 绪 论31.1 图像内容检索技术概述31.2 图像内容检索技术的发展趋势7第2章 系统分析102.1 需
3、求分析102.1.1功能需求102.1.2性能需求102.2 系统框架102.2.1系统流程分析112.2.2系统功能模块分析132.2.3系统主界面设计142.3 系统配置16第3章 系统设计与实现173.1图像内容检索的算法173.1.1图像熵173.1.2颜色直方图法193.1.3灰度平均值213.1.4上确届距离223.1.5加权距离243.1.6不变矩阵26第1章 绪 论1.1 图像内容检索技术概述近二十年来,计算机应用及制造技术取得了日新月异的进展,融入到各个技术领域。人类正在步入一个技术迅猛发展的新时代。这个新时代的一个重要标志就是计算机在信息处理领域的广泛应用。在日常的生活和工
4、作中,存在着大量的图像处理问题,大部分图像存储在我们的计算机中,导致需要找的时候会有一点困难。因此,随着计算机技术的推广应用,人与计算机的交道越多,基于内容的图像检索技术进入计算机的要求就越迫切。我们之前搜索信息主要是利用文本搜索,当今这种技术已经相当成熟,但是这种方法有很大的局限性。图像内容检索技术不同于传统的检索手段,它是利用图像的颜色,形状,纹理,对象的空间关系等基本特征进行检索,并把这些量化特征与图像存储在一起。其特点是:直接从媒体内容中提取信息线索;基于内容的检索是一种近似匹配;特征提取和索引建立常需要用人机交互的方法,学习人的主观相似度感受。它主要使用的是基于相似度量的示例查询方法
5、。基于内容的图像检索可以突破很多限制,给人们的获取信息带来更大的方便,相比传统的文本检索有很大的优势。图像检索虽然有巨大的应用潜力,但是目前的技术还不够成熟,依然有很大的提升空间,这也吸引了很多科研工作者进行研究与探索。图像检索的本质是对图像特征的提取与基于特征的匹配技术,图像的特征包括图像的文本特征、视觉特征,所谓图像的文本特征是指与图像相关的文本信息,比如图像的名称、对图像的注解文字等,而目前比较成熟应用于网络环境下的图像检索系统比如Google、百度等均属于这类。图像的视觉特征是指图像本身所拥有的视觉信息,又可以进一步分为通用的视觉特征和领域特征,如颜色、纹理、形状等属于图像通用特征,而
6、光谱特征则属于地理科学中遥感影像独有的特征。图像特征提取分为两类:1.低层视觉,其内容主要包括颜色、形状、纹理等;2.语义内容,它包含高层的概念级反应(如“海上升明月”),需要对物体进行识别和解释,往往要借助人类的知识推理。由于目前计算机视觉和图像理解的发展水平所限,使得CBIR还无法真正支持基于语义的图像检索,所以目前研究得较多也比较成熟的检索算法大部分是基于图像的低层特征的,即利用图像的颜色、纹理、形状等特征来检索。2提取后的图像特征数据需要经过索引、降维等处理。首先,图像由特征向量表示,而这些特征向量一般都是高维向量, 在庞大的图像数据库中,对高维向量进行顺序比较的过程是相当费时的。在实
7、际应用过程中, 为了让基于CBIR的图像检索系统能够真正适合大型的图像数据库, 提高检索效率,尽可能减少查询时的特征矢量比较时间,往往将降维技术和多维索引技术结合起来。从发展演变历程来看,根据图像检索系统所提取图像特征可分为两类,第一类即基于图像文本特征的检索,TBIR,第二类即基于图像视觉特征的内容检索,CBIR。传统的TBIR技术应用于早期的图像检索,其研究主要在数据库领域中进行,首先对图像用文本进行手工注解,然后用基于文本的数据库管理系统进行检索。这种方法实现容易被广泛应用,但是它依赖于人对图像的注解,当图像数量急剧增大时,人工注解的方法所需工作量太大,而且不同人对同一幅图像的理解角度也
8、是不同的,注解的主观性导致检索的查全率偏低。90年代以来,基于内容的检索成为一个研究热点,它是直接根据图像内部的各种物理特征,在数据库中检索具有相似特征的图像。从图像中提取的特征可以组成一个向量,两个图像之间可以通过定义一个距离或者相似性的测量度来计算相似程度。特征匹配是图像检索的一个关键环节,具有特征依赖的特点,不同的特征应该采用不同的度量方法。在检索的过程中,根据系统相似性度量的算法计算查询特征与特征库中对应的每组特征的相似程度,把所得结果由大到小排序后得到一个匹配图像序列返回给用户。其间可以通过人机交互,对检索的结果逐步求精,不断缩小匹配集合的范围,从而定位到目标。匹配过程常利用特征向量
9、之间的距离函数来进行相似性度量,模仿人类的认知过程。图像是对客观对象的一种相似性的、生动性的描述或写真。或者说图像是客观对象的一种表示,它包含了被描述对象的有关信息。它是人们最主要的信息源。据统计,一个人获取的信息大约有75%来自视觉。俗话说“百闻不如一见”,“一目了然”,都反映了图像在信息传递中的独特效果。所谓基于图像内容检索,即从图像库中查找含有特定目标的图像,也包括从连续的视频图像中检索含有特定目标的视频片段。它区别于传统的图像检索手段,融合了图像理解技术,从而可以提供更有效的检索手段。对于基于内容的检索系统,根据其处理的对象可将其分为静止图像检索和活动视频检索;根据图像库的内容可分为通
10、用检索系统和专用检索系统。专用检索系统根据系统的专门要求进行检索,而通用检索系统所采用的技术则较为普遍。目前,对于通用的静止图像检索,用于检索的特征主要有颜色、纹理、草图、形状等,其中颜色、形状、纹理等应用尤为普遍。 对图像的检索是基于图像的颜色、纹理、形状以及图像中子图像等特征,包括:颜色检索,检索与用户指定颜色相似的图像。纹理检索,检索具有相似纹理的图像。形状检索,用户选择形状或勾勒草图,利用形状特征或匹配主要边界进行检索。图像对象检索,对图像中所包含的静态子对象进行查询。纹理分析: 提到纹理,人们自然会立刻想到木制家具上的花纹、花布上的花纹等等。木纹是一种天然纹理,花纹为人工纹理,它们反
11、映了物体表面颜色和灰度的某种变化。这些变化与物体本身的属性有关。比如同一树种的木材有相同或相似的纹理,人们通过识别木纹来判断木材的种类和材质。纹理是图像中一个重要而又难于描述的特性,至今还没有公认的定义。有些图像在局部区域内呈现不规则性,而在整体上表现出某种规律性。习惯上,把这种局部不规则而宏观有规律的特性称之为纹理特性;以纹理特性为主导的图像,常称为纹理图像;以纹理特性为主导性的区域,常称为纹理区域。由于构成纹理的规律可能是确定性的,也可能是随机性的,纹理可分为确定性纹理和随机性纹理。纹理变化可出现在不同尺度范围内,若图像中灰度(或其他量)在小范围内相当不平稳、不规律,这种纹理就称为微纹理;
12、若图像中有明显的结构单元,整个图像的纹理是由这些结构单元按一定规律形成的,则称为宏纹理,上述的结构单元称为纹理基元。由此可见,在实际纹理图像的分析中,要针对纹理的类型,采用适当的分析方法研究其变化规律。为了定量地描述纹理,需要研究纹理本身可能具有的特征。多年来人们建立了许多纹理分析方法。这些方法大体可以分为两大类:统计分析方法和结构分析方法。前者从图像有关纹理属性的统计分析出发;后者则着力找出纹理基元,然而从结构组成上探索纹理的规律,或直接去探求纹理构成的结构规律。无论从历史发展还是从当前进展来看,统计分析法仍然占主导地位。在统计方法中,有关研究纹理区域的统计特性;有研究像素领域内的灰度或其它
13、属性的一阶统计特性;有研究一对像素或多像素的灰度或其它属性的二阶或高阶统计特性;也有用模型来描述纹理的,如Markov模型、Fractal模型等。灰度差分统计法:灰度共生矩阵反映了图像灰度关于方向、相邻间隔、变化幅度的综合信息,它作为分析图像基元和排列结构的信息。作为纹理分析的特征量,往往不是直接应用计算的灰度共生矩阵,而是在灰度共生矩阵的基础上再提取纹理特征,称为二次统计量。在灰度共生矩阵的基础上,介绍灰度差分统计法:假设图像中任意一点为(x,y),它所对应的灰度值为g(x,y);现有偏离它的另一点为(x+x,y+y),它的灰度值为g(x+x,y+y),计算这两个像素的灰度差别为:g(x,y
14、)=g(x,y)-g(x+x,y+y) 让(x,y)在整个图像中移动,计出g(x,y)取各个数值的个数,由此可以得到关于g(x,y)的直方图,再由直方图可以知道g(x,y)取各个值的概率,设为p(i),参数i为g(x,y)。假设图像像素的灰度值的级数为k,那么i的级数也为k,而灰度共生矩阵中g1和g2的组合共有k2种,很显然本方法大大减少了统计工作量。以下为计算一些特征值的方法:灰度中值 (如图1-1-1)如图1-1-1 灰度中值图像熵平均值基于内容图像检索与传统的基于文本检索方式相比,具有如下特点:(1)突破了关键词检索基于文本特征的局限,直接从媒体内容中提取特征线索。(2)检索方式多种多样
15、。基于内容的图像检索可以提供浏览方式、基于实例的检索方式以及基于草图的检索方式等等。(3)人机交互式检索。基于内容的图像检索系统通常采用参数调整方法、聚类分析方法、概率学习方法和神经网络方法等,通过人机交互的方式来捕捉和建立图像低层特征和高层语义之间的关联,即相关反馈技术。(4)相似性匹配检索:基于内容的检索是按照一定的匹配算法将输入图像的特征与特征库中的特征元数据进行相似性匹配,将满足一定相似性的一组初始结果按照相似度大小排列,提供给用户。尽管CBIR相对于TBIR有了很大进步,但是这种基于机器对图像各种特征的理解在某些场景中不能替代基于文本的描述,比如一幅图像下面可能蕴含着某种寓意或者一个
16、事件,但是单纯从内容是无法获取这一切的,如果能将对图像的注解应用于基于内容的检索,无疑将极大的提高检索查准率。在Internet环境下,MPEG专家组制定了一个基于内容的多媒体描述方案,即MPEG-73标准,对各种不同类型的多媒体信息内容的描述方式进行了标准化定义,从而实现CBIR与TBIR的互连。1.2图像内容检索技术的发展趋势近年来,对图像内容检索进行了广泛深入的研究,提出了许多行之有效的识别方法,应用软件也越来越丰富,并且有实用装置出现。基于内容检索技术的发展趋势基于内容的图像检索方法最重要、最关键的就是寻求最接近人类视觉生理、心理特点的图像特征和提高检索过程响应速度两个问题。要研究这两
17、方面的技术,还要着重考虑:(1)相关性。人类视觉特征与低层特征存在一定的相关系,图像的检索方式逐渐向语义性方向发展已逐渐被越来越多的研究人员所认同,相关性是联系这两种特征的重要方式。(2)测试集和性能评价标准。所有技术中的任何一项都是由该领域中相应的评价标准来推动的。一个好的评判标准会引导相关技术向正确的方向发展,而不好的评价标准有可能误导相关研究技术工作。就现在而言,图像检索领域的标准主要是借助于文本检索领域的查全率和查准率,但是因为图像的非精确度匹配原则,所以,还有待于更进一步找到一种更适合评价系统性能的途径,并以此来引导研究工作向正确的方向发展。与评价标准具有同等意义的一个课题是建立一个
18、平衡的、大规模的、更接近实际图像应用的测试数据库。(3)和多媒体和交叉领域的融合。图像内容检索技术要达到实用的水平,需要多个交叉领域的共同努力。目前的系统仅仅是数据库领域和计算机视觉领域的交叉研究,而且数据库的管理、数据的组织、数据查询方式等方面,也都是今后研究中需要解决的问题。此外,传统的信息检索领域也是必不可少的,尽管传统的信息检索领域主要关注于文本形式的检索技术,其中有许多检索模型和技术可以被图像检索领域所参考与借鉴。除了交叉领域的结合之外,另一种重要的结合形式是多模态数据的结合,例如视频、图像、声音等等。将模态的多媒体数据相结合的研究方法已在广泛领域内的图像索引和分类等课题上表现出了巨
19、大的潜力。图像的内容包括图像的视觉信息等物理特征,还包括视觉特征所带来的高层语义特征。物理特征属于低层视觉信息,主要包括颜色、纹理、形状;语义信息属于图像的高层视觉信息,主要包括对象、空间关系、场景、行为、情感等图像内容。基于内容的图像检索的目的一般可为三类:(1)准确查询,找出一致的复制件;(2)范围查询,找出与输入图像特征相差在一定范围内的图像;(3)K-最近邻查询,根据输入图像与待检测图像的相似度对检索结果进行排序。对图像内容检索的研究起步于二十世纪80年代,到了网络技术逐渐普及的90年代才取得较大的突破,多种成果开始转化为应用技术,而日益增长的应用需求反过来推动其研究向更高的层次发展。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 大学生创新创业训练计划项目中期进展报告 大学生创新创业管理与 大学生 创新 创业 训练 计划 项目 中期 进展 报告 管理
链接地址:https://www.31doc.com/p-8768159.html