朱昱林郑州测绘学校河南郑州450015中图分类号:G40-057文献标识码:A
摘要:进入90年代早期,由于大规模图像数据库的出现,通过手工进行图像注解带来的困难变得十分尖锐。为了克服这一困难,研究者们提出了基于内容的图像检索技术(Content-BasedImageRetrieval,简写为CBIR)基于内容的图像检索是利用图像内容实现图像检索的一项综合性技术,是指根据图像内容特征以及特征组合,从图像库中直接查找含有特定内容的图像。
关键词:图像检索;国内外发展;问题解决
图像作为一种内容丰富、表现直观的多媒体信息,由于其具有文字信息所无法比拟的丰富内涵和强大的描述能力,是日常生活中不可缺少的信息来源。随着各行各业对图像信息日益广泛的应用。图像数据的爆炸性增长使得对图像的管理和检索成为关键。如何有效地组织、管理和检索大规模的图像数据库已成为迫切需要解决的问题。
进入90年代早期,由于大规模图像数据库的出现,通过手工进行图像注解带来的困难变得十分尖锐。为了克服这一困难,研究者们提出了基于内容的图像检索技术(Content-BasedImageRetrieval,简写为CBIR)。基于内容的图像检索是利用图像内容实现图像检索的一项综合性技术,是指根据图像内容特征以及特征组合,从图像库中直接查找含有特定内容的图像。图像的内容特征包括图像的外观特征(颜色、纹理、形状)和语义[1]。
目前研究和应用的层次主要是采用基于特征的检索方式。其明显区别于传统的基于关键字的检索手段。另外它还融合了计算机图像处理、计算机视觉、模式识别、人工智能和数据库等技术,具有如下特点[4]:
1.直接从图像内容中提取信息。基于内容的检索突破了传统的基于表达式检索的局限,它直接对图像和视频进行分析并抽取特征,利用这些描述图像内容的特征建立索引。
2.特征提取和索引建立可由计算机自动实现,避免了人工描述的主观性,减少了工作量。
3.基于内容的检索是一种近似匹配。在数据库中,要使用模式识别的方法对图像库中的图像按不同索引特征进行分类。在检索的过程中,它采用某种特定的相似性度量对图像库中的图像进行匹配来获得查询的结果。由于相似性度量与人的主观感受有关,因此常常需要用人机交互的方法。这区别于常规数据库的精确匹配检索。
基于内容的图像检索既要利用传统数据库对图像的文字信息进行存储管理,还要利用图像的颜色、形状或纹理等特征以及这些特征的组合来检索图像,这不仅体现了图像所含的信息特点,还充分结合了传统数据库技术,是一项在理论研究和实际应用中都极有前途的新技术。
因此,从90年代中期开始,CBIR逐渐成为活跃的研究领域。其中一些关键技术如特征提取、图像分割、对象提取、高维索引等一直都是一个悬而未决的问题。随着研究的进行,国际上在许多方面有了新的进展,已有不少性能各异的CBIR研究原型系统和商业应用系统面世,其中国内外发展中具有代表性的有:
1.QBIC(querybyimagecontent)系统[2]。它支持基于例子图像的查询方式,也支持草图、轮廓、组合颜色和纹理特征的查询方式以及其它方式。采用了颜色、纹理和形状特征,结合关键词进行查询,并采用R*树作为高维索引结构。
2.Virage[2]。由Virage有限公司开发的基于内容的图像检索引擎。支持基于颜色、颜色布局、纹理和结构的查询。但Virage比QBIC更进一步,它支持由上述4个查询的任意组合,用户可以根据自己的查询意图调整这4个查询的权重。
近年来,国内在图像检索技术的研究方面也取得了很大的进展。例如,浙江大学计算机系研究的基于图像颜色的检索系统和基于图像形状的检索系统、清华大学的Internet上静态图像的CBIR的原型系统以及中国科学院计算机技术研究所的多媒体信息检索系统(multimediainformationretrievalsystem,MIRES)等。
从总体上看,对基于内容图像的检索研究主要集中在特征提取和结构化、检索算法、索引结构和查询接口方面。
目前尽管基于内容图像检索的原型系统己经很多,研究者们从CBIR的不同方面着手也取得了相应的成果,但这些系统还不够完善,距离真正商用还有一定距离。基于内容的图像检索技术是一门综合性的交叉学科,其研究有赖于图像理解、图像处理、模式识别、人工智能以及数据库技术等多种学科的不断发展,还存在很多问题需要解决。
1.基于语义特征的图像检索
现有的图像检索系统是建立在低层图像特征。实际上,这些统计数据与人对图像的内容理解存在很大差异。人对图像的描述和理解主要是在语义层次上进行的,无法直接从图像的视觉特征即低层特征获得。因此,图像的低层特征和高层语义表达之间还存在着巨大的“语义鸿沟”。如何将图像语义特征结合到检索中是提高检索系统性能的关键所在,已得到了越来越多的关注。
2.人机交互系统
查询接口是人机交互的一个重要途径,一个好的查询接口可以使用户方便地获取所需的各种信息,而感觉不到太多的阻碍。接口设计时应充分考虑到不同用户的需求。提供友好的用户界面并实现图像的快速检索是当前研究和探讨的又一重点和难点。
3.网上搜索引擎技术
网络的迅速发展和广泛使用,推动了视觉信息检索的应用,也对视觉信息检索的技术提出了新的挑战。在网上搜索图像是基于内容的视觉信息检索中最困难的工作之一。构建一个高效的网上图像搜索引擎是一项庞大的工程,需要协调好搜索、过滤、特征提取、分类、数据库、检索、记录分析和用户与WWW间的用户界面设计等8大模块之间的关系,充分挖掘和发挥各模块的功能和作用。另外,图像分类不同于经典的模式识别中的分类技术,研究和探索适合于图像库的模式分类技术将是网上搜索引擎和基于网络的图像数据库检索技术的重点方向。
4.高维索引技术
对于实验数据只有上百个或上千个的检索算法来说,顺序搜索是其常采用的查询方式,但是系统和用户感觉不出检索的响应时间。而对于大型图像数据库,直接搜索往往是不切实际的,必须建立索引。由于图像搜索,是在其内容的特征空间中进行的,特征矢量数量远大于常规数据库的索引能力。因此,需要研究和开发新的索引结构和算法,以支持图像库的快速检索和浏览。
5.压缩域图像检索
目前,由于许多压缩标准(如JPEG,JPEG2000)的制定和推广,压缩格式的图像检索技术得到了广泛的关注和研究。图像检索技术与图像压缩在本质上是一致的,都是要使数据量大大降低。因此,图像压缩中的许多技术可以用于图像检索中。一般的压缩域图像检索可以分为空间域和变换域两类检索。
总之,CBIR技术是一个方兴未艾的综合性研究领域,虽然目前的原型系统己有不少,但是基于内容的图像检索技术涉及面广、发展迅猛,许多问题还有待于进一步探索和研究。CBIR技术有赖于图像处理、图像识别、数据库技术的发展,同时也必将对这些相关领域产生深远影响,是一个很有前途的发展方向。
参考文献:
[1]李向阳,庄越挺,潘云鹤.基于内容的图像检索技术与系统(J).计算机研究与发展,2001
[2]王文惠,周良柱.基于内容的图像检索技术的研究和发展(J).计算机工程与应用,2001