在较早的文献记载里,“相关性”在本质上是一个模糊的概念,并不是一个真正的二分法概念,它已经被用模糊集理论建立的模型所代替。模糊情报检索系统的工作原理如下:当系统增加文献时,系统就会产生这些文献的相关索引词,每个索引词都会标出权重,来表示该索引词与文献的相关度,标引者会指出该索引词仅适用于该文献,而无须做出彻底的是或不是的决定。模糊情报检索系统的检索更多的是建立于模糊集代数学基础上,而不是普通的集合代数。AND、OR和NOT这些布尔算子仍然使用,但这些算子已建立在模糊并、模糊交、模糊非的概念基础上,而不是完全的等价关系。模糊情报检索也是对传统的布尔检索机制的改进,有很多在布尔检索里使用的理论基础和机制仍然有效。与布尔检索相比,模糊情报检索有许多优势:如在索引词的设置方面比较灵活、输出也能根据相关度来排序等,但模糊情报检索也存在着一些缺点:如编制索引的成本持续上涨、许多在布尔检索中出现的问题在模糊情报检索中同样存在等。另外,由于传统的布尔检索系统在很多领域中做了大量的工作,致使模糊情报检索在商业系统中还没有太多的应用。但是模糊情报检索在很多与情报检索相关的领域中还是有较多应用:
(1)专家系统与人工智能。Gaines和Shaw介绍了专家系统的历史发展,并且把模糊集理论的概念引入这个领域。Graham还描述了模糊逻辑在商业专家系统中的应用。模糊集理论还在人工智能领域有广泛的使用,Nauck和Kruse运用医学数据库创立了模糊分类规则。
(2)关系型数据库的模糊查询。Motro阐述了一个基于模糊集理论的一个数据库系统,它提供了一个允许模糊查询的用户界面。
(3)模糊聚类分析。情报检索里的模糊集算法的运用同样是一个引人注目的领域,Miyamoto在多次应用的基础上较好地解释了该方法,模糊聚类分析适用于普通聚类分析应用的任何情形。
(4)模糊主题检索。模糊聚类分析引起了特别的关注,这些类别能组成一个类似词表的结构。为了应付情报检索的日益增多查询需求,在模糊主题方面还要加强研究。
以上所论述的是一个数学理论——模糊集理论,它能模拟有某种程度的模糊和不确定性的各种情形。模糊集理论在图书情报学中的应用研究还需要我们图书情报学研究人员的不懈努力,才能更好地运用模糊集理论来解决图书情报学研究中出现的各种问题。
收稿日期:2002-11-19
【参考文献】
[1] 刘应明,任平.模糊性——精确性的另一半.北京:清华大学出版社,2000
[2] Gaines,Shaw.From fuzzy logic to expert systems.Information Sciences,60(1-2):137-143
[3] Graham.Fuzzy logic in commercial expert systems-results and prospects.Fuzzy Sets and Systems,40(3):451-471
[4] Miyamoto.Fuzzy sets in information retrieval and cluster analysis.Dordrecht:Kluwer Academic Publishers
[5] Tahani.A fuzzy model of document retrieval systems.Information Processing and Management,12(3):177-187