欢迎来到专业的优谦范文网平台! 工作总结 工作计划 心得体会 述职报告 思想汇报 事迹材料 疫情防控 共同富裕
当前位置:首页 > 范文大全 > 公文范文 > 正文

高校图书馆智能化信息检索系统建设探析

时间:2023-08-23 14:40:08 来源:网友投稿

孙海蒂 阎静辉 陈 冉

(海军大连舰艇学院图书馆 辽宁大连 116001)

高校图书馆为高校教学、科研提供服务保障,信息检索是图书馆的核心服务之一。当前,传统检索系统不能很好满足读者的个性化检索需求、无法分析隐藏信息;
而智能化信息检索系统,则引入了现代人工智能的技术与方法,使之具有联想、比较、判断、推理、学习等能力,能够提高检索的深度和效率,更好地满足读者需求。如何快速准确高效地从海量的图书馆信息资源中获取所需信息,是当前研究的热点。本文研究基于代理技术、自然语言处理的图书馆智能化信息检索系统,为读者及时、有效地获取所需要的资源,提供有效方式。

(一)高校图书馆传统检索工具存在的问题。高校图书馆传统检索工具诸如CNKI等这些数据库检索系统,面临着严峻的挑战,功能的单一已越来越不能满足读者日益增长的个性化检索需求。

1.基于关键词及关键词组配的检索方式功能滞后。关键词及关键词组配无法表达读者的检索需求,关键词所表达的内容比较宽泛,导致查全率、查准率低,需要读者进行筛选。

2.无法适应读者兴趣变化的需要。读者检索时有其特定的兴趣和背景,而现有大部分信息检索系统对任何读者都是一种模式,很容易让读者感到迷茫,使得读者无法准确地表达自己的兴趣。

3.检索系统对文本处理能力不够。传统检索系统对文本的处理仅仅局限于关键词匹配及文献分类,无法进行对文本的自然语言处理,无法揭示文献的特征,无法挖掘文本内在的和潜在的信息与知识。

4.检索算法缺乏智能性。传统检索系统采用的相关度匹配策略具有一定局限性,没能支持推理检索技术。

(二)高校图书馆智能化信息检索系统的优点。高校图书馆信息检索系统的智能化、个性化、主动化,实际是相辅相成的整体趋势,智能化、个性化、主动化服务需要智能技术的支持,智能化涵盖了个性化的内涵,个性化也拓宽了智能化的外延。因此我们所研究的智能化检索系统是集多种发展趋势于一体的服务体系。[1]一个较成熟的智能化信息检索系统一般具备以下几种能力。

1.大规模的知识库是智能信息检索系统的基础,它有一个强大的推理系统支持,能够处理自然语言文本,它利用知识库的有关知识进行语法、语义分析,从内容上真正理解并准确描述所检索的主题。

2.能够通过一系列智能程序实现系统与用户的交流,了解读者的背景,掌握读者兴趣的变化,跟踪读者的需求过程,实现不同读者、不同背景、不同兴趣的同一检索词或检索时的不同信息供给,提高读者检索的效率和准确率。

3.有良好的反馈机制,能及时有效地和读者沟通,确定适合读者的检索策略,并通过对检索结果反馈的分析,根据读者的兴趣点,更准确地提供检索服务,提高效率和准确性。并将有效信息及时更新相关知识库。

4.有较好的机器学习能力,对读者提交的样本能进行学习,进行分析、信息提取、归纳总结,及时了解用户的需求与兴趣,更新读者兴趣库,把读者特征和检索信息匹配起来,为下一步的搜索提供较准确的信息。

5.能根据读者需求提供主动推送服务,对读者的检索需求能跟踪信息源的变化,及时将最新的信息提供给读者。

6.对数据和文本应有挖掘能力,能挖掘文本中潜在的知识,解释文本的深刻内涵,并将这些分析结果以知识形态存放于知识库中,使检索结果成为读者可以直接加以利用的信息,提高信息检索的准确性和全面性,进而提高信息检索的服务深度。

(一)高校图书馆智能化信息检索系统层次结构。高校图书馆智能化信息检索系统的实现需要功能不同又相互支撑的功能层来共同协作完成,这些功能层可以完成检索的智能化需求。一个功能完善的智能化信息检索系统的功能结构大体可以分为四个层次:知识生成层、智能接口层、智能代理层和智能搜索层。

1.知识生成层。知识生成层是智能化信息检索系统的基础和核心,是信息检索系统实现智能化的关键所在。知识生成层直接决定了其他各层功能实现的水平。知识生成层的形成与增长就如同人脑知识的增长,也处于一种自增长自循环的状态,它的丰富程度决定着检索程度的高低。

2.智能接口层。智能接口层是系统与读者之间交流的桥梁,是智能信息检索系统的首要功能,可以实现友好的“人机交互”;
[2]能对读者的自然语言进行处理和查询、对检索过程进行全面的跟踪和反馈、对检索结果的智能输出以及对知识库的操作等。

智能接口层是读者与检索系统的友好交互,自然语言的提问和反馈是交互的基础,只有深刻理解了读者的检索意图与检索要求,才能使检索系统更好地履行职责,为读者提供高质量的服务。智能接口层同时又是知识生成层的建立与维护的通道,知识库是一个动态的、不断完善的知识表示和描述,需要专家对其进行补充和完善,良好的通道有助于专家与系统的交流。

3.智能代理层。智能代理层是基于多代理的智能体,是一个程序组,[3]用以实现检索系统对读者兴趣变化的跟踪、读者提交样本的学习、对检索结果的过滤与反馈以及提供信息推送服务等功能,是读者提问与信息搜索的中间过程,是提高信息检索的准确性、快捷性、针对性和主动性的重要保障,使检索系统真正做到在检索过程中有的放矢,大大提高了检索效率。

4.智能搜索层。智能搜索层是指其具有从数据集合中搜索特定信息或知识有序整合功能的结构层,是对信息源的搜索过程。[4]传统意义上的搜索,如数据库的检索、搜索引擎的检索,主要是基于关键词匹配的检索,以网络信息检索为例,网络信息检索是指从大量网络文件的集合中找到与给定的查询请示相关的、恰当数目的文件子集。

(二)高校图书馆智能化信息检索系统模型。将智能代理技术运用到信息检索系统中来,可以使信息检索系统具有智能化,从而提高其检索性能。[5]信息检索系统通过智能代理可以完成学习、过滤、反馈和推送等工作,并结合自然语言处理等技术生成知识库,从而实现满足读者个性化需求的智能检索功能。

高校图书馆智能化信息检索系统的智能代理模块是由系统代理、用户代理、学习代理、过滤代理、反馈代理和推送代理等模块组成。

(一)系统代理模块。系统代理是整个代理模块的运转中心,全面负责系统的集成与管理、读者与系统之间的需求沟通与信息反馈、各代理模块之间的沟通与协作。系统代理及独立存在,有渗透于系统的各个模块之中,是智能系统的大脑与中枢,是实现系统智能化的核心模块。

(二)用户代理模块。读者把检索需求传递给用户代理模块,用户代理模块再根据读者的指令来收集信息并协调系统完成检索任务。它能根据读者的需求变化,来领会读者的检索意图,负责生成读者兴趣库并更新数据库,是实现个性化检索的重要手段。用户代理与读者的沟通是智能化的、个性化的,沟通的程度决定着系统检索的深度与广度。

(三)学习代理模块。系统与读者沟通的一个重要内容是了解读者的兴趣,其中一个重要手段是读者向系统提交样本,学习代理模块通过样本进行内容特征分析,以此掌握读者兴趣,进而更新读者兴趣库,为下一步进行个性化信息搜索与特征匹配做准备。[6]主要过程有特征筛选、特征匹配等,方法有向量空间模型(VSM)法、构造词条加权评估函数等。

(四)过滤代理模块。传统检索系统的检索结果已越来越不能精准地满足读者的需求,对检索结果进行多次过滤,就能够有效解决这个问题,过滤代理模块能够过滤掉那些不符合读者要求的、内容重复的结果,使读者更快捷、更精准的在众多检索结果中找到所需的内容。

(五)反馈代理模块。读者在检索过程中一般不会一次性获得满意结果,这就需要系统和读者之间进行多次的信息沟通和结果反馈,才能更加准确地获得读者的需求,通过反馈和再检查,从而提高检索效率和检索准确率。

(六)推送代理模块。检索系统的推送代理模块能够跟踪读者的检索行为从而提供主动完成服务,并定期更新检索内容,把检索结果积累起来,以一定的方式把新的检索结果推送給用户。

自然语言处理是知识生成层的技术基础,是生成知识库的重要保证。自然语言处理过程主要包括词法分析、句法分析、语义分信息和语境分析,分析过程要借助于知识库,[7]包括静态知识库和动态知识库,静态知识库属于知识生成层,是自然语言处理的核心。

(一)词法分析。词法分析是指将输入的字符串序列分解出单词并确定词性,也称关键词预处理。词法分析主要依靠知识库和分词词典,对自然语言进行切分,如:“我想学习医学方面的知识”,可通过知识库和分词词典知道“我”“学习”“医学”“知识”分别为不同的词组。词的选取应首先遵循三个规则:一是去掉含有较少语义信息和不能作为特征的词,如的、了等;
二是将短语(词)提取出来;
三是仅选取名词、动词等有意义的词作为特征。

(二)句法分析。句法分析是对读者检索时输入的单词序列进行分析,根据语法知识库检查是否为合法的句子结构,并在此基础上构造出相应的表示句法关系的句法树。

(三)语义分析。语义分析是在句法分析的基础上进行的,是指对各级语言单位(词、词组、句子、句群)所包含的意义和在语言使用过程中所产生的意义进行分析。

(四)语境分析。是指根据上下文分析,确定所表达的具体意义。[8]例如“小王打针去了”这句话,我们至少要知道小王是病人还是护士,这就要从上下文中去弄清楚。语境分析的过程就是把分析语境得到的信息存放到一个动态的知识库中,检索系统的分析程序参照这个动态知识库,进行自然语言处理。

当前,国内大部分高校图书馆的信息检索系统都是通过分类主题目录与关键词匹配等方式进行检索,虽然分类主题目录和关键词匹配的方式比较方便、高效,但也有信息更新不及时、无法了解读者的实际检索请求等缺陷,导致图书馆提供的检索服务个性化程度不够。随着读者个性化需求的不断增强,能理解自然语言、具有推理能力的智能化信息检索系统就成为了建设热点。智能化信息检索系统能够有针对性地帮助读者完成信息服务任务,不断提升信息检索效率。本文通过智能化信息检索系统的层次结构与模型、智能代理模块功能及自然语言处理的流程与原理这几个方面,对于高校图书馆智能化信息检索系统的建设展开了分析,可供参考。

猜你喜欢检索系统信息检索知识库基于TRIZ与知识库的创新模型构建及在注塑机设计中的应用制造技术与机床(2019年6期)2019-06-25收录《信号处理》的检索系统及数据库信号处理(2018年1期)2018-09-03收录《信号处理》的检索系统及数据库信号处理(2018年5期)2018-06-28本刊被以下检索系统及数据库收录信号处理(2018年4期)2018-06-27本刊被以下检索系统及数据库收录信号处理(2018年3期)2018-06-27医学期刊编辑中文献信息检索的应用新闻传播(2016年18期)2016-07-19在网络环境下高职院校开设信息检索课的必要性研究新闻传播(2016年11期)2016-07-10高速公路信息系统维护知识库的建立和应用中国交通信息化(2016年9期)2016-06-06基于神经网络的个性化信息检索模型研究现代计算机(2016年11期)2016-02-28基于Drupal发布学者知识库关联数据的研究图书馆研究(2015年5期)2015-12-07

推荐访问:探析 智能化 图书馆

猜你喜欢