导图社区 信息检索思维导图5
信息检索(Information Retrieval)是用户进行信息查询和获取的主要方式,是查找信息的方法和手段。狭义的信息检索仅指信息查询(Information Search)。即用户根据需要,采用一定的方法,借助检索工具,从信息集合中找出所需要信息的查找过程。
社区模板帮助中心,点此进入>>
互联网9大思维
组织架构-单商户商城webAPP 思维导图。
域控上线
python思维导图
css
CSS
计算机操作系统思维导图
计算机组成原理
小学教育知识与能力
IMX6UL(A7)
信息检索
信息检索基础
信息概述
含义
广义
指自然界和一切人类活动所传达出的信号和消息,是事物表现的一种普遍形式。(客观存在)
狭义
指经过搜集,记录,处理和存储的可供检索的文献,数据和事实。(人类对客观事物的认识,检索的对象)
特征
可储存性
可传递性
可转换性
可处理性
可共享性
可识别性
依附性
普遍性
功能
传承人类文明,推进社会发展。
提供决策依据,提高决策效益。
保障有效控制,保证系统秩序。
发挥参考作用,推动知识创新。
类型
基于广义
信息的产生
社会信息
自然信息
信息的运动状态
自在信息
自为信息
再生信息
基于狭义
信息的媒体类型
印刷型信息
缩微型信息
视听型信息
机读型信息
信息的加工处理程度
零次信息
一次信息(原始信息)
二次信息
目录
文摘
索引
三次信息
综述
评述
信息内容
经济信息
科技信息
政务信息
文化信息
教育信息
军事信息
信息的出版发行特点
正式出版信息
图书
阅读类图书
检索类图书
期刊
报纸
非正式出版信息
会议文献
学位论文
政府出版物
科技报告
档案
专利文献
网络环境下的信息变化
互联网对信息的影响
引发信息的新的出版形式——网络出版,形成了新型的网络信息资源
使人类传统的信息交流方式发生了根本性的变化
推动了信息处理技术的发展
网络环境下信息的新特点
信息类型多样化
信息数量和内容得到极大丰富
信息分布呈现明显分散性
纸本文献信息
网络信息资源
信息共享程度提高
互联网—采用TCP/IP(传输控制协议和网际互联协议)
信息检索的概念与原理
概念
信息存储与获取
信息获取
原理
存:给信息基于特征标识
将特定的信息需求与存储在检索系统的中的信息标识进行异同的比较与匹配,选取两者相符或部分相符的信息予以输出。
对信息资源集合和信息需求集合的匹配与选择
由外部特征和内部特征赋予特征标识
实质
信息资源集合
信息需求集合
匹配与选择
取:将信息的特征标识进行比较
信息检索的类型
文献检索(相关性检索)
数据检索(确定性检索)
事实检索(确定性检索)
当前新类型分类
检索内容
文本检索
数值检索
音频与视频检索
检索系统中的信息组织方式
全文检索
多媒体检索
超媒体检索
检索要求
强相关检索
弱相关检索
检索性质
定期检索
回溯检索
检索方式
手工检索
机械信息检索
计算机检索
意义
是有效利用信息资源,实现最大价值的科学方法
是再学习的工具,获取知识的有效途径
有效地提高科研工作的效率,节省人力物力及时间
是提高信息素养的重要途径,有利于培养信息意识和提升获取的能力
历程
脱机检索
联机检索
光盘检索
网络检索
信息检索系统
存储 输入端 针对信息
根据特定的信息需求建立的一种有关信息搜集,加工,存储和检索的程序化系统,目的为人们提供信息检索服务。
获取 输出端 针对用户的提问
输入
存储
处理
输出
控制
构成
信息选择子系统
信息索引子系统
词表管理子系统
检索子系统
用户同系统之间交互子系统
匹配子系统
分类
手工检索系统
书本式手工检索系统
卡片式手工检索系统
计算机检索系统
硬件
软件
数据库
参考数据库
数目数据库
指南数据库
源数据库
数值数据库
文本—数值数据库
全文数据库
术语数据库
图像数据库
多媒体数据库
信息检索方法
直接浏览法——查找法
常用法
顺查法
倒查法
抽查法
追溯法
综合法——分类查找法,循环法,交替法
信息检索效果
信息检索效果评价
评价的三个方面
检索结果有效性评价
检索结果实用性评价
检索费用——效率评价
评价的意义
重要依据
提高信息检索能力
评价的六大指标
收录范围
查全率
=(检出相关文献信息量/检索系统中相关文献信息总量)×100%
查准率
=(检出相关文献信息量/检出文献信息总量)×100%
2×2表(近似描述)
响应时间
用户负担
输出形式
其他信息检索效果评价的指标
漏检率
=(漏检相关文献信息量/检索系统中相关文献信息总量)×100%
误检率
=(误检文献信息量/检出文件信息总量)×100%
易用性——可存取性
死链接率
重复链接率
影响检索效果的因素
标引的质量
检索语言的性能
作用
影响
检索途径的数量
检索策略的优劣
检索人员的素质
信息检索途径
分类途径
主题词/关键词途径
题名途径(书/篇名途径)
著者途径(责任者途径)
代码途径
出处途径
时间途径
任意词途径(自由词途径)
信息检索的模型
基本原理:检索系统对用户信息需求与系统存储的信息资源所进行的匹配。
检索模型指对信息检索任务的数学抽象
三要素
信息集
用户提问集
信息集与用户提问集的相似性匹配
布尔逻辑检索模型
向量空间检索模型VSM
概率检索模型PRM
模糊检索模型FRM
信息素养与信息检索
信息素养的概念
信息意识和信息获取
信息素养的培养
能够促进信息意识的增强
能够促进信息能力的提高