导图社区 第六章信息检索
概念:是在互联网上提供给用户进行关键词、词组或自然语言检索信息的工具,是建立在信息搜集和信息组织的基础上的,其基本工作原理是用户提出检索需求,搜索引擎代替用户在数据库中进行检索,并把结果反馈给用户。
信息组织将已获得的网络信息资源以固定的记录方式存储,用户通过关键词及其组配查询,可以找到需要的信息线索,并通过这些信息线索直接连接到相应的网络信息资源。
信息检索对文档量化处理思想发挥了计算特长,自诞生以来在计算机检索领域中占据着重要地位,既有布尔模型间接形式化特点,又有有效的匹配算法设计以及合理的结果排序处理方式。
社区模板帮助中心,点此进入>>
互联网9大思维
组织架构-单商户商城webAPP 思维导图。
域控上线
python思维导图
css
CSS
计算机操作系统思维导图
计算机组成原理
小学教育知识与能力
IMX6UL(A7)
第六章 信息检索(下)
网络信息检索
特点(优点)
信息丰富,减缩空间拓宽
信息资源异构式分布
信息检索方便实用,适合非专业用户
交互性强、目的性强
工具
非Web资源检索工具
Web资源检索工具
搜索引擎及其应用
搜索引擎
搜索引擎应用
综合型独立搜索引擎
是发展最早、使用最广泛的网络信息检索工具,数量也比较多,他在采集和标引网络资源时不限制网络资源的主题范围和数据类型,用户可以用此类工具检索几乎所有方面的网络资源,Google、百度、必应、淘宝
垂直型独立搜索引擎(成本高,有自己的信息资源库)
专业搜索引擎,是专门为查询某一学科或主题的信息而产生的查询工具,专门收录某一方面、某一行业、某一主题的信息,集中在特定领域,用户数量较少,但用户粘性较高
网易云音乐、百度地图、百度知道
元搜索引擎(代购)
本身并不收集网站或网页信息,通常也没有自己的数据库,而是将用户查询请求经过多次转换处理提交给多个预先选定的成员引擎,并将所有查询结果集中起来以整体统一的格式呈现给用户。(微信搜索、小程序)
Mamma、MateCrawler
移动搜索引擎
搜索引擎基本原理
独立搜索引擎
数据采集:人工采集和自动采集(更多)
数据分析和标引:多用自动方式对网页信息进行分析,从中提取网页关键词
数据检索:主要通过用户界面的人机交互
信息挖掘:源于用户对个性化服务的需求,跟踪、发现用户需求兴趣,建立用户兴趣模板文件。通过对用户检索行为的跟踪,统计和学习,结合其他相关信息,可以为用户提供更加有针对性的个性化搜索服务。
元搜索引擎
发展趋势
智能化
可视化
简单化
数据挖掘等技术会用户及时准确地检索信息
网上自动标引、自动文摘、自动跟踪、自动漫游
多样化
信息形态多样化:文本、图像、声音、动画
检索工具多国化、多语言化方向发展
网上检索工具的多元化
个性化
商业化
拥有众多用户,吸引大量广告,为电子信息增值服务提供广阔空间
智能信息检索
由抽次检索与全文检索发展而来,以检索词的相关度为基础,对检索词具有较高的判断能力、理解能力和处理能力的人工智能型检索系统。
信息检索可视化
是可视化技术在信息检索中的应用,是把文献信息 、用户提问及各类情报检索模型以及信息检索中不可见的内部语义关系转换成图形,在一个二维或三维的可视化空间中展示出来。
智能问答系统(siri/京东客服)
智能问答的实现基于海量的语料库,整理之后建立基于知识的分类模型,这些分类模型用以支撑信息服务,实现信息处理的自动化,这些智能问答系统一问一答的服务模型,方便精确定位用户需求,实现实时交互,大大提高个性化服务程度。
中国知网(CNKI)
概念:全名是国家知识基础设施工程,是以实现全社会知识资源传播共享与增值利用为目标的信息化建设项目。由清华大学、、清华同方发起,创建于1999年6月,通过中国知网提供服务。
源数据库
《中国学术期刊网络出版总库》
《中国博士论文全文数据库》
《中国重要会议论文全文数据库》
《中国年鉴网络出版总库》
合作数据库
《外文学位期刊库》
《外文学位论文库》
特色文献数据库
《中国高等教育文献总库》
《中国党建期刊文献总库》
知识仓库
《中国法律知识仓库》
《中国医院知识仓库》
检索方式
导航检索
逻辑式检索(布尔、向量空间)
智能辅助检索
检索结果的排序方式:按相关度、发表时间、被引频次、下载次数