导图社区 信息组织思维导图
这是一篇有关信息管理与信息系统的思维导图,主要从层面、目的、要求、控制、标引语言、规范控制依据等方面进行了概述。
编辑于2021-06-23 10:39:45信息组织
含义:根据信息检索的需要,以文本及各种类型的信息资源为对象,用一定的科学规则和方法,通过对其内容特征和外在特征进行分析、选择、描述、序化,实现无序信息流向有限信息集合的转换,从而保证用户对信息的有效获取和利用及信息的有效流通和组合。 信息组织是信息管理的重要活动之一
研究内容
描述(外部特征,内容特征)、处理(信息描述规范,检索语言)、序化
理论层面
研究信息组织的基本规律和理论基础
规范层面
通过描述规范、检索语言的建立,为信息组织的操作提供实施的规范和依据
方法层面
包括操作的技术方法、信息组织的管理、标引规则、描述规则
对象
信息资源
层面
个体
根据信息组织的整体要求和规范,对IR进行描述和处理,并将处理结果纳入系统的过程
总体目标是通过对具体的IR个体处理实现的
总体
根据检索的需要和信息检索的特点,将IR组织成有序的系统的过程
目的
信息检索
信息组织和信息检索的关系
1.信息组织是连接信息收藏和使用的纽带,是信息检索的基础
2.信息组织应根据信息资源的特点和信息检索的需要来实施
3.信息检索是信息组织的目的和归宿,是信息组织的反向过程
4.信息检索必须在已有的信息组织的基础上进行
5.二者皆遵循一定的描述规范和检索语言
检索工具类型
以IR外部的特征为检索依据
以IR表达信息资源主题内容的标识为依据(分类法、主题法)
文献目录(出版单元,书)
通常是以各种媒体的文献单元为对象,对其进行记录、报道、与揭示的工具,包括文献收藏目录和书目。
索引(信息单元)
机读数据库
参考数据库
源数据库,提供源文(CNKI)
网络搜索引擎
文摘
描述文献的外部、内部特征
要求
检全率
抓到中含有的/总含有的
检准率
抓到中含有的/拿出的总数
注意两者是互逆关系
检索速度和系统的及时性
检索速度指用户得到检索结果花费的时间
系统的及时性指该工具是否能将IR短时间内纳入系统,以便提供应用
系统的易用性
对于开发人员,系统是否便于描述和标引
对于用户,界面是否友好、操作是否简单等
检索的成本效益
经济效益(开发费)、社会效益(用户缴纳、产品服务费)
控制
根据信息资源特点以及用户的使用需要
描述控制
描述项目的控制
描述文字的控制
描述级别的控制
粒度,详密程度
描述格式的控制
词汇控制
根据IR标引和检索的需要,对自然语言中的词汇进行选择,规范并揭示其相关性的过程 自然语言->人工语言->机器语言
同义控制
多词一义,使一个概念只用一个语词表达,在对应词之间建立用代参照,扩大入口
标引词:标引和检索的正式标识
非标引词:增加检索入口
词义控制
一词多义,使一个语词只表达一个概念
词间关系控制
揭示词汇间的各种联系,使其成为一个语义相关的系统
词量控制
词组选择和使用的控制
专指度的控制
句法控制
根据标引和检索的需要,通过一定的组词造句的规则,对检索语词的组合方式作出规定(词序问题)
明确引用次序
复合主题标引和检索时,各个主题因素的组合次序
影响因素
学科领域
用户对象
资源特点
主要的引用次序规范
显著性引用次序 柯茨:“事物-部件-材料-行为”
CC的范畴职能引用次序 P(本体)M(物质)E(动力)S(空间)T(时间)
标准引用次序 物质-种类-部分-成分-性质-过程-操作-施动者或工具
中文引用次序 主体-通用-空间-时间-文献类型
作用
1.提高检索系统的通用性
2.不会因组配次序不同造成同一主题文献资源的分散,保证复合主题标引/检索的一致性
3.使标引结果含义明确,避免错误组配关系
4.统一的引用次序有助促进检索系统的规律性和可预见性
使用辅助符号
揭示主题概念间的关系意义,进行检索操作的标识形式
分类
关系符号
都有哪些符号?
语词组配中形成的关系类型
逻辑组配符号
对组配关系实施控制
联系符号
揭示同一文献主题之间的联系强度
职能符号
表示主题标识在组配中的句法职能(标识身份)
关于句式转换
问题:按一定组配次序组织检索系统的情况下,检索入口单一、固定。 通过变动检索语句中预测的位置来提供尽可能多的检索点的方式
分类
轮排转换
依次将每个有检索意义的词轮流排在检索位置上
链式转换
逐次拆卸链环,依次将检索语句中每一个有检索价值的语词作为检索语句的入口
分析转换
每次抽取少量主题词组成组配标题,使所有检索价值的词都可以成为检索入口
相关因素控制
引用关系:相互引用文献
链接关系:超链接技术
用户需求:由此可以判定用户的评价以及该系统的实用性,是直接参考因素
规范控制依据
逻辑知识
概念、外延
概念:是表达事物对象的特有属性或本质属性的思维方式,是检索系统交流的内容
内涵:指概念的含义,即概念所反映的对象的本质属性的总和
外延:指具有该属性的事物对象,即概念所包括的范围
反比关系:概念深,外延小;概念浅,外延多。
概念之间的关系
按照其是否存在共有的外延分类
相容关系
同一关系:具有相同的外延,在标引中可以互相替代
包含关系(属种关系):一个是另一个的真子集。有属种关系的概念不能同时使用。不属于包含关系:整部关系、方面关系、集元关系。
交叉关系:部分外延重合。并列交叉关系
不相容关系
矛盾关系:外延之和等于属概念
反对关系:外延之和小于属概念且相互对立的两个概念之间的关系
并列关系:一个属概念下不存在共有外延的并列种概念之间的关系
限制与概括、分析与综合
限制与概括
限制:增加内涵,缩小外延 概括:减少内涵,增加外延
属概念+种差=种1 种1-种差=属概念
概念的划分
要素
母项
子项(子项的外延和等于母项)
根据(统一的标准)
方法
一次划分与连续划分:两个层次的划分和多个层次的划分
二分法和多分法:划分为两个和划分为多个
复分:以不同根据对同一个概念多次划分
规则
分析与综合
根据概念的构成,将复合主题概念分解成若干个子概念,并通过对子概念的组配,来表达复合主题概念,进行概念逻辑运算(或、与、非)
知识分类
知识分类体系:建立在人类对外部世界的探索和发现的基础之上的,是根据对知识之间关系的了解建立起来的系统
科学分类体系
学科分类体系
事物分类体系
行业分类体系
在信息组织中的作用
信息资源组织的特点
文献保证原则
指信息资源组织应根据信息资源类型、数量等因素进行相应控制
用户保证原则
根据用户需要进行描述控制和词汇控制
信息描述
信息描述工作
含义:元数据创建工作,依据描述规则,对IR的特征进行分析、选择、记录的操作过程
原则:准确、规范、完备
方式:集中编目、共享编目
含义
元数据
作用:识别、定位、检索、选择
用于:描述一个文献资源、解释一个文献资源、找到一个文献源
信息描述规范
信息描述项目
网络
传统文献
详略级次
简要级次(仅有主要项目)
基本级次(主要项目+部分选择项目)
详细级次(主要+全部)
检索点
作用
1.作为排检的依据,确定款目在系统中的位置,供检索点查找
2.决定款目的性质,供组织检索工具使用
规范文档
名称规范控制
标引语言
信息标引
与自然语言的异同
相同:都是一种概念标识系统;都有自己的词汇的语法
差异:标引语言具有简明性、单义性(专指性)、关联性
类型
分类语言/分类法
类名有时不能直接表达类目的含义
要受上位类、下位类、类目注释、相关类目涵义、类目划分规则
分类法
等级列举式分类法
构成原理:概念的划分与概括
用等级表示类目的从属关系,完整列举所有各级类目,定组式,族性检索
分面组配式分类法
巡(轮)、层
列举-组配式分类法
网络分类法与传统文献分类法的不同
揭示角度不同
类目设置特点不同
展开的形式不同
同位类排列方式不同
适用特点不同
标记符号
要求
简短性
表达性
容纳性
助记性
分类
单纯号码:单纯数字、单纯字母
混合号码
例子
标记制度
顺序标记制
层累标记制
顺序-层累标记制
特殊标记技术和符号
特殊标记技术
八分法
双位制
借号法
借下级号
借上级号
借同级号
预留空号法
双位加点法
字母标记法
对应编号法
数字0的使用
特殊标记符号
类号排序
类目体系
基本大类
基本部类
中图法有22个大类
简表
详表
复分表
标记符号
说明注释
类型PPT248
《中图法》
类目间关系
从属关系
并列关系
同位类与同级类
交替关系
相关关系
参见的作用:揭示了类目中被分散了的联系
多重列类法
类目的种类
复分表
性质
共性区分性质
分面组配性质
类型
通用复分表(9个)
专类复分表
类目仿分
主类号匹配
体现因果关系、影响与被影响、比较关系、应用与被应用
使用本
含义
使用本的确定
确定详略程度
局部扩充
局部集中
增加新类
调整说明与注释
基本分类规则
1.信息资源的分类应根据信息资源的性质,按照其各自的特点进行
2.iR的分类必须能体现分类法的逻辑性、等级性、次第性
3.IR必须归入最切合其内容的类
4.类分的文献必须归入用途最大的类。在可以归入多个类的时候,归入效益最大的类中。
5.不能单凭题名、篇名的意义归类。不能确切反应文献内容
6.应注意标引的思想性
引用次序与分类体系建立的关系
引用次序决定着类目体系展开方式,对分类体系的性能有直接影响
引用次序不同,类目体系的功能特点也不同
引用次序决定着类目体系以何种方式集中资源,以及提供什么样的检索途径
一般使用多种引用次序进行解释,满足用户保证原则
主题语言/主题法
与分类法的比较
主题法按事物集中,分类法按学科集中
类型
标题法
标题表
标题词:也称标题,是经过词汇控制,用来标引IR的词或词组,通常为比较定型的事物的名称
词汇控制PPT28
选词控制
定型名词准则
特称准则(专制性原则)
单一性原则
词形控制
语词形式控制
同义控制
词义控制
词间关系控制
多族性准则
对标题形式的控制
论旨从属原则
元词法
元词:概念上不可再分
单元词卡系统:倒排挡。一个词一张表,谁含有他就记下来
特点
产生误配:因为是字面组配,使用关联、职能符号解决
叙词法
概念组配(元词法和叙词法的最大区别)
概念组配与字面组配的区别
1.语词单元不同
2.组配的依据不同
类型
交叉组配
用冒号表达,新概念是参与组配的概念(一般为同级的概念,具有交叉关系)的种概念,具有属分关系的概念不能进行交叉组配
限定组配
用—和,表达,参与组配的叙词性质不同,绝大多是方面组配
联结组配
叙词法(语言):以受控的自然语言作标识,通过概念组配的方式来表达文献主题的一种方式
词汇控制
词间关系控制
2.编制各种索引
范畴索引:分类索引
词族索引:等级索引
轮排索引
分类主题一体化,既分类又等级
双语种对照
关键词法
关键词索引类型
带上下文
不带上下文
分词问题
后控词表
禁用词表
不在标引阶段,在检索阶段,结合等同关系,找到词汇之间的联系,显示相关词,供用户参考使用
发展
网络环境下应用
语义网
本体
自动标引
主题
分类