导图社区 第五章信息组织
概念:以标题词作为主题标识,以词表预先确定的组配方式标引和检索的主题法。所谓标题词,亦称标识,是指通过词汇控制,用来表达文献主题的标识,大多是对文献内容所论及事物名称及特征的规范表达。
编辑于2022-03-20 12:08:04第五章 信息组织(上)
信息组织
任务:人们从不同渠道收集到的信息,需要进行加工整理,实质有序化,存储到响应的系统和介质中,才能提供利用。
概念:亦称信息整序,是按一定的规则、方法和技术对信息的外部特征和内部特征进行揭示和描述,并按给定的参数和序列公式进行排列,使之从无序集合转换到有序集合的过程。
特征
外部特征:信息物理载体直接反映的信息对象,构成信息外在的、形式的特征,如信息载体的物理形态、题名、作者、出版或发表的日期、流通或传播的标记等特征。
内容特征:信息包含的内容,可以有关键词、主题词、其他知识单元表达
基本内容
信息选择:从采集到的、处于无序状态的信息流中甄别出有用的信息,剔除无用的信息,是整个信息组织过程中的第一步。
信息分析:按照一定的逻辑从语义、语用和语法上对选择信息的内外部特征进行细化、挖掘、加工整理冰柜类的信息活动。是信息描述与揭示的前提和基础,直接影响着信息组织的质量。
信息描述与揭示:根据信息组织和检索的需要,对信息资源的主题内容、形式特征、物质形态等进行选择、分析与记录的过程。
信息存储:将加工整理虚化后的信息按照一定的格式和序列存储在特定的载体上的一种信息活动。其目的是为了让信息管理者与信息用户能快速的、准确的识别、定位和检索信息。
信息组织类型
按表现形式:文字、图像、声音、视频
按信息加工程度
一次信息组织:人们研究或创造性活动成果的直接记录,研究报告、会议文献、学术论文,原始资料,较零散、分散、无序,难以获取,查准率低,逻辑相关性较差
二次信息组织:是对一次信息进行加工、整理后的一种信息,是信息从分散、无序到集中、有序的书目控制过程,重要作用是为查找一次信息提供线索。
三次信息组织:是在一次和二次信息的基础上,经过分析、综合等加工而成的。这类信息包含文献著录、编辑者、信息加工者的创造性劳动,信息所含知识是经过鉴别、提纯和综合的,它们通常被称为情报研究的结果。
按信息传播载体
文献信息源:是信息组织的最主要对象,各种类型的文献,特点是传播信息完整系统,便于积累,便于保管,便于利用。按不同物质载体,分为印刷型、缩微型、计算机阅读型、视听资料型;按不同内容、性质和加工情况,分为一次文献、二次文献、三次文献。
网络信息源
信息组织原则
客观性原则
系统性原则(全局性)
目的性原则
现代化原则
信息组织是信息检索和传播的准备,是信息收集的首项工作
信息组织的思想方法
分类法
根据信息资源的内容属性和其他特征,将资源分门别类地、系统地组织和揭示的方法。用分类号来表达各种概念,将各种概念按学科性质进行分类和系统排列。
特征
按照信息内容的相互关系进行组织
从一定角度出发组织和揭示信息资源
采用一定的标记符号作为一定的排序工具
主要分类法
《杜威十进分类法》DDC
《国际十进分类法》UDC
《中国图书馆分类法》中图法
五大部类,22个大类,51881个类目 G254
主题法
概念:指直接以表示信息资源主题的语词做标识,提供字顺检索途径,并采用参照系统揭示语词关系的标引与检索信息的方法。
特征
以特定事物、问题、对象,即以特定主题为中心集中信息资源
直接以语词作为组织和检索信息的标识
以字顺作为主要检索途径
类型
标题法
概念:以标题词作为主题标识,以词表预先确定的组配方式标引和检索的主题法。所谓标题词,亦称标识,是指通过词汇控制,用来表达文献主题的标识,大多是对文献内容所论及事物名称及特征的规范表达。
标题法采用的工具称为标题词表,是标题词的汇编,也可看做标题词典,《美国国会图书馆标题表》是目前采用最广泛的标题表之一。
优点
标题之间的顺序是预先组配好的,因此先组配式的标题在标引和检索中直接使用,不易混乱
适合从主题出发进行检索,易于查全一项事件的文献
直观、易掌握,检索速度快,对新事物及范围细小的事物容易反映出来,补充修改比较容易
缺点
很难查全一门学科或具有某一属性事物的文献
使用不灵活,不能满足多用途检索
单元词法
单元词是指用来表音信息资源主题的、最基本的、字面上不能再分的词语,单元词法是以单元词作为主题标识,通过字面组配的方式 表达信息资源主题,后组式标识是这种标识的特点。
叙词法
概念:国内也称主题词法,是从自然语言中精选出来的,经过严格处理的语词作为文献主题标识,按照概念组配方式来表达文献主题的主题法类型。
特点:直观性、专指性、适应性强、迅速准确、后组式、多维检索、网络结构
关键词法(百度)
概念:随着计算机的产生,为适应索引编制自动化的需要而产生的新的主题法类型,将文献原来所用的,能描述主题概念的具有实质意义的关键词抽出作为主题标识,基本上不做规范化处理。
类型
题外关键词索引
题内关键词索引
单纯关键词索引
对于语词不加或少加规范,所以相当粗糙,漏检率和误检率极高。但正是由于它不规范,所以标引容易、迅速,才能保证报道的及时性
分类—主题一体化
信息的描述与揭示
信息标引
分析对象的内容属性和外表属性,用特定语言表达分析出的属性或特征,作为信息存储和检索依据的处理过程,他是在对文献信息对象分析基础上发展起来的,称为文献标引。(贴标签)
标引过程
主题分析
了解和认识文献的内容属性和帮助揭示内容的外表属性,将这些属性概括成主题,并用自然语言表述,分析主题概念之间的关系和主题概念因素之间的关系
标识转换
用专门的主题概念或概念因素,构成一定形式的主题标识
标引语言
是表达文献主题概念和检索需求的主题概念的简明性、单义性、关联性的概念标识系统,是根据标引和检索需要编织的专用语言和标识系统。
标引语言词典有《中国图书馆分类法》、《中国档案分类法》、《汉语主题词表》、《中国档案主题词表》
分类语言和主题语言
信息著录
按照一定的规则对信息实体的特征进行描述并著录下来的过程
MARC 机器可读目录,计算机能识别和阅读的一种目录
USMARC 美国国会图书馆机读目录通信格式
CNMARC 中国机读目录格式 091统一书刊号、092订购号、093专利号、094标准号、690中国图书馆分类法、692中国科学院图书分类法、905馆藏信息
元数据
概念:描述数据的数据,信息的信息,用来描述数据的特征和属性,用来描述和组织信息资源、发现信息资源的语言和工具。
作用:元数据是组织数据、各种数据域以及它们之间的相互关系的信息。
从目前使用情况看,元数据的含义与传统领域文献的著录款目相同,是一种电子环境中使用的著录数据。
信息描述的目的,就是以元数据为中介,对信息资源进行各种操作。
信息描述的作用:描述、定位、搜寻、评价、选择
都柏林核心集
(题名、创作者、主题、描述、出版者、类型、格式、日期)
优点:简单易懂、运用灵活、国际通用、可修饰性、可扩展性
RDF资源描述框架
来源:为了能够在网上有效的利用信息资源,使新的、旧的、不同地区的针对不同数据对象编制的各种目录规则和数据格式能长期共存,有必要建立一种能够描述各种目录规则和数据格式的描述方法。
定义:任何一个可被标识的资源都可被一个可选择的属性描述,每一个属性的描述都有一个值。
网络信息组织