导图社区 《信息管理学基础》马费成 第三版
本书分信息管理基础理论、信息管理技术方法、信息机构与事业管理、信息管理学科理论四部分。信息管理基础理论包括信息资源理论、信息用户理论、信息流转理论、信息管理理论四章;信息管理技术方法包括信息搜集、信息组织、信息分析、信息提供、信息管理系统五章;信息机构与事业管理包括信息机构管理、信息事业管理两章;信息管理学科理论包括信息管理学基本理论、信息管理学产生与发展两章。 本书内容丰富、体系完整、观点明确,叙述深入浅出,理论联系实际,每章配有练习题。 本书可作为高等学校信息管理与信息系统、信息资源管理、图书馆学、档案学等专业及相关专业的教材或教学参考书,也可供信息管理领域的业务人员和管理人员参考。
编辑于2023-04-15 20:51:53 河南信息管理学基础
第一章 信息与信息管理
一、信息
(一)信息的概念
1.本体论层次
信息是事物存在的方式和运动状态的表现形式。
2.认识论层次
信息是主体所感知或表述的事物存在的方式和运动状态。
3.全信息
同时考虑到事物存在方式和运动状态的外在形式(语法信息)、内在含义(语义信息)和效用价值(语用信息)的认识论层次上的信息称为全信息。
4.社会信息
即为了特定的目的产生、传递、交流并应用于人类社会实践活动,包括一切由人类创造的语言、符号和其他物质载体表达和记录的数据、消息、经验、知识。
(二)信息的特征
1.信息存在的普遍性和客观性
⑴信息是事物存在方式和运动状态的表现,事物的存在和运动无时不有,无处不在,因而信息也就如影随行,无时不有,无处不在。
⑵这种普遍存在着的信息还具有绝对性和客观性。绝对性表现为信息的存在不依主体而转移;客观性表现为信息不是虚无缥缈的东西,它的存在可以被人感知,获取,存储,处理,传递和应用。
2.信息产生的广延性和无限性
⑴宇宙时空中的一切事物都有其存在的方式和运动状态,都在不断的产生信息;而宇宙时空中的事物是无限丰富的,在空间上广阔无边,在时间上无限变化。
⑵因而信息的产生是无限的,分布也是无限的,即使在有限的空间和时间段中,事物也是无限多样的,信息自然也是无限的。
3.信息在时间和空间的传递性
⑴信息产生于事物的存在和运动,但信息可以独立于其发生源而相对独立,可以由其他物质载体携载在时间或空间中传递,在时间上的传递即是信息的存储,在空间中的传递就是通信。
⑵信息在时间和空间中传递的性质十分重要,它不仅使人类社会能够进行有效的信息交流和沟通,而且能够进行知识和信息的积累与传播。
4.信息对物质载体的独立性
⑴信息表征事物的存在和运动,但信息不是事物本身。这种“表征”可以通过人类创造的各种符号、代码和语言来表达,通过各种物质载体来记录和存储,通过光、声、电等能量来载荷和传递。离开这些物质载体,信息便无法存在。这说明信息对物质载体具有依附性。
⑵但信息具体由哪种物质载体来表达、记录和载荷并不会改变信息的性质和含义,这说明信息对物质载体具有独立性。载荷信息的物质载体的转换并不改变事物存在的方式和运动状态的表现形式。这一性质使得人们有可能对信息进行各种加工处理和转换。
5.信息对认识主体的相对性
⑴由于人们的观察能力,认识能力,理解能力和目的不同,他们从同一事物中所获得的信息量也各不相同。
⑵即使他们的这些能力和目的完全相同,但他们在观察事物时,选择的角度不同,侧面不一样,他们所获得的有关同一事物的信息量也肯定不同。信息的这一性质说明实得信息量是因人而异的。
6.信息对利用者的共享性
⑴由于信息可以脱离其发生源或独立于其物质载体,并且在利用中不被消耗,因而可以在同一时间或不同时间被给众多用户利用,这就是信息的共享性。
⑵信息的共享性是信息的一种天然属性(本质属性),它既有积极方面,也有消极方面。其积极方面是信息在时间和空间上可以实现最大限度的共享,提高信息利用效率,节约生产成本;其消极方面是共享给现代信息管理中信息产权的安排和控制带来了很大难度。
⑺信息的不可变换性和不可组合性
信息一旦产生,就表达某种特定的含义,它不是包含在信息中的各种要素的简单算术和,因而不可能将这些要素以任意的顺序排列和以不同的组合加以归并而不损害信息的含义。同样,构成信息的要素也是不能任意分割的。
⑻信息产生和利用的时效性
⑴从信息产生的角度看,信息所表征的是特定时刻事物存在的方式和运动状态,由于所有的事物都在不断变化,过了这一时刻,事物的存在方式和运动状态必然会改变,表征这一方式和状态的信息也会随之改变,即所谓时过境迁。
⑵从信息利用的角度看,信息仅在特定的时刻才能发挥其效用。一条及时的信息可能价值连城,一条过时的信息则可能分文不值。这里主要强调“特定时刻”,利用者要善于把握时机,只有时机适宜,信息才能充分发挥效用。
(三)信息的分类
1.按信息描述的对象划分
自然信息,生物信息,机器信息,社会信息
2.按信息的性质划分
语法信息,语义信息,语用信息
3.从利用者观察的角度和过程划分
实在信息,先验信息,实得信息
4.按信息的传递方向划分
纵向信息,横向信息,网状信息
5.按信息的内容划分
经济信息,科技信息,政治信息,文化信息,政策法规信息,娱乐信息
6.按信息的作用来划分
有用信息,无用信息,干扰信息
7.按信息的运行状态划分
连续性信息,间隔性信息,常规性信息,突发性信息
8.按信息的流通渠道划分
正式信息,非正式信息
9.按信息的记录方式划分
语声信息,图像信息,文字信息,数字信息,计算信息
10.按信息的来源划分
内部信息,外部信息
(四)信息链中的数据、信息与知识
信息链由事实——数据——信息——知识——智能五个要素构成。在信息链中,与信息紧密相关的是数据和知识。
1.数据
⑴数据:是载荷或记录信息的按照一定规则排列组合的物理符号。它可以是数字,文字,图像,也可以是声音或计算机代码。
⑵人们对信息的接收始于对数据的接收,对信息的获取只能通过数据背景和规则的解读。“数据+背景=信息”
2.信息
信息:是数据载荷的内容,对于同一信息,其数据表现形式可以多种多样。信息告诉我们:“这组符号表达什么。”
3.知识
⑴知识:是信息接收者通过对信息的提炼和推理而获得的正确结论,是人通过信息对自然界,人类社会以及思维方式与运动规律的认识与掌握,是人的大脑通过思维重新组合的,系统化的信息集合。知识告诉我们:“这组数据意味着什么。”
⑵知识的传输模式:传输者的知识→数据→信息→接收者的知识。可见,信息能够转化为知识的关键在于信息接收者对信息的理解能力,对信息的理解能力取决于接收者的信息与知识准备。信息只有同接收者的个人经验、信息与知识准备结合,也就是同接收者的个人背景融合才能转化为知识。“信息+经验=知识”
⑶由此可见,知识的获取只能通过学习和体验(实践),而人的认识能力和理解能力为数据转化为信息,信息转化为知识,以及知识的有效融合,新知识的创造提供了必不可少的条件。
4.智能
⑴智能:是解决问题的一种能力和方略,是在一定环境下针对特定的问题和目的而有效地获得信息,处理信息形成知识和策略,利用策略来解决问题,从而成功地达到目的的能力。
⑵智能是被目的所激活的知识,是知识在一定条件下的运动方式。
关系
从以上信息链中的相关概念出发可以认为:
数据是信息的原材料,而信息则是知识的原材料,知识的趋向是要成为人们决策的智能方法。其中数据的外延涵盖范围最广,信息次之,知识最小。
二、信息化与信息社会
(一)信息与物质和能量
⑴物质,能量和信息是支配人类社会发展的三大基本要素,并称当代社会的三大支柱性资源。物质提供材料,能量提供动力,信息提供知识。
⑵人类社会中物质和能量不断从生产者流向使用者,这种客观存在的物质与能量流在人的认识中反映为关于这种物质和能量运动的信息。物质与能量流的运动也表现为另外的各种形态的物质与能量的流动,即相应的文献,数据和信号的运动,其总汇构成信息流,可以认为信息就是社会生产领域中物化的流。
⑶信息流反应物质能量流的运动,社会借助信息来控制物质能量流的运动,左右它们的运动方向,进行科学分配,实行有效管理。
(二)信息化
1.信息化概念
信息化:由于信息、信息技术在当今社会经济发展中不可取代的巨大作用,无论政府还是各行各业都在最大限度地利用信息技术,充分开发信息资源,提高自身的效能和效率,人们把这种现象称为信息化。信息化是社会发展到一定阶段的必然产物,其兴起有着深刻的社会、经济和科技背景。
2.信息化内涵的包含要素
⑴信息资源,信息本身作为一种资源,在量的积累上必须要达到一定的高度,比较普遍地存在于人类社会的各个领域;
⑵信息技术,现代信息技术与网络技术的普及、利用程度不断提高;
⑶信息观念,人们对信息的重要性以及其价值认识得到加强,人们教育水平和核心素养提升;
⑷资源共享,通过快速有效的信息交流实现信息资源在全社会范围内的充分共享,产生社会和经济效益。
3.信息社会
⑴概念
信息社会:是继农业社会,工业社会之后人类社会的新形态。在信息社会中,信息成为比物质和能源更为重要的资源,以开发和利用信息资源为目的的信息经济活动迅速扩大,逐渐取代工业生产活动成为国民经济活动的主要内容。
⑴信息社会的特征
①信息、知识和智能是社会发展的决定力量;
②信息技术、信息产业、信息经济成为科技、经济和社会发展的主导因素;
③信息劳动者、知识阶层将发挥更大的作用;
④由于信息技术的广泛应用,对经济和社会发展产生了巨大而深刻的影响,从根本上改变了人们的生活方式、行为方式和价值观念。
(补充:社会信息化)
1.概念
社会信息化:是指人类社会发展过程中的一种特定现象,在这种现象出现时,人类对信息的依赖程度越来越高,而对物质和能源的依赖程度相对较低。(是以计算机信息处理技术和传输手段的广泛应用为基础和标志的新技术革命,影响和改造社会生活方式与管理方式的过程。)
2.社会信息化的三个层次
⑴生产工具信息化:经过自动控制,知识密集而实现。
⑵社会生产系统信息化:经过对生产行业、部门以至整个国民经济的自动化控制实现。
⑶社会生活信息化:经过通信系统、咨询产业以及其他设施实现。
3.社会信息化的发展阶段
普及信息工业阶段、建立与发展先进的通信系统阶段、企业信息化阶段、社会生活的全面信息化
三、信息管理概述
(一)信息管理的概念及对象
1.信息管理的概念
⑴狭义:信息管理就是对信息本身的管理,即采用各种技术方法和手段对信息进行组织,控制,存储,检索和规划等,并将其引向预定目标。
⑵广义:信息管理不单单是对信息的管理,而是对涉及信息活动的各种要素(信息,人,机器,机构等)进行合理的组织和控制,以实现信息及有关资源的合理配置,从而有效地满足社会的信息要求。
⑶本书:对信息管理是持广义的理解。认为信息管理的实质就是人类综合采用技术的,经济的,政策的,法律的,人文的方法和手段,对信息流(包括非正规渠道和正规渠道中的信息流)进行控制,以提高信息利用效率,最大限度地实现信息效用价值为目的的一种活动。
2.信息管理的对象
⑴信息资源
①狭义的信息资源概念是把信息资源等同于知识、资料和信息,即只是指信息本身的集合。
②广义的信息资源概念就是指信息、信息技术和信息人员的有机集合。它是一个涉及信息生产,处理,传播,利用等整个信息劳动过程的多要素的概念。其中包括信息劳动的对象——信息,信息劳动的工具——计算机和通信技术等信息技术手段,信息劳动者——信息专业人员。上述三个要素相互联系相互作用,共同构成了具有统一功能的有机整体——信息系统。
⑵信息活动
①信息从产生,传播到收集,加工,再到吸收,利用的过程,就是一个完整的“信息生命周期”。信息活动就是信息资源的开发利用过程。
②人类社会的信息活动包括三个基本层次:即个人的,组织的和社会的信息活动。
个人的信息活动表现为个人对信息资源的开发利用,其效率与个人的信息意识和信息能力有关,并且受个体信息环境的影响;
组织的信息活动常以各类信息系统的形式出现,信息系统的发达程度能够反映出各级组织的信息资源开发利用水平。
随着信息活动的发展规模不断扩大,信息资源的开发利用对人类社会进步的影响日益显著,在社会整体上就体现为一种新兴产业——信息产业的形成和发展。
(二)信息管理的目标和任务
1.信息管理的目标
⑴总目标
保证社会信息流在不同渠道中有序流动,信息的开发和利用,在有领导,有组织的统一规划和管理下协调一致,有条不紊的进行,使各类信息以更高的效率,效能,更低的成本在国家社会进步,经济发展,人民物质文化水平提高中充分发挥作用。
⑵分目标
①信息的生产与开发分目标:主要是根据社会经济的发展来合理组织规划信息的生产和开发,确保相关的潜在信息能及时地、经济地转化为现实的信息资源,供人们使用。
②信息利用分目标:主要是按照社会化,专业化和产业化的原则合理组织信息的流通和分配,确保信息能够得到充分有效的利用。
③信息管理机制分目标:按照社会信息过程的特征和规律,建立科学合理的信息管理机制,完善信息开发利用的保障体系。
2.信息管理的任务
⑴宏观层次
①制定信息开发战略、策略、规划、方针和政策,使信息的开发活动在国家统一指导和管理下有条不紊地进行,使信息的开发不仅成本低,价格廉,而且能很好地满足国民经济和社会发展的总体需要。
②制定信息管理的法律,规章和条例,建立信息管理的监督和保障体系,使信息管理真正有法可依,有章可循,使生产和开发的信息能够得到充分,及时和有效的利用。
③综合运用经济,法律和行政手段协调各部门,各地区和各企业之间的关系,明确各级信息开发利用机构的责、权、利界限,使信息开发利用在平等互利的基础上最大限度实现资源共享。
④加强国家信息基础设施和网络建设,使信息的生产,开发利用和管理具有良好的硬件环境支持。
⑵微观层次
①调查和了解组织或机构内部各类人员信息需求,制定一个满足不同需求的折中方案,以最大限度地满足不同的需求。
②搞清组织或机构内外信息来源和信息获取渠道,以便在需要时获取所需要的信息或向外传输信息。
③选择适用信息技术,建设组织或机构内部信息系统和网络,确定信息加工处理,存储,检索和传递方法,建立组织或机构内部的高效信息保障体系。
④对信息管理的绩效进行评价,为改善信息管理提供依据。
(三)信息管理的视角
1.技术视角
信息管理者研究用手工方式和计算机方式对信息进行收集,加工处理,使之有序化存储,便于快速检索并传递给特定的利用者。这一直是信息管理研究的重点和目标。
2.经济视角
主要研究以信息的生产,流通和利用为基础的信息市场,信息产业,信息经济的形成,发展,特征和运行模式,信息资源的优化配置,信息技术的评价选择以及信息经济效益评价等方面的问题。信息经济学是该视角下信息管理与经济学相互交叉的研究领域。
3.行政和法律视角
立足于政府职能,运用行政手段和法律手段对信息活动进行调节和控制,着眼于协调和解决社会信息化过程中出现的新矛盾,新冲突,新的利害关系,促进社会更充分的利用信息,更好地发挥信息的社会功能,为实现某种发展目标服务。信息政策与信息法律是该视角下的典型研究领域。
4.人文视角
立足于研究信息流控制中的道德,伦理,文化因素的影响和建设。尤其是在网络环境下,人们的信息行为仅仅依靠行政和法律手段是难以有效约束的,必须通过人文精神的培养来规范人们的行为,对信息活动进行管理。在此视角下信息伦理,网络伦理的研究对日益受到人们关注。
随着人们对信息技术,信息管理的迅猛发展及其与人类社会相关性的认识不断深入,一个动态的跨学科的研究正逐渐兴起——社会信息学。 (社会信息学:是从信息技术与组织机构和文化背景相互影响的角度对其设计,使用和共同进行的跨学科研究,是以一个计算机化的社会方面为研究对象的新领域,包括信息技术在社会和组织变化中的作业,以及社会的组织和实践对信息技术发展的影响。)
(四)信息管理流程:信息生命周期管理(ILM)
1.信息生命周期管理的含义
信息生命周期管理(ILM):是一种信息管理模型,对信息进行贯穿其整个生命周期的管理,从创建到使用到归档和处理,它是一种针对信息主动管理的过程策略,其宗旨在于保护信息传播的连续性。
2.信息生命周期管理的阶段
⑴信息创建(产生/发布)阶段
创建阶段是信息生命周期的初始阶段,是进行信息生命周期管理的起点。除了原先规范的信息机构等信息生产者之外,目前有相当一部分的信息在网络环境下由用户而产生,因此信息的发布具有很大的自由度和随意性,这就对信息创建阶段的规范性提出了更高的要求。在信息创建阶段需要保持文档格式,规范以及元数据描述的一致性。
⑵信息采集阶段
采集是信息资源的开发和利用的基础和起点。首先需要制定信息的采集政策,明确信息采集的内容和范围,之后采用相应的采集方法。关于信息采集的方法通常有两种:手工收集和自动获取。手工采集的优点在于信息在采集前要接受手工的一致性检查,可以避免机器无法识别的错误。自动获取方式则可以利用相应的网络程序来抓取捕获网络上的信息资源,特别对动态更新的信息,这种方式的效率更高,但其也存在信息价值无法判断的缺陷。
⑶信息组织阶段
这一阶段的任务是为信息集合提供有序化的结构,使之形成一个有机化的整体,以便于对信息的存取和利用。具体来说就是采用一定的方法将所采集到的大量的,分散的,杂乱的信息经过筛选,分析,标引,著录,整序,优化,形成一个便于用户有效利用的系统的过程。
⑷信息存储阶段
信息存储是实现信息价值的基础,该阶段的主要任务是依托相关存储应用技术,将存储在相应载体和介质上的信息从不可得状态变为可得状态,可得状态变为可用状态,低水平的使用状态变为高水平的使用状态,使得信息的管理,共享,保护,备份,恢复,复制等功能用自动化的方式实现;在存储网络中建立服务等级层次,将信息转移到相应的服务等级层次中。
⑸信息利用阶段
信息利用是信息生命周期管理的宗旨,信息利用是用户对所提供的信息有效地运用的过程。信息生命周期管理的主要目标是确保信息可以支持业务决策,为企业和用户提供长期的价值。因此信息必须便于访问和利用。信息利用阶段采用的主要方式包括:建立专业的数据库;提供专业信息导航;开展信息增值服务。
⑹信息清理(销毁/回收)阶段
随着信息老化失去价值,许多信息总会在一段时期后没有再继续保存的价值。这时需要制定相关政策,对没有保留或保存必要的信息进行清理或销毁。被清理或销毁的信息将从活动和非活动系统,以及数据仓库等系统中清除。对一些不能轻率地进行销毁操作的信息,需要对其进行迁移。因此这一阶段的主要工作就是建立科学明确的数据回收(销毁,清理,迁移)的规则。
3.基于管理视角和基于价值视角的信息生命周期管理的区别
⑴二者对信息生命周期阶段的划分方法不同。
①管理视角更多的是从管理角度出发,在跟踪一类型产品实际加工的具体流程或现有处理的业务流程上予以提炼,将信息的生命周期过程予以分解。
②价值视角主要是通过或试图通过定量的方法,根据一定的测度指标来客观的描述和模拟信息的生命演化进程,然后根据生命曲线来划分阶段,或者设定一些定量的识别指标来自动识别生命周期阶段。
⑵两者描述的信息生命起点不一样。
①价值视角是以信息产生以后为研究起点,如文献发表,专著出版等。
②管理视角则涉及信息生成之后是如何被采集,组织,存储和利用的。
四、信息管理的沿革及发展
(一)传统管理阶段
这一阶段以信息源管理为核心,以图书馆为象征,同时也包含档案管理和其他文献资料管理。虽然人类对知识信息的保存与管理早已有之,但作为一项专门的工作和事业的信息管理则是在图书馆出现之后才兴起和发展起来的。
⑴图书馆是人类社会生活发展到一定阶段的产物。收藏和整理文献记录成为早期图书馆的存在方式和活动内容。随着社会经济,科技,文化的发展,文献记录的类型大量增加,图书馆作为最初的文献收藏机构,逐渐与档案馆分流,成为知识和文献收藏整理和提供利用的社会信息交流中心机构即形成了独立意义上的图书馆。
⑵图书馆对文献的收藏以文献的利用为目的。为有效解决“藏”和“用”之间的矛盾,图书馆引入了管理的概念。它除了包括对文献本身的管理外,还包括对机构,人,文献整理和提供过程的管理,因而已具有相当的综合性和现代信息资源管理的意识。
⑶由于文献信息的利用在时间和空间上的分布都非常复杂,图书馆并不知此时此地之“藏”何时何地才能被“用”,这使得许多图书馆不得不着眼于文献信息源的收全藏全,以备日后难以预料之用。这就是图书馆重视“源”的管理的根本原因。
⑷20世纪40年代后,情报危机开始出现,在科技领域出现了一类新兴的专职信息服务机构——科技信息机构。从本质上看,科技信息机构与图书馆之间并无特殊差别。尤其是在大量采用现代信息技术时的图书馆从书籍世界进入信息世界的背景下,图书情报服务更具一体化。20世纪60年代以后,两者都更重视“管理”并向“信息管理”发展过渡。以“信息源”为核心,以文献为主要载体,以公益性服务为主要目标的传统管理阶段正在向信息管理阶段发展,从重视“源”的管理向注重“流”的控制过渡。
(二)技术管理阶段
这一阶段以信息流的控制为核心,以计算机为工具,以自动化信息处理和信息系统建造为主要工作内容。显然,这是在计算机技术及相关信息技术的高度发展和广泛应用背景之下发展起来的新兴信息管理模式。
①计算机具有科学计算功能和信息处理功能。20世纪40年代成功研制出第一台计算机,计算机发明研制不到十年就被应用于图书馆的文献信息加工和管理,目的是要提高文献信息加工处理和查找效率,实现对文献信息流的控制。
②随着计算机技术的发展,计算机处理功能越来越强,使人们对文件的加工有可能从宏观层次向微观层次深入,从文献的局部信息扩展到全文信息,极大地提高了人类对文献信息的处理和管理能力,提高了图书情报中心对文献信息流的自动化控制程度。
③技术管理阶段着眼于计算机技术处理信息并对信息流进行控制,技术因素占主导因素,技术专家唱主角。这一阶段围绕计算机应用创造了许多信息加工处理方法,系统设计开发理论。过度追求最先进技术的应用,完全忽视了信息管理中其他因素的作用。
(三)资源管理阶段
信息资源管理这一概念的提出基于两个背景:一方面是技术管理阶段,纯粹的技术手段不能实现对信息的有效控制和利用;另一方面,也是更重要的原因,是当代社会经济发展使得信息成为一种重要的资源,迫切需要从经济的角度思考问题,并对这种资源进行优化配置和管理。
⑴二十世纪70年代以后,人们开始关心人对于技术引起的变化作何反应,以及人对于技术应用的影响,并着手利用行政的,法律的,经济的手段,从微观与宏观结合上协调社会信息化进程中的各种矛盾,冲突和利益关系,妥善处理信息管理中人与物的复合关系,这样就逐步形成了信息资源管理的思想和观念。
⑵20世纪90年代以后,以互联网为基础的全球信息高速公路彻底改变了人类信息活动的方式。但是,高速信息网并没有通过高度的技术发展带来一个真正高效有序的信息空间,相反,网络的迅速扩张带来的信息污染,信息混乱,信息犯罪,信息侵权,远远超出了传统意义上的情报危机。
⑶目前网络数字信息资源管理方面的研究,主要可分为以下几个方面:①网络资源 ②图书馆 ③信息网络 ④信息检索 ⑤信息组织 ⑥元数据 ⑦用户服务 ⑧评价 ⑨信息资源共享 ⑩信息资源开发利用 信息环境
(四)知识管理阶段
知识管理正是在克服信息管理固有的缺陷基础上发展起来的,是一种重视与人打交道的信息管理活动,其实质是将结构化与非结构化的信息与人们利用这些信息的规则联系起来。知识管理的前提是信息及信息系统的准确性,及时性,可用性,并能够以易于利用的方式提供信息。知识管理的主要目标是改善组织或机构获取,共享和利用知识的能力。
⑴知识管理的实现必须以相应的信息技术为条件,其成果最容易技术成果的形式表现出来。20世纪80年代以后,人工智能,专家系统技术的发展对知识管理的产生发挥了较大作用,由于这些技术的发展和应用,提出了知识获取,知识表达,知识库系统,知识工程这样一些在知识管理中广为应用的是基础性概念。20世纪90年代中期,随着互联网的普及和应用,知识管理迅速推广。
⑵ 目前,知识管理系统,知识共享,知识转移,知识管理策略是知识管理的重点主题。从技术上看,知识管理可分为三个阶段:①以知识库为中心的知识管理阶段;②以小范围知识社区为中心的发展阶段;③以社会计算,动态知识及其表现为代表的新的知识管理阶段。目前Web2.0在知识管理,社会网络和语义学之间建立一种联系,这必将促进基于语义网的知识管理的发展。
第二章 信息交流
一、信息交流的基本概念
(一)信息交流的分类
1.自然信息交流
自然信息交流完全是自然物,包括非生物之间,生物之间以及人与非生物及生物之间的信息交流与作用。这种作用或影响过程完全应循自然规律和法则,与人类的主观意识不相关联。是纯自然的信息交流,亦即本体论层次的信息交流。
2.人与自然的信息交流
人与自然的信息交流是一种半自然,半社会的信息交流,是一种半意识化的信息交流,这种交流方式除了遵循自然的规则外,也随人的认识而发生改变。(认识和改造世界)
3.人与人的信息交流
人与人的社会信息交流过程是人的主观意识的相互作用。这种交流方式也是最复杂,最高级的信息交流形式,它依赖于交流者双方的意识及双方的行为,而交流行为既受心理因素的影响,又因循一定的社会规则,同时与社会的其他方面相联系,构成整个社会运行的一个大系统。
(二)信息交流的含义与特征
1.含义
信息交流:是指不同时间或不同空间上的认知主体(人或由人组成的机构、组织)之间借助于相应的符号系统所进行的知识,消息,数据和事实等信息的传递与交流的过程。
(共时/横向信息交流:在同一时间平面上实现,即此时此地或此时彼地的交流。主要功能是克服交流的空间障碍,达到及时的信息共享。交流手段包括:互联网、传真、电话、电报、广播、电视、口语、实物等。
历时/纵向信息交流:在不同时间平面上,纵向考察人类社会的信息联系。主要功能在于消除交流的时间障碍,填补过去和现在的鸿沟,将古代与现代联系起来,为集中和发展提供条件。交流手段包括:刻制光盘、拷贝磁盘、录音、录像、照相、绘画、文献、档案、古迹、文物等。)
2.特征
⑴无论哪种形式的信息交流过程必须有一个信息传递者S,他是信息的初始来源,实际上是信息生产者;一个信息接收者R,他实际上是信息的最终利用者。
⑵信息交流过程可以是直接的,如同时对面交流,也可以是间接的,如非同时、非对面交流。对于间接交流,至少应该有一个“人参与”的环节,我们将这种信息传递称为信息链。信息链的节点可以是人,也可以是由人生成、传递的文献或其他形式,还可以是几种形式的混合。
⑶信息交流实质上是一种单向传递,信息的流动永远是S流向R,是一种时间不可逆过程。
⑷信息的来源必须是他人头脑S所提供的信息,而不是直接从自然或社会观察而获得信息。
⑸信息交流还必须是交流双方的目的行为,即S与R均是要故意传递与接收信息。R有信息需求,S有目的地提供。
(三)信息交流行为
1.人的行为
⑴目的行为
信息行为(言语、书写、身势等)
非信息行为(体力劳动、机器操作等)
⑵非目的行为
潜意识状态下的行为
2.信息交流行为
⑴输出行为(S行为)
书写、言语、实物样品、绘画、符号特征等
⑵接收行为(R行为)
阅读、艺术品欣赏、电话、电视收听收视等
(四)信息交流的条件和要素
1.信息发送者
也称信息传递者获信息生产者。它是信息的初始来源,是信息传递链上的初始环节,一般不是指信息机构,图书馆,文献中心等信息传递的中继站。
2.信息接收者
或称受信者。它是信息的最后接受者或利用者。
3.交流通道
即信息达到受信者所经过的渠道。对于S和R而言,他们发送和接受信息的基本通道仍是交流双方的感官系统,包括视觉,听觉,味觉,嗅觉,触觉等,其他通道或技术系统仅仅是这些感官通道的扩展,延伸或变换。
4.符号体系
它是信息传递交流时依附的载体。包括语言,文字,手势,表情,信物,计算机语言等,同时还包括这些符号体系内部各符号元素之间互相联系与组织的方式及规则。
5.知识信息库
它是人脑知识信息的总称,包括人所创造的各种知识和信息,是信息交流的最根本来源和最终极的归宿。
6.支持条件
它是信息交流得以实现的保障。包括:①自然条件,如光、、电、空气在传导信息时的作用;②技术条件:包括各种通信技术、存储、处理技术等;③社会条件:即信息交流的社会保障体系,如法律、政策、经济条件、信息机构及相关组织的建立。
二、信息交流的模式
(一)香农-维弗的通信模型
该模型把信息交流描述成一种单向的线性过程,整个过程有五个环节构成。⑴信源负责发出要传递的信息,⑵此信息会经过编码器编码而采用与所经渠道相适应的信号形式到达解码器,⑶解码器的功能与编码器相反,⑷它将接收到的信号还原为信息并发送到交流的目的地,即信宿。⑸噪音,指一切传播者意图以外的,对正常信息传递的干扰,由此会造成信息失真。
通信模型所面向的是机器之间的信号传递,它反映出一种原始朴素的信息传播思想,为后来的许多交流传播过程模式奠定了基础。但同时该模型也存在一些局限性,并不完全适用于人类社会的信息交流传播过程。
(二)拉斯韦尔的“5W”模式
5W模式,即用五个问题的回答来描述传播行为,分别是谁(who),说了什么(say what),通过什么渠道(in which channel),对谁(to whom),取得了什么效果(with what effect)。5w模式界定了传播学的研究范围和基本内容。影响极为深远。
该模式在强调信息发送方,接收方和交流渠道的同时,开始注重信息本身的内容,以及交流和传播的效果,特别是对分析政治性传播与宣传十分适用。
(三)施拉姆模型
提出了信息交流的三个模式。第一个模式与香农-维弗的通信模型十分相似。第二个模式中,施拉姆把交流的简单模式推进为一个较为复杂的模式,他指出两个试图交流的个人必须积累有相当的共同经验,即在信源和信宿之间,只有在其有共同经验的范围之内才真正有所谓的交流。第三个模式中施拉姆模式又进一步发展成一个表明人类交流的两个个体之间有相互作用的模式,这个模式也被称为施拉姆“循环模式”。此外还提出了能充分体现大众传播特点的“大众传播过程模式”,认为构成传播过程的双方分别是是大众传播与受众,二者之间存在着传递与反馈关系。
施拉姆模式的特点在于引进了反馈的概念,将反馈的过程与交流者的互动过程联系起来,把信息交流理解为一种互动的循环过程。这种模式更符合人的信息交流的实际情况。
(四)维克利的S-C-R模式
S代表信息源,C代表交流渠道,R代表信息接收方。信息交流就是信息从信息源出发,经过各种渠道和媒介,而后传递到信息接收方的过程。从形式上看,S-C-R模式的三个要素分别对应于通信模型中的信源-信道-信宿。而与通信模型的机器信号传递相比,S-C-R模式强调的是人本社会传播,与信息源和信息接收方一样,信息渠道也受到社会的影响,因而对信息交流和传递的考察是放置在社会背景下来进行的,其间涉及许多人文因素,如社会地位和认知对个人吸收信息的影响等。
维克利认为信息交流和传递本身往往是交互的、双向的,因而S-C-R模式中的各个要素之间的联系应是双向性的。
(五)A.И.米哈伊洛夫广义的科学交流系统模式
美国社会学家H.门泽尔提出了著名的“正式过程”和“非正式过程”交流模型,在这种模型下,社会中的信息交流被分为正式交流和非正式交流。这一理论经苏联情报学家,教育家A.И.米哈伊洛夫整理得到了广义的科学交流系统模式。这种模式将科学交流分为正式交流和非正式交流。
1.正式交流:是通过科学文献信息系统或“第三方”的控制而进行的信息交流。 优点:⑴获得的信息可靠程度高;⑵能够从大量的文献当中找到有关某一课题详细、全面的科学信息;⑶不需要与信息生产者本人见面。 缺点:⑴信息传递不及时;⑵通过文献查找科学信息需要一定的方法和技巧。
2.非正式交流:是指科学家、研究人员之间通过个人接触进行的信息交流,如彼此之间关于所作研究的直接对话,参观同行的和科学技术展览,对各类听众做口头演讲,交换信件等。 优点:⑴信息间隔时间短;⑵选择性和针对性强;⑶传递信息时反馈迅速;⑷对所得到的信息易于理解,并能给出恰当的评价。 缺点:⑴信息的可靠性和准确性难以检验;⑵往往只有少数人有参与直接交流的机会;⑶不可能为以后的加工进行情报积累。
三、信息交流机制
(一)社会信息流的形成
社会信息流是一种普遍存在社会现象,是信息从生产者R经过或不经过其他社会环节,最终转移到利用者R的流动过程。S与R是通过社会信息流来联系的。
(二)信息交流与传播中的栈
1.信息栈(W):是信息从S向R流动过程中所经过的环节。它必须是人或人工系统,如出版机构,信息机构,广播系统,图书馆等,其功能是接收,处理,存储和传递信息。
2.栈交流:有信息栈参与的社会信息传播过程,称为“栈交流”。
3.零栈交流:S与R的直接交流称之为“零栈交流”。
(三)直接交流与社会代理交流
按照交流过程中有无信息栈参与,信息交流可以分为直接交流(零栈交流)与间接交流(栈交流)。
1.信息交流中的社会代理(中介)
是指信息交流双方(S或R)在信息交流过程中,由于无法直接将信息传递给另一方(R或S),于是将信息交流行为转移到社会中的信息栈,由信息栈代理S或R来传递交流信息,从而完成信息交流。信息栈被称为代理者(A),栈交流被称为社会代理交流。
2.直接交流与社会代理交流的区别
⑴直接交流是S-R的直接联系,它的媒介系统是纯自然的和客观的,没有社会因素的介入。而社会代理交流则是借助于社会系统的介入才完成的交流。直接交流生动,直观,反馈迅速,时间间隔短,而社会代理交流,则没有这些特征。
⑵直接交流中源信息(即S提供的信息)或需求信息(R提出的信息)是直接沟通的,是S或R的直接联系,其信息内容不会受到社会系统的干预和控制。而社会代理交流的源信息和需求信息均需由A代理,受A的影响。另一方面,许多专职的社会代理信息机构对信息的传播具有监督和评价功能,比较严谨,直接交流则具有较大的随意性。
⑶S-R直接交流时,都是共时交流,而社会代理交流中,既有共时交流,又有历时交流。
⑷直接交流是S-R关系,社会代理是S-A-R关系,但S-A-R关系可以转换成S-R关系,因为A是代理者。
⑸当A出现多级代理时,根据其传递性特点,可以将与其直接联系的一次代理视为全部代理。
(四)信息传递模式
1.多向主动传递
这种方式是S或A针对整个社会的需要将自己生产或收集到的信息主动传递给事先未确定的接受者R。网上提供的各种目录,索引,文摘等工具就属于多向主动传递模式。
2.单向主动传递
这种方式是S或A在调查了解用户需求的基础上,将信息传递给事先确定的接受者R,它的主要形式是定题服务。这是专业信息服务中的高级阶段,所传递的信息具有针对性和及时性,能充分发挥其效用。这种方式一般是S或A与R之间有固定的和较为密切的合作关系,S,A了解R的信息需求,从而能够准确,及时地提供信息。
3.多向被动传递
这种方式事先也没有确定的接收者,是A面向整个社会开展的信息服务,如图书馆,信息中心的书刊资料阅览和借阅服务,网站信息服务等。在这里,来到信息中心或图书馆的用户,点击网站信息的用户是主动的,而信息传递本身是被动的,故也称为无向被动传递。
4.单向被动传递
这种方式主要指由S或A开展的信息咨询服务。S或A往往不了解R是谁,他们需要什么样的信息,而是根据自己掌握的知识,经验和信息资源接受R的咨询。咨询是由R提出问题,对S或A来说是被动的,而信息传递的对象又是特定的咨询者R,而所以这种信息传递称为单向被动传递,也称为有向被动传递。
上述传递模式特点的比较
⑴多向主动传递是专业信息服务开展的各种信息传递中最基本,最重要的信息传递,它构成信息服务和信息管理工作诸环节的核心,以它为中心环节形成信息管理的工作流程。
⑵多向传递一般较单向传递容易,因为单向传递具有特定的目标,需要A花许多精力和时间去了解特定用户的需求,难度自然增加。与被动传递比较主动传递较为容易,因为有较为充裕的时间进行准备。
⑶有向传递是信息服务的理想目标,只有定向,才能将信息传递给特定的利用者,从而最大限度的发挥信息的效用。有向传递中最大量的是有向被动传递,有向被动传递开展以多项主动传递为基础,反过来又可以发现多向主动传递中存在的问题和缺点,从而加以改进,使信息传递过程中各个环节不断改进和完善。
四、网络信息交流
(一)网络信息交流的兴起
网络作为一种新兴的信息载体,与传统的载体相比,具有许多不可比拟的优势,主要表现在:
⑴网络的传播与更新速度快,提供了最快捷,最便利的传播方式;
⑵信息量大,内容丰富,在信息数量和信息类型上,对于传统印刷型出版物是无法想象的;
⑶检索方便,人们通过搜索引擎E-mail,论坛等获得所需信息,容易获取并便于保存;
⑷超文本和多媒体的结合,数据中包含与其他多媒体形式信息的链接,丰富了网络信息内容,增加了网络亲和度;
⑸交互性强,这是网络媒体最独特的特征之一,用户通过网络的交互性,可以及时获取信息以及其他用户的回应和反馈,形成双向交流。
(二)网络信息交流的模式及特点
1.网络信息交流模式
⑴该模式中,信息用户分为四种,分别为:
①网络信息的生产者,主要是原始信息的生产者,它既可以是个人,也可以是群体,如政府,企业等。
②网络信息发布者,将原始信息通过信息技术手段发布在网络上,使用户通过浏览页面,通过信息执行者得到所需信息。
③网络信息执行者,作为某个中间环节执行信息使用者的信息需求,然后将执行后的信息传给请求信息的用户。
④网络信息使用者,是指接受并利用信息的个人或群体。
在主要交流渠道中,信息生产者生产的信息经信息发布者发布到互联网上,互联网不仅包括专用网络,公用网络,还包括各种其他的网络,信息使用者可以通过各种渠道利用信息。由于信息交流是一个双向的过程,信息生产者也可以是信息使用者,信息发布者也可以是信息执行者。同一用户在网络条件下可以扮演多种角色。网络信息的生产者与使用者可以重合。
⑵根据网络信息交流模式,可以将网络信息交流过程分为三个阶段:
①信息产生阶段。信息生产者的信息通过信息发布者发布到互联网上。原始信息的来源很广泛,一方面是出版者全面建立和提供数字化期刊,向网站提供远程,虚拟的数字化馆藏以及检索,传递和长期保存服务,形成可广泛利用的数字化信息资源体系。另一方面信息生产者可以直接在网站上生产信息。这样信息生产者也行使了信息发布者的职责。
②信息交流阶段。信息生产者和信息使用者借助于计算机或终端,通过Internet或Web站点进行的网络信息交流活动。从信息流的角度看,该模式信息交流过程隐含有以下几种最基本的信息流动过程:a)信息生产者-网站-信息生产者,表示信息生产者与网站进行信息的沟通与反馈。b)信息生产者-网站-信息使用者,表示信息生产者将自己生产的信息通过网站传递给某个或多个信息使用者。c)信息使用者-网站-信息使用者,表示信息使用者与网站进行信息沟通与反馈。d)信息使用者-网站-信息生产者,表示信息使用者将自己的需求信息通过网站传递给某个多个信息生产者。这四种最基本的信息流动过程,还可以复合成不同的交流过程。
③信息获取过程。信息使用者直接浏览网页或通过搜索引擎向网络发出请求,通过信息执行者得到所需信息的过程。
2.网络环境下的正式交流与非正式交流
⑴传统信息交流:①非正式交流:是指信息在信息源和信息用户间的直接传递,诸如座谈,谈论,报告,展览,演示,参观等,具有明显的个体性。 ②正式交流:是指信息部门借助于文献信息系统,以文献为媒介,向信息用户进行信息的间接传递,如文献的搜集,整理,存储,检索,综合,研究,分析,提供等,其基本表现是已经正式出版发行的文献的交流,具有明显的社会性。 二者的主要区别是信息源和信息用户是否通过文献信息系统并以文献为媒介进行信息的传递。
⑵网络环境下的信息交流可以根据是否有专职信息人员的参与分为:正式信息交流和非正式信息交流。①在信息由信息源到信息用户的信息存储和传递过程中,有专职信息人员参与的交流为正式交流;②反之,没有专职信息人员参与的,自发性的个体交流属于非正式信息交流。这种划分方法的实质是以交流信息有无过滤和控制为标准的,对交流信息进行严格审查控制,并将其通过信息系统传递出去就是正式交流过程,反之就是非正式交流过程。
⑶网络环境下非正式交流相对于传统非正式交流具有一些明显的优势:①网络非正式交流可以不受时间和空间的限制,更加方便,大大提高了交流的效率。②网络非正式交流的间隔时间更短,交流更迅速,更快捷,可非常方便地以实时方式与同行进行切磋交流。③网络非正式交流的成本更低。
3.网络信息交流中的栈
我们把网络信息交流所需要的载体,使用工具和平台统称为网络信息交流的中介。根据中介对信息交流内容控制度的不同,可以将其划分为纯技术型中介,内容选择控制型中介和内容完全控制型中介。与之相对应,可以将网络信息交流分为零栈交流,准栈交流和有栈交流。
⑴①纯技术型中介:是指仅提供网络信息交流的技术支持系统,不参与对交流内容的控制。 ②零栈交流:是指在网络信息交流过程中仅有纯技术型中介的参与,只是提供物理技术层面的支持,对交流内容不做干预和控制,如发送E-mail,QQ交流,微信交流,手机短信等。
⑵①内容选择控制型中介:是指可对交流内容进行过滤控制,但仅做删除或屏蔽,而不对内容进行组织整理,例如BBS,个人网站,Blog,新闻组等。 ②准栈交流:即是指内容选择控制型中介参与的交流,如果中介没有对交流内容进行过滤操作,则对用户来说相当于零栈交流;如果中介对交流内容做出了删除或屏蔽的操作,对用户来说则相当于有栈交流。
⑶①内容完全控制型中介:是指对网络信息进行采集,控制,组织,存储,发布和管理的中介。 ②有栈交流:就是指由内容完全控制性中介参与的网络信息交流。如各大期刊数据库商,各大网站,数字图书馆等机构。它们具有一整套严谨的信息接收处理和传递的操作规范,对信息进行质量控制,序化等处理,对信息内容的控制程度最强,在信息交流过程中担当了非常充分的信息栈角色。
(三)移动信息交流
移动信息交流是在移动网络兴起和发展下的一种新兴的信息交流方式。移动网络是指从可连接到无线网络的移动设备上使用互联网连接的应用程序或基于浏览器访问互联网。
移动网络的特点表现在:①持续的网络连接性;②位置感知;③交互功能。
(四)网络管理下的科学信息交流
1.科学信息交流的含义及特点
⑴含义
①科学信息交流过程:是指从科学信息的发布者到信息用户之间各个环节的信息工作流程,是专门针对科学信息的一种信息交流过程。一般可分为科学信息的发布,传递,组织,存储,检索和服务等几个基本环节。
②正式交流:通过科学文献系统,利用科学文献载体进行交流的过程被视为正式交流,又称间接交流过程。
③非正式交流:主要依靠科学家,专家之间的个人接触来进行,被称为非正式交流,又称为直接交流过程。
⑵特点
①信息流程浓缩和融合,职能角色要素淡化,整个交流活动以信息流动为主。
②信息流速加快,流量加大。
③信息机构的虚拟化。
④信息交流方式增多,非正式信息交流地位提升。
2.科学信息交流的工具和及应用
ResearchGate,Mendely,Academia,科学网,学术公众号等
补充
信息失真的表现形式及其主要原因
⑴主要形式:①物理失真;②语义改变;③语用衰减
⑵主要原因:①技术或通道障碍;②信息栈过多;③社会因素;④自然因素
第三章 信息分布
一、信息产生与分布中的马太效应
(一)马太效应的表现和作用形式
1.马太效应
在社会信息流的产生,传递和利用过程中,我们发现信息及相关因素常常表现出明显的核心趋势和集中取向,如少数出版社会成为某类图书的权威出版机构,少数作者因写得最多,被引率最高而成为某一领域的核心作者,少数网站集中了大量用户等,这就是信息产生和分布中的马太效应。
马太效应在人类社会中普遍存在,因而被广泛的引申和应用。马太效应真实地概括了人类社会生活中的惯性,描述了优势和劣势的积累过程:一经存在有优势,这种优势局面就会不断加强,反之若处于劣势,则这种不利条件也会继续加剧。
2.马太效应在文献信息分布中的表现
由马太效应引起的信息富集分布表现为核心趋势和集中取向。
⑴核心趋势:如高产作者群体的形成,期刊信息密度增大,高频词汇的确立等,都是信息生产主体的主动期望与采取实际步骤的结果。
⑵集中取向:如一篇论文多次被引,一个网站被众多用户点击,某些图书频繁地被借阅,这种富集是社会选择和影响的结果,信息生产者基本上处于被动状态。
(二)马太效应的影响
1.马太效应的积极影响
⑴在实际的信息管理工作中:它可以帮助我们突出重点,摒弃平均,为信息源的选择,获取,评价和利用提供依据,为降低信息管理成本,提高信息利用效益提供指导和方法。
⑵在理论上:马太效应描述的优势可以帮助我们认识信息集中和分散的特征,趋势和规律,发现信息管理学的基础性定律。
2.马太效应的负面影响
⑴马太效应描述信息对象的优势和劣势过度积累,容易使信息工作者按简单的优势进行进行信息选择,评价,传播和利用,走入极端,使信息工作者因循守旧,不思进取,不求变革创新,按经验和简单的规则从事复杂多变的信息管理工作。
⑵马太效应所形成的信息分布富集有时仅仅是表面的、外在的。例如一篇论文被引次数多不一定表明它有较高的价值,一些有错误观点或有争议的论文也可能有较高的被引率。有的优势积累过程带有突发性和受统计学因素的影响,使得信息价值失真。
⑶核心信息源是马太效应优势积累的结果,但如果过分注重核心信息源,就会忽略分布在其他信息源中有价值的信息。而核心信息源(如核心期刊)本身有一个发育过程,如果不加以控制,任其在某一方面的优势过度积累,高度专门化,所含的信息就会越来越单一,这对部分用户可能有利,但它却会失去更多的用户,不利于信息管理和信息服务。
⑷信息生产者的成长和数量对信息的产生和分布具有较大影响,马太效应青睐名人,拒绝新人的习惯势力不利于新人成长,限制了新思想,新知识和新信息的产生与传播。以科技领域为例,所谓杰出新人的出现和成长由于受马太效应的影响是很困难的,除非做出划时代的成果一名惊人。然而循序渐进又是人才成长的普遍规律,一鸣惊人也需要长期积累,社会扶植,不断突破。业已证明,人类的最佳创造年龄段在25岁~45岁之间,但由于马太效应的视差,使得这一年龄段的新人和他们取得的成果被忽略,未能有效汇入社会信息流。
由以上分析可知,马太效应的积累要适度,不能任其发展,为保证信息产生和分布比较科学合理,适当的干预是必需的。
二、信息内容的离散分布规律
(一)布拉德福定律
英国著名文献信息学家布拉德福发现,某一学科领域中的相关论文在期刊中的分布是不均匀的,而且具有明显的集中与分散规律。他在长期的观察和统计基础上提出了有名的“布拉德福分散定律”,简称为布拉德福定律或布式定律:“如果将科学期刊按其刊载某个学科主题的论文数量,以递减顺序排列起来,就可以在所有这些期刊中区分出载文率最高的‘核心’部分和包含着与核心部分同等数量论文的随后几区,这时核心区和后继各区中所含的期刊数成1:a:a²的关系(a>1)
(二)齐夫定律
如果将一篇较长文章(约5000字以上)中每个词按其出现频次递减排列起来(高频词在前,低频词在后),运用自然数给这些词编上等级序号,出现频次最高的为1级,其次为2级…这样一直到D级,如果用f表示词在文章中出现的频次,用r表示词的等级序号,则有fr=c,c为常数。上式称为齐夫定律。(通过词频分布来揭示信息的分布规律)
(三)网络信息的内容分布
在网络条件下,信息资源的分布仍然满足集中与分散的规律,但是网络条件下的信息发布环境与传统期刊出版条件相比有很大不同,因而这种集中与分散程度表现出了变化。
三、信息生产者分布规律
(一)洛特卡定律
1926年,美国统计学家洛特卡经过大量统计和研究,发表了一篇题名为“科学生产率的频率分布”的论文,旨在通过对发表论著的统计来探明科技工作者的生产能力及对科技进步和社会发展所作的贡献。直到1949年这一研究成果才引起学术界关注,并誉为洛特卡定律。据洛特卡分析,在论文数x和作者数yx之间存在着下列一种关系:xⁿyx=c,可进一步写成:f(yx)=c/x²,这就是著名的平方反比分布。
(二)普赖斯定律
受洛特卡定律的启示,普赖斯提出了核心生产者分布的“平方根定律”,即在某一特定领域中,全部论文的半数系由该领域中全部作者的平方根的那些人撰写的。“那些人”无疑是核心或高产作者。该定律可表示为:∑(m+1~1)n(x)=√N,它简洁地描述了信息按生产者能力的分布。
(三)网络信息的生产分布
网络条件下的信息生产表现出不同的规律,生产者的分布与信息内容的专业化程度密切相关,信息专业化程度越高,则生产者的集中程度就越明显;反之,生产者的分散程度就越明显。
四、信息对时间的分布规律
(一)指数增长率
1.普赖斯曲线: 如果我们以文献量为纵轴,以历史年代为横轴,把各不同年代的文献量在坐标图上逐点描绘出来,然后以一光滑曲线连接各点,则可以十分近似地表征文献随时间增长的规律,这就是著名的普赖斯曲线。通过对曲线分析,普赖斯最先注意到文献增长与时间呈指数函数关系。
2.生长曲线:普赖斯指出,考虑物质的,经济的,智力的及时间的影响和限制,文献信息的增长更趋近于生物的生长曲线,即最初生长或繁殖很快,随着时间推移,其生长速度越来越慢,以致几乎不增加了。
(二)逐渐过时率
1.文献半衰期:是指某学科领域现时尚在利用的全部文献中的一半是在多长一段时间内发表的。“半衰期”大体上与某学科领域的文献中半数失效所经历的时间相同。
2.普赖斯指数:即某一学科领域内,对发表年限不超过5年的文献的引用次数与总的引用次数之比值。一般来说,普赖斯指数越大,半衰期就越小,文献老化的速度越快。
3.文献信息老化的影响因素
⑴文献增长:文献的老化首先是与文献的增长联系在一起的。文献大量增加,表明科学知识增长速率加快,新理论,新方法,新设计不断产生,不断完善,原来知识内容不全面,不完善的旧文献逐渐被人们遗忘,引用频率降低。如果引用半衰期的概念,就会发现文献增长得越快,文献的半衰期就越短,这就加速了文献的老化。
⑵学科差异:不同学科的文献老化速率差异很大。有些学科,如电子,医学,化学化工等领域,由于研究工作活跃,不断需要新方法,新试验,投入的人力物力较多,知识更新快,文件的半衰期就短。而另一些学科,如动植物分类学,地理学等的发展主要是知识的积累,不是修正,所以相对来说稳定得多。
⑶学科发展阶段的差异:即使是同一学科,不同的时期或阶段,文献的半衰期不尽完全相同。学科处于诞生和发展初期,文献量指数增长,文献的老化符合负指数函数,对应的曲线表现为负指数曲线。随着学科研究的深入,进入相对成熟期后,科学文献增长不再继续保持原有的指数速率递增,文献增长速率变小,其相应的老化曲线也变得平缓,半衰期加长。
⑷信息环境和需求:不同信息用户对文献的需求是不同的,科研工作中的骨干要了解本学科领域的世界前沿,因而对新文献感兴趣,刚刚踏上工作岗位的人员则还需要了解背景资料。此外国家与国家,地区与地区之间对文献使用的年代也不完全相同,科学发达的国家对近期最新感兴趣,欠发达国家则需要借鉴别国已有的成果和经验。
(三)网络信息的时间分布
1.网络信息的增长规律
⑴单一网站网页数量的增长规律。在处于成熟期的,仅存在正式交流过程的单一网站中,网页累计数存在二次曲线增长规律。
⑵特定学科/主题领域中网页数量的增长规律。指数增长模型在网络环境下研究知识管理主题领域网络学术信息增长规律时具有很强的适用性。
2.网络信息的老化规律
网络信息的老化是指网络信息中情报的有效价值随着时间的流逝逐渐衰减,利用率逐步降低。造成网络信息老化的因素主要有:
⑴网络信息的增长。由于网络信息总量的快速增加,单位量的网络信息利用率降低,效用价值减少,呈现出老化的特征。
⑵网络信息的更新。新的网络信息的出现,导致旧的网络信息加速老化。
⑶网络信息的消失。是指网络信息从系统中删除,不能再被访问和利用,这意味着网络信息生命周期的结束。
⑷网络信息的语用衰减。语用是指网络信息对于接收者的效用价值。随着接收者需求的实现,虽然网络信息的客观价值没有改变,但接收者的效用价值却因为他已接受了同类信息而降低。此外,网络信息的价值受时间的制约。
⑸其他。内因如网络信息的类型,性质和发展阶段等;外因如科技的进步,用户需求的变化和社会环境的变化的等。
3.网络信息半衰期
⑴借鉴文献半衰期中的被引半衰期和引用半衰期的定义
①网络信息被引半衰期:是指某一站点的全部信息在某一时间段内被引用或被链接的所有信息中较新的一半是在最近多长时间内发表的。
②网络信息引用半衰期:是指某一站点的全部信息在某一时间段内引用或链接的所有信息中较新的一半是在最近多长时间发表的。
⑵以网络信息研究对象特征对网络信息半衰期定义
①宏观网络信息资源半衰期:是指某主题领域网络信息资源所含链接的链宿所指资源中较新的一半是在多长时间内产生的。
②微观网络信息资源半衰期:是指指向该网络信息资源的全部其他网络信息资源的1/2是在发布后的多长时间内出现的。
4.网络信息生命周期
是指网络信息从产生到失去效用价值所经历的各个阶段和整个过程。
第四章 信息获取
一、信息源的概念、属性及特征
(一)信息源的概念
信息源:人们在科研活动,生产经营活动,文化活动和其他一切活动中所产生的成果和各种原始记录,以及对这些成果和原始记录加工整理所得的成品(如数据库,文摘索引杂志等)都是借以获得信息的源泉,简称信息源。
(二)信息源的属性和特征
1.信息源的基本属性
⑴客观性
信息源中所蕴含的信息是人类一切思维和社会活动的反映,信息源是人类知识和记忆的物质载体是客观的。第一,它是一种客观物体;第二,信息源中所包含的知识存在的反应。
⑵可传递性
信息源是信息传播过程中的第一要素,只有通过传播到达接收者并得到利用,才能发挥其作用。
⑶可激活性
信息可被感知,识别和利用,人脑对信息源的信息内涵进行感知,思维,分析,综合,联想的过程就是激活信息源中的信息,使其总是处于不断传播与使用的循环中,在循环过程中信息可以不断得到调整,补充,改编与重组,使其所含内容的针对性更强。
2.信息源的特征
⑴信息源的积累性
由于信息是将人类的知识记载在物质的载体上,因此我们可以用物质的手段进行搜集,整理,积累,使得人类所创造的知识,文化,技术可以不断地延续,继承和发展。
⑵信息源的复杂性
由于信息是一切物质的普遍性,所以信息源的类型,载体的形态都具有复杂性。它数量巨大,内容丰富,形式多样,随着人类社会的发展,科学技术的进步而迅速增长。
⑶信息源的再生性
信息源与其他物质财富不同,它使用后不会消耗,反而会产生“增值现象”。同时信息源本身也可以再生,从原始信息源产生出二、三次信息源。
⑷信息源的共享性
信息源接收者并非是独占使用者,信息源可以传播至不同接收者同时使用,具有可共享性。
二、信息源的分类及其特征
(一)记录型信息源(文献信息源)
记录型信息源:包括由传统介质和各种现代介质记录和存储的知识信息,如各种书籍,期刊,数据库,网站等。特点是:传播信息系统,便于保存,便于积累,便于利用。它是信息存在的基本形式,也是信息管理的主要对象。
1.按不同的物质载体
⑴印刷型:包括铅印,油印,胶印,木板印刷等。这是一种有着悠久历史的传统形式,由于阅读利用方便,至今仍广为流传,成为传播信息的主要形式。其缺点是体积大,分量重,收藏要占很大空间,管理较为困难。
⑵缩微型:一般指以感光材料为载体,利用光学记录技术使印刷型文献按比例缩小的文献资料,包括缩微胶卷,缩微胶片和缩微卡片等缩微品。
⑶计算机阅读型:它是将文字和图像转换成二进制数字代码,记录在磁带,磁盘或光盘等载体上。阅读时再由计算机将它输出,转换成文字或图像。它能存储大量信息,并以极快的速度从中取出所需信息。
⑷网络型:网络信息源:是一种新型的数字化信息资源,是通过网络可以利用的各种信息资源的总和,指所有以电子数据形式把文字,图像,声音,动画等多种形式的信息存储在光,磁等非纸介质的载体中,并通过网络通信,计算机或终端等方式再现出来的资源。它直接在网上产生,发布,存储和传播,如各类网络书刊,网络新闻,网站信息等,可以下载存储在其他载体上。
2.按不同内容、性质和加工情况
⑴一次信息:凡是在科研,生产、经营,文化及其他各类活动中生产的原始信息,称为一次信息,如期刊论文,研究报告,市场调查报告,专利说明书及各种网络信息。
⑵二次信息:是对一次信息进行加工整理后产生的一类信息,如书目,题录,简介,文摘等形式的检索工具。二次信息的重要作用不仅在于报道,更重要的是为查找一次信息提供线索。
⑶三次信息:是在一次,二次信息的基础上,经过分析综合而产生的信息。人们常把这类信息称为信息分析研究的成果,如综述,述评,学科年度总结,文献指南,书目之书等。
3.按编辑出版形式的不同特点
图书、期刊、会议资料、专门报告、专利资料、政府出版物、学位论文、产品样本、档案、标准、新闻报纸等。
(二)实物信息源
实物信息源存在于自然界和人工制品中,是由实物携带和存储的知识信息,人们可通过实践,实验,采集,参观等方式交流传播,如某种生物的样品,产品样机,工艺品等。实物信息源直观生动,含有丰富的信息,易于理解和吸收。这类信息源不能直接进入信息系统,要对其进行管理,必须先将它转换成记录性信息。
(三)智力型信息源
这类信息源主要指由人脑存储的知识信息,包括人们掌握的各类知识,诀窍,技能和经验,有的可以用语言和文字明确表达和记录,有的则难以明确表达和记录,故又被称为隐性知识。这类信息由人的活动携带,根据社会需求提供各类咨询服务,帮助用户解决问题。对这类信息源主要通过政策,法规来进行组织,协调和管理。
(四)零次信息源
零次信息:是人们通过直接交流获得的信息,是信息客体的内容直接作用于人的感觉(包括听,视,嗅味,触觉)的结果,而不像记录型信息和实物信息那样通过某种物质载体的基础形式发生作用。因此零次信息具有直接性,及时性,新颖性,随机性,非存储性等典型特征。
这类信息源是指各种渠道中由人的口头传播的信息。零次信息的存在形式,传播渠道具有较大的随机性,难以存储和系统积累,给这类信息管理带来了很大困难,需要采用特殊的方法搜集,记录,整理和存储。
三、信息质量的评价
信息质量评价的意义
信息质量评价是以用户的需求和满意度为导向,从多角度,多层次对信息的质量进行评估,其目的是为人们提供高质量的信息资源,以更好地满足信息用户需求,具有十分重要的理论意义与实践意义。
第一,信息质量评价有利于提高信息源的利用率;第二,能够促进提高信息源的质量;第三,能够客观地反映信息源的社会影响力或学术影响力;第四,能够提高信息资源管理的效率;第五,能够净化信息环境。
(一)信息质量评价的一般维度与指标
信息质量是一个全面的概念,包括四个维度:准确性、完整性、一致性和及时性。
1.基于信息内容的评价维度与指标
信息内容的评价是对信息资源的内在质量进行判断和估算,是最根本、适用性最广的评价维度,主要涉及正确性,完整性,相关性,新颖性这四个指标。
2.基于信息表达形式的评价维度与指标
信息主要通过符号来表达和传递,信息用户只能通过信息表达形式来理解和利用信息。因此信息的表达形式是评估信息资源质量的重要维度,包括信息表达的准确性,可理解性,精简性以及标准化程度这四个基本评价指标。
3.基于信息资源系统的评价维度与指标
信息资源系统由各类信息资源活动要素组成,该系统性能的优劣是信息质量高低的直接体现。基于信息资源系统的评价维度主要涉及信息的可获取性,快速响应性以及可靠性三个指标。
4.基于信息资源效用的评价维度与指标
这是从信息用户的角度来评价信息质量。这种评价方式可以识别出目标用户,发现信息资源内容与用户期望之间的直接差距,主要包括信息的可用性,适量性以及价值增值性三个重要指标。
(二)信息质量评价的方法与实施
1.信息源的评价与选择
⑴信息源的评价要达到两个目标:①确定信息是通过哪种信息载体、从什么样的信息源获得的;②确定信息发生的意图和可靠性。
⑵搜集到各种信息之后,首先将它们按信息源的类型分开整理。然后检查各类信息源所携带的信息是否正确可靠,是不是附加了某种限定条件等。按信息源整理信息不仅能够很好地掌握其分类范畴,而且还可以系统地检验、评价信息的意义和价值。
⑶此外,还可以根据利用信息源的目的来划分各类信息源。对于综合性利用的信息源,也应按其不同的目的将综合利用的形式按类分开,这样就能使信息源有序化,对其中使用率较高者进行经常性的信息跟踪和监视。
2.信息质量评价的基本方法
⑴定性评价法
定性评价方法:是根据信息评价目的和服务对象的需求,依据一定的准则,首先确立评价标准,建立相关指标体系,进而对评价对象实施评价。
常见的信息质量定性评价法包括:问卷法,访谈法,观察法,对比法,模拟法,同行评议法。
⑵定量评价法
定量评价法:是将反映信息质量的指标用具体的数字、公式客观地表示出来,主要采用统计、数学或经济模型的方法。
常用的定量评价方法包括:信息熵评价法,信息计量学评价法(文献计量学、网络计量学),统计类评价法
⑶综合评价法
综合评价方法:是将定性与定量方法结合起来使用的一种评价方法。
常用的综合评价方法包括:层次分析法,模糊综合评价法,关联矩阵法,评价性元数据方法,信息构建方法等。它们是开展信息评价,尤其是网络信息资源评价的重要方法。
3.信息质量评价的实施
⑴明确评价目标
信息质量的评价涉及信息,信息服务以及信息用户等诸多方面,在评价之初应该明确评价的具体对象,确定评价的主要目标。
⑵分析论证评价对象
根据评价目标从多种途径收集有关数据,资料,对评价对象的各个要素及性能特征进行全面分析,论证评价对象的必要性,可行性,建立评价指标体系,制定评价的准则。
⑶列举并评估方案
方案评估是信息资源质量评价活动的中心环节,每个待评估的方案都应该有清晰的评价要素,评价方法等。
⑷选择最佳方案
通常根据经济性,便捷性,有用性原则来选择最佳方案。
⑸进行评价
四、信息获取途径
(一)信息获取的效率指标
这些指标一般通过信息内容与信息需求的相关程度,即切题性或相关性的概念来确定。
⑴采全率
采全率用来衡量切题信息搜集的完整程度,指某一信息系统所含的全部切题性信息在当时系统内外所有切题信息中所占的比例。信息采全率可表示为:P=r/R
⑵采准率
采准率用来衡量信息搜集的针对性,指某一信息系统所含的全部切题信息,在当时该系统所有信息中所占的比例。E=r/Q
⑶及时率
及时率用来衡量信息搜集的速度,即在最短的时间内完成信息搜集过程的能力。它由搜集过程的每一环节(从信息的产生到其被输入到信息库)所花费的总时间来计算。T=∑(i=1,n)t
⑷费用率
费用率用来衡量信息搜集的资金效率,指用于信息库中单位信息的费用的最低能力。它取决于搜集过程的组织、各环节的技术装备及其他因素。C=F/G
⑸劳动耗费率
信息搜集的劳动耗费率指信息系统搜集到的单位信息所耗费的最低劳动量,可用搜集过程中所有环节的劳动消耗总数来计算。L=∑(i=1,n)li
在信息搜集的上述效率指标中,当采全率和采准率达到一定程度之后,二者之间将呈现出一种反向互逆关系,即在及时率,费用率和劳动耗费率既定的情况下,采全率越高,采准率越低,反之采准率越高,采全率就会越低。
(二)信息搜集的原则
1.针对性
⑴任何信息服务机构搜集信息的目的都是为了提供利用,因此必须根据本机构的性质,任务和服务对象有针对性地确定信息搜集的范围和重点。
⑵为了准确的搜集信息,必须仔细调查信息需求和信息来源。①首先要弄清楚信息机构服务对象的范围以及他们经济,科技,文化和其他方面的历史,现状,趋向及其对信息的需求和利用状况;②其次,要弄清他们所需要的信息的分布状况;③最后弄清楚通过什么渠道,何种载体获得这些信息。这样就能在搜集信息时做到胸中有数,加强针对性,避免盲目性。
2.系统性
⑴信息服务系统要卓有成效地开展信息服务,满足用户的信息需求,需要追踪科学技术和国民经济发展进程,了解和掌握信息源的动态变化,系统地、连续地搜集和积累有关的信息。信息的连续性和系统性是信息发挥其效用的前提条件,可分为纵的系统和横的系统。纵的系统按产品,工艺,学科,专业或专题进行积累;横的系统可按信息的载体或类型进行积累。
⑵只有连续地,系统地搜集和积累信息,才能充分发挥信息服务的效用,尤其是重点信息源的搜集,更应力求保持系统,连贯和完整。如果一个信息服务系统搜集和积累的信息缺乏连续性,系统性和完整性,就不能在需要时满足用户的需求,从而使信息服务丧失信誉。
3.预见性
⑴由于信息的增长和老化不断加速,在信息搜集中不仅要充分注意现存的信息源和信息渠道,还要着眼未来,预见可能产生的新的信息源和信息渠道。只有这样才能既满足当前的信息需求,又适应未来发展所带来的信息需求。
⑵为此,应密切注视科学技术和经济的发展水平、动向和趋势,随时留意新信息源和信息渠道的产生及发展,预测信息源的集中与分散,增长与老化趋势,充分估计用户未来的信息需求,有预见性地搜集信息,提高信息服务的主动性。
4.科学性
当代信息源数量庞大,形式多样,内容重复分散,品种繁杂,给信息的选择和搜集带来了极大的困难。因此需要经常采用科学方法研究信息源的分布规律,选择和确定信息密度大,信息含量多的信息源。
5.计划性
⑴任何一个信息机构,要用有限的人力,物力和经费获取最有效的信息源,就必须事先制定比较周密,详尽的信息搜集计划,以便按计划有目的,有步骤地搜集信息。
⑵信息搜集计划从时间的角度可分为长期,中期和短期计划或年度和季度计划;从其内容角度可分为综合计划,专题计划,补配计划。搜集计划的项目一般包括:搜集信息的内容范围,重点信息和一般信息的划分及其比例,采购标准,经费预算,完成计划的主要措施和保证等方面。
(三)信息搜集的方法与途径
1.采购
采购是一种经常性的,稳定的,系统的搜集和获取信息的有效方式,无论对团体还是个人都非常适用。采购包括订购,现购,邮购,委托代购等具体方式,可以根据采购规模和自己的需要进行选择。
2.调查
用调查方式不仅可以获得记录型信息源,还可以获得非记录型信息源,尤其是零次信息。调查既包括访谈,也包括对实物,现场的实地考察搜集,如现场调查,访问,发放问卷,样品收集等。
3.交换
利用本系统所拥有的信息源与其他单位或系统进行交换,互相调剂,互相补充,扩大信息来源,包括传统的文献信息交换和网络信息或数据交换。
4.索取
对于尚未发表的信息或不通过正式渠道流通的信息源,以及已经发表或公开流通,但还不够详细完备和全面的信息源,根据需要与可能,可以通过通信联系或直接派人联系取得,这种方法成为索取。
5.检索
即以手工方式或计算机方式从各类不同的数据库和信息系统中查询所需要的信息。手工检索主要通过各类检索工具获得信息源的线索,如果需要原始信息,还要进行二次检索。计算机检索不仅可以获得信息源的线索,还能直接获得原始信息。
6.网络爬取
利用网络机器人Robot或网络蜘蛛Spider定期到指定的网站去自动抓取部分或全部网络信息。
五、网络信息获取与利用
(一)网络信息源及其特点
网络信息源:是一种新型的数字化信息资源,指通过网络可以利用的各种信息资源的总和。具体地说,就是指所有以电子数据形式把文字,图像,声音,动画等多种形式的信息存储在光、磁等非纸介质的载体中,并通过网络通信,计算机或终端等方式再现出来的资源。与传统的信息源相比,网络信息源的特点主要表现在:
1.信息数量大,内容丰富
互联网是一个开放的数据传输平台,上面的信息资源数量巨大,类型多样,如学术,商业,政府,个人,娱乐,新闻信息等。它一方面给用户提供了较大的信息选择空间,另一方面大量无价值的冗余信息也给用户带来了很大的麻烦。
2.信息更新及时,变化加快
由于网络技术的发展,与传统信息源相比,网络信息源变化更加快捷新颖,且数据量在不断增加。
3.信息表现形式多样化
互联网有着表现形式丰富的信息资源,如声音,图像,文字,视频,动画等,在多媒体形式表现的同时,用户跟信息之间的交互性得到极大的增强。
4.信息非线性排列,无序性增强
网络信息源利用超链接,构成了立体网状信息链,把不同国家,不同地区,不同内容,不同格式的信息通过节点链接起来,使得信息之间的关联度增强。但同时无序性的状态也日益突出。
(二)网络信息的获取
1.搜索引擎
作为网络信息组织的重要方式,同时也是网络信息检索的重要工具,搜索引擎通过在互联网上提取各个网站的信息来建立自己的数据库,并向用户提供查询服务,它一般有三部分组成:信息搜索器,索引器,检索器。
(搜索引擎:是指接受用户的提问,检索数据库,并将与用户提问相匹配的信息对象反馈给用户的检索工具。广义地讲,搜索引擎不仅指检索程序本身,而且还指检索界面,相关的入口,程序,以及支持它的索引数据库和服务。)
2.数字图书馆
数字图书馆:是一种馆藏以数字化格式存储,可以利用电脑访问的图书馆。数字化的内容可以被存储在本地端或通过电脑网络由远程访问。数字图书馆可说是一种信息检索系统。
(数字图书馆:保存数字格式存储的电子文献,并通过计算机和网络传递所藏数字化信息,同时对网上信息进行虚拟链接,并提供服务的实体性或虚拟性的信息机构或信息机构群。)
数字图书馆的资源类型主要有:①全文资源,包括电子期刊,电子图书,电子报纸,开放式著作检索,发表及存档数据库,电子博硕士论文,电子档案等;②二次文献和书目信息,包括联机检索目录,文摘索引数据库等;③多媒体资源,包括独立静态图像,动态图像,录音资料,动画等。
3.学科信息门户
学科信息门户:是用户访问某学科资源与服务的一个单一入口或通道。它是一种网络服务,用以完成本学科网络资源内容的高度组织集成和网络应用程序的聚集,并将这些资源与应用集成在一个可定制个性化的界面中,来满足每个最终用户的需要。从用户角度来看,它是某学科用户访问该学科网络资源和服务的起始站点或入口。
学科信息门户的核心特征:①信息和应用的集成整合;②跨系统一站式检索;③简单统一界面;④可定制。
4.开放数据平台
在大数据背景下,政府机构、联盟纷纷制定应对大数据战略的对策,并以开放数据为重要组成部分甚至核心。在科学研究领域,开放数据正在成为推动数字学术交流和科学研究的关键角色。顺应开放数据的发展趋势,在各方政策的共同推动下,越来越多的研究数据仓储平台被建立,并提供数据的公共访问获取。
5.社会化问答平台
社会问答平台:又被称为问答社区或者问答平台等,是一种基于社区的,鼓励用户参与以实现网上互动的平台,其本质是通过信息共享与传播以及问答过程和结果的公开来实现用户间的共同协作。
第五章 信息组织
一、信息组织的基本原理
(一)信息组织的概念与内容
1.信息组织的概念
信息组织:亦称信息整序,是利用一定的规则、方法和技术对信息的外部特征和内容特征进行揭示和描述,并按给定的参数和序列公式排列,使信息从无序集合转换为有序集合的过程。
2.信息组织的基本对象
⑴信息的外部特征
是指信息的物理载体直接反映的信息对象,构成信息的外在的、形式的特征,如信息载体的物理形态,题名、作者,出版或发表日期,流通或传播的标记等方面的特征。
⑵信息的内容特征
就是信息包含的内容,它可以由关键词,主题词或者其他知识单元表达。
3.信息组织的基本内容
⑴信息选择
信息选择的目的就是从采集到的,处于无序状态的信息流中甄别出有用的信息,剔除无用的信息,它是整个信息组织过程的第一步。
⑵信息分析
信息分析是按照一定的逻辑关系,从语义、语用和语法上对选择过的信息内、外表特征进行细化,挖掘,加工整理并归类的信息活动。它是信息描述与揭示的前提和基础,直接影响着信息组织的质量。
⑶信息描述与揭示
信息描述,亦称信息资源描述,是指根据信息组织和检索的需要,对信息资源的主题内容,形式特征,物质形态等进行选择,分析与记录的活动。信息描述与揭示主要分为两种类型:一是著录,主要描述文献信息的形式特征;二是标引,主要揭示文献信息的内容特征。
⑷信息存储
信息存储是将经过加工整理序化后的信息按照一定的格式与顺序存储在特定的载体中的一种信息活动。信息存储的目的是为了便于信息管理者和信息用户快速准确地识别、定位和检索信息。信息存储于各种检索工具中,意味着信息组织过程的终结,也即意味着信息检索的开始。
(二)信息组织的类型(基于信息或信息源的分类)
1.按信息的表现形式划分
①文字信息组织②图像信息组织③声音信息组织④视频信息组织
2.按信息加工的程度
①一次信息组织②二次信息组织③三次信息组织
3.按信息的传播载体划分
①文献信息源组织②网络信息源组织
(三)信息组织的原则(四项基本原则)
信息组织的对象,方法和过程都不是简单划一的,这种复杂性和变易性要求我们:无论是对社会信息流的宏观信息组织,还是对社会信息流分支的微观信息组织,都必须在一定科学原则的指导下,切实避免信息组织工作的随意性,无计划性,盲目性等现象的出现,从而使信息组织真正发挥整序信息、科学分流、促进选择、保证利用的功能和作用。
1.客观性原则
⑴客观性原则率先确定了信息描述和揭示的数据来源必须是客观存在的信息本身。同时客观性原则也为我们具体进行信息组织工作提出了相应的要求:
⑵在信息组织中我们不能损害信息的本来效用,不歪曲信息本身,也不肢解信息本身。不能毫无根据地,人为地添加一些不准确的思想和观点,要完整地,全面地,精确地反映信息的客观特征。
⑶客观性原则还要求我们不断跟踪信息源的发展变化和信息组织技术的发展变化,使信息组织与条件变化和环境变化保持客观一致。
2.系统性原则
⑴没有系统性的信息组织工作是不可能实现其整体目标的,为实现信息组织的系统性,我们必须把握四个关系:
①宏观信息组织和微观信息组织的关系。信息组织机构不仅要立足自身的实际情况,而且要考虑更大范围内信息组织的市场份额和分工协作,从而形成一个完善的宏观信息组织工作体系。
②信息组织部门与其他部门的关系。要注意信息机构内部各个部门之间的协作关系,特别要注意与从事信息搜集和信息传播的两类部门以及进行机构日常管理的行政部门的关系,以便在信息机构良好运行的环境下,保证信息采集——信息组织——信息检索——信息传播一条龙工作流程的畅通。
③信息组织工作各个环节之间的关系。信息组织工作本身也具有多个环节,保持各个环节的正常联系有助于使信息组织工作能一环紧扣一环,其中特别要注意信息分析与描述的基础性地位,它是信息揭示和存储的必要准备。
④不同信息处理方法之间的关系。由于信息本身的特殊性,在具体进行某一类信息的组织时必须充分满足于这种特殊性,但也必须全面把握各种信息处理方法的极大相似性,尽可能采用统一而规范的处理方法。
⑵用系统的观点和方法来进行信息组织工作的协调管理,有助于发挥信息组织的整体优势,也有助于实现信息组织的整体功能。
3.目的性原则
⑴信息组织具有鲜明的目的性,必须围绕用户的信息需求开展工作,注意信息机构的目标市场的需求状态及其变化特征,满足成本收益对称的原则。
⑵因此,信息组织工作必须积极开展用户研究,充分了解用户需求,改进信息组织方式,使信息组织成果能极大地方便用户选择和利用。
⑶此外,为了实现信息组织的目标,还必须注意信息工作的计划性和长期性,以及对信息机构本身性质,特点和能力的适应性。
4.现代化原则
⑴信息组织现代化原则包括思想观念现代化和技术手段现代化两个方面。
⑵信息组织的思想观念现代化集中体现在信息组织的标准化上。信息组织的标准化主要体现在信息组织工作的统一性、信息组织方法的规范性、信息组织系统的兼容性和信息组织成果的通用性方面。信息组织的标准化主要包括:①基本术语标准;②有关信息技术标准;③信息组织技术标准,④其他相关标准。
⑶信息组织的技术手段现代化已经充分证明,现代信息技术在信息组织中的广泛推广和应用形成了不可逆转的信息组织自动化方向,自动标引,二次信息自动生成和数据库建设成为目前已经比较成熟的信息组织自动化成果。信息组织的技术手段现代化,改变了传统的手工方式,极大地提高了工作效率和工作质量,更好地满足了用户的多样化信息需求,与信息管理发展大趋势相契合。
(四)信息组织的理论基础
1.语言学
语言是人类最重要的交流符号系统,是信息的载体。要把庞杂分散的信息组织成有序优化的整体,就必须建立符号系统,有了这种符号系统,信息系统的有序特征才能体现。尽管各种信息组织符号系统的形式不同,但都和自然语言一样有着共同特征:有语词,有词汇,有语法。这就信息组织的语言学基础。
2.逻辑学
逻辑学是关于思维规律的科学。思维有形象思维和抽象思维两种形式。信息组织属于抽象思维的范围,是在各种概念的基础上进行的,因而,它必须遵循科学的思维方法,如演绎推理和归纳推理,比较,分析与综合等。信息组织的行为只有符合逻辑思维规律,才能保证信息组织的优化、序化。
3.知识分类学
任何有深度的信息资源组织系统都要求按主题内容之间的关系进行组织和揭示。这就要求以已有的知识分类的成果为基础。知识分类体系是一门研究知识体系结构的学问,是进行主题之间关系处理的重要依据。信息组织以知识分类为基础,可以较好地揭示各个领域知识之间的关系和规律性,及时反映知识领域的进展。
4.系统论
系统论认为,系统内部各要素不是一种简单的结合,而是相互关联地有机结合在一起。在信息组织中,人们要将大量的,分散的,杂乱的信息组织成一个系统,建立起内在的关联性,使得信息系统的整体功能大于各个信息单元的功能之和。这将能充分发挥信息资源的价值与作用。
5.耗散结构理论
耗散结构理论认为系统内部非平衡是有序之源,开放系统通过与外界交换物质、能量而增加、维持有序性。由于信息系统具有输入、输出,多次循环及反馈等开放性的,非平衡的基本特征,所以我们认为信息系统就是一种耗散结构系统,它与外界进行着信息的交换,既采集信息,也输出信息,可以利用耗散结构理论来指导信息系统的开发、组织和利用。
6.协同论
信息系统是由多个子系统构成开放系统,如何建立各子系统之间的协同作用机制,使信息系统由无序向有序转化,是信息组织研究中的一个重要内容,因而协同论也是信息组织的理论基础之一。
7.自组织理论
自组织是指系统无需外界指令,而能够自行组织,自行创生,自行演化,即自主地从无序走向有序。凡是能够不再借助于外部控制而实现从无序到有序的转变,并维持稳定有序状态的系统,就称为自组织系统。信息技术的飞速发展使得信息系统显著地具备了自组织的条件,特别是网络信息已经具有自组织系统的开放性,远离平衡和非线性相关等特征,因此研究信息自组织理论对于网络信息组织具有非常重要的理论与实践意义。
二、信息组织的思想方法
(一)分类法
1.分类法的概念
分类法:是构建有序化信息系统的常用方法,是根据信息资源的内容属性和其他特征,将资源分门别类地,系统地组织和揭示的方法。它用分类号来表达各种概念,将各种概念按学科性质进行分类和系统排列。
2.信息资源分类的特征
⑴是按照信息内容特征的相互关系进行组织的。
⑵是从一定角度出发组织和揭示信息资源。
⑶采用一定的标记符号作为排序工具。
3.国内外主要的分类法
《杜威十进制分类法》(DDC)、《国际十进制分类法》(UDC)、(中国图书馆分类法)(《中图法》)、美国《国会图书馆分类法》(LCC)、《冒号分类法》(CC)
(二)主题法
1.主题法的概念
主题法:是指直接以表示信息资源主题的语词作标识,提供字顺检索途径,并主要采用参照系统揭示词间关系的标引和检索的信息的方法。它是分类法之外,另一种从内容角度标引和检索信息资源的方法。
2.主题法的特征
⑴以特定事物、问题、对象,即以主题为中心集中信息资源。
⑵直接以语词作为信息的组织和检索标识。
⑶以字顺作为主要检索途径。
3.主题法的类型
1)标题法
⑴基本概念
①标题法:是一种以标题词作为主题标识,以词表预先确定的组配方式标引和检索的主题法。
②标题词:亦称标题,指经过词汇控制用来表达文献主题的标识,大多是对文献内容所论及事物名称及特征的规范表达。
③(标题语言:众多标题集合而成的主题标识系统就是标题语言。)
④标题表:标题词的汇编称为标题表,它由编制说明,主表和附表三部分组成。《美国国会图书馆标题表》使用较广。
⑵标题法的类型
单级标题、带说明语的单级标题、多级标题、倒置标题等。(标题法用标题参照系统来显示它们表达的概念的相互关系。)
⑶标题法的优点
①因为标题之间的顺序关系是预先组配好的,先组式的标题在标引和检索时直接使用,不易混乱。
②标题法以事物为中心来集中与该事物有关的文献,适合从主题出发进行检索,易于查全一项事件的文献。
③直观,易掌握,检索速度快,对新事物,范围细小的问题容易反映出来,补充修改也比较容易。
⑷标题法的缺陷
①很难查全一门学科或具有某一属性事物的文献。
②使用不灵活,不能满足多途径检索。
2)单元词法
⑴基本概念
①单元词:是指用来标引信息资源主题的、最基本的、字面上不能再分的语词。若干单元词的相互组合或组配才能构成一个专指标识,来精确表达文献主题或检索课题。
②单元词法:是以单元词作为主题标识,通过字面组配的方式表达信息资源主题,后组式标识是这种方法的重要特点。
⑵单元词法的优点
组配原理。具有极大的灵活性,能提供多途径检索。目前已经进一步演变为叙词法。
3)叙词法
⑴基本概念
①叙词:国内也称主题词,是指经过规范化处理的,以基本概念为基础的表达文献主题的词和词组。
②叙词法:是指从自然语言中精选出来的,经过严格处理的语词作为文献主题标识,通过概念组配方式表达文献主题的主题法类型。
③叙词表:叙词法采用的工具是叙词表,我国目前使用最广的叙词表是《汉语主题词表》。(结构:各种排列表、索引、词的关系图)
⑵叙词法的特点
①直观性:直接以规范化了的自然语言叙词作为标识符号,直观性强。
②专指性:直接从文献论述和研究的具体对象和问题出发进行选择,并采用叙词组配来描述主题。可根据需要直接选作叙词或通过组配加以表达。
③适应性强:对不断出现的新事物,新学科,新概念和新的研究课题,叙词法能随时加以增删和修改。
④迅速准确:采用字顺排列方式,查找方便,迅速准确。
⑤后组式:主要采用后组式概念组配的方法,具有较大的灵活性。
⑥多维检索:又叫多途径检索,即对同一主题的文献可以从多种途径检索得到。
⑦网络结构:主要体现于叙词表中的叙词字顺索引的参照系统、范畴索引,词族索引,叙词的词族图等几个方面。这种网络结构的编制和建立,揭示了事物及其概念在各个学科领域,各个方面的内在联系,加强了叙词法的学科系统性和族性检索作用。
4)关键词法
⑴基本概念
①关键词:是指那些出现在文献的标题以及摘要、正文中,对描述文献主题内容具有实质意义的语词。
②关键词法:这种方法将原来文献所用的,能描述文献主题的概念的具有实质意义的关键词抽出作为主题标识,不加规范或只作极少量的规范化处理,通过轮排等方式揭示文献的主题。
⑵关键词法的类型
题外关键词索引、题内关键词索引、单纯关键词索引(双重~,词对式~,简单~)
(三)分类——主题一体化
1.分类主题一体化
分类法系统性强,从族性特征角度来对信息进行标引和组织,符合人们的思维与检索习惯;主题法比较直观,从特性特征角度对信息进行标引,提供了一种直接面向对象、事实、和概念的信息组织方法。二者形成有机结合,互相取长补短,能够更好地满足信息组织和检索的不同需要。
2.分类主题一体化词表
在分类表和叙词表基础上建立起来的分类主题一体化词表,即包括将主题概念按学科体系和逻辑体系排列和组织的分类法系统,也包括将主题概念按字顺排列并用参照系统加以组织的主题法系统,它们是一个统一的系统中的相互配合又相互独立的两个子系统。(用来同时满足分类标引和主题标引的需要)《中国分类主题词表》是在借鉴吸收国外先进的分类主题一体化理论和技术基础上,由我国自行编制的一部大型的、综合化的词表。
三、信息描述与揭示
(一)信息标引
1.标引的基本概念
信息标引:是指分析信息对象的内容属性及相关外表属性,并用特定语言表达分析出的属性或特征,作为信息存储和检索依据的处理过程。它是在对文献信息对象分析基础上发展起来的,故又称为文献标引。信息标引过程一般包括两个环节:一是主题分析,二是转换标识。
2.标引语言
1)标引语言的概念
标引语言:是表达文献主题概念和检索需求主题概念的简明性、单一性和关联性的概念标识系统,是根据标引和检索需要而编制的人工语言。从用途来讲,标语语言又称检索语言,索引语言,相对于自然语言来说,标引语言又称受控语言,规范语言。
2)标引语言的分类
⑴按照信息组织的思想方法
①分类语言:使用分类号表达主题概念,依据知识分类将主题概念组织、排列成类目体系,主要以类目体系的自身结构显示概念之间关系的标引语言。以学科、专业为中心的系统性是其主要特点。可细分为体系分类语言、组配分类语言、体系——组配分类语言。
②主题语言:是一种由受控的自然语言语词直接表达主题概念,按语词字顺排列主题概念,主要用参照显示概念之间关系的标引语言。以事物为中心的直接性是其主要特点。可进一步划分为标题语言、单元词语言、叙词语言、关键词语言。
⑵依标识组合时间的先后
①先组式语言:是指标识在编表时(标引前)就已组合好,标引和检索时不必或较少进行组配的标引语言,如主题法中的标题法就属于这种类型。
②后组式语言:是指标识主要供配置使用,而且标引时不将标识组配在一起,到检索时才将标识组配起来的标引语言,如单元词法,叙词法。
③散组式语言:是指标识主要供组配使用,而且标引时就要将表达主题概念的若干标识组配在一起的标引语言。
⑶依标识的规范和受控程度
①受控语言:指信息组织的标识词汇以及信息检索的索引词汇在使用前经过优选和规范化处理,并且整个语言经常处于某权威机构或检索系统的管理之下。这种语言又称为规范化语言,与自然语言相对。如主题法中的标题语言,单元词语言,叙词语言,体系分类语言等均属于受控语言。
②自然语言:指标引词汇和检索词汇直接来自所处理的文献本身,使用前未经过优选和规范化处理,与受控语言相对。如主题法中的关键词语言。
3.信息标引的类型
⑴信息标引的类型取决于表达文献内容的标引语言的种类,因此信息标引主要分为分类标引和主题标引两种类型。
①分类标引:是指对文献进行主题分析,用特定的分类语言表达分析出的主题,赋予文献分类检索标识(分类号)的过程。习惯上分类标引被称为分类,因为分类标引实质上就是对文献进行分类。 (文献分类:是指根据文献内容及其他相关属性,以分类语言/分类法为工具,分门别类地系统揭示和组织文献的过程和方法。)
②主题标引:是指对文献进行主题分析,用主题语言(主题法)表达分析出的主题,赋予文献主题检索标识(标题词,叙词等)的过程。
⑵如按照标引标识组合时间的先后,信息标引还可分为先组式标引、后组式标引、散组式标引;按标引标识的受控程度,还可分受控标引和自然语言标引。
(二)信息著录规则
信息著录:是按照一定的规则对信息实体的特征进行描述并著录下来的过程。
1.机器可读目录(MARC)
⑴概念
MARC:是机器可读目录的简称,它是计算机能够识别和阅读的一种目录。(是根据文献特点和文献机构之间信息交换的需要建立的标准化的计算机可读格式。)
⑵特点
伸缩性强,适应面广,具有如下主要特点:①共包括001~999个字段,其中999字段为用户自定义的字段;②字段内容著录详尽,字段下又设子字段以及重复字段;③字段作用强化,可检索的字段多;④每条MARC记录可分为头标区、目次区、数据区。
⑶几种典型的MARC标准
①USMARC(美国国会图书馆机读目录格式)
USMARC的前身为MARCⅡ格式,它完全与ISO2709规定一致,只在其字段标识和内容项目上不同。每条USMARC记录由头标区、目录区、数据区三部分组成。主要字段有:目录控制区,主要款目,书名出版项、主题附加款目、其他附加款目等。广泛应用于书目记录数据。
②UNIMARC(国际机读目录通信格式)
该标准是国际图联IFLA于1976年为统一各国机读目录格式,在USMARC的基础上主持制定的。它实现了不同文种,不同载体的文献机读目录格式的一体化,为不同国家书目机构之间机读目录的交换创造条件,推动了各国机读目录格式研制的修订。
③CNMARC(中国机读目录格式)
CNMARC:是中国机读目录的缩写,是我国通用的机器目录通讯格式。是用于中国国家书目机构同其他国家书目机构以及国内图书馆与情报部门之间以标准的计算机可读形式交换书目信息。它是依据UNIMARC以及我国出版物的一些特殊情况和规则的新变化而编制的。
2.书目记录的功能需求(FRBR)
FRBR研究了书目记录的功能需求与多样化用户需求、多样化资料类型之间的关系,并利用实体——关系模型(E-R)构建了一个揭示书目结构和关系的概念模型。
3.资源描述与检索(RDA)
RDA是一种描述编目的标准。RDA基于国际图联(IFLA)发布的书目记录的功能需求(FRBR)和规范数据的功能需求(FRAD),作为英美编目规则(第二版)(AACRⅡ)的继承者,RDA提供了一组关于如何制定数据以支持资源发现的指导方针和说明,涵盖了所有类型的内容和媒体。
4.书目框架(BIBFRAME)
BIBFRAME是书目框架的简称,是美国国会图书馆(LC)为取代MARC格式,基于关联数据规则开发的书目描述数据模型。2.0包含创作作品、实例、单件三个核心类以及代理、主题、事件等关键概念。
(三)元数据
1.元数据
⑴元数据的概念
元数据:是关于数据的数据,关于信息的信息,或描述数据的数据。它是专门用来描述数据的特征和属性,也是描述和组织信息资源,发现信息资源的语言和工具。元数据是组织数据,各种数据域以及它们之间的相互关系的信息。
元数据的类型包括:元素名称,元素描述,元素表示,元素代码,元素语义和元素分类。
⑵元数据的作用
⑴描述。元数据最基本的功能就在于对信息对象的内容、特征和位置进行描述,从而为信息对象的存取和利用奠定必要的基础。
⑵定位。元数据包含有关网络信息资源位置方面的信息,由此可以确定资源的位置所在,促进网络环境中信息对象的发现和检索,可提高信息资源的查准率和查全率。
⑶搜寻。在著录过程中,将信息对象中重要内容抽取并加以组织,赋予语义,建立数据之间的联系,指出相关数据的地址和存取方法,从而有利于用户甄别资源的价值,发现其真正需要的信息资源。
⑷评价。元数据提供有关信息对象的名称,年代,格式,制作者等基本属性,使用户在无需浏览信息对象本身的情况下,就能够对信息对象基本了解和认识,对信息资源的使用价值进行判断,作为存取和利用的参考。
⑸选择。根据元数据所提供的描述信息,参照相应的评估标准,结合使用环境,用户做出对信息对象取舍的决定,选择适合用户使用的资源。
2.都柏林核心集(DC)
⑴概念
柏林核心集(简称Dublin Core)。是一种通用简单的元数据。1995年3月,由联机计算机图书馆中心(OCLC)和美国国家超级计算应用中心(NCSA)主持在美国俄亥俄州的都柏林召开了第一届元数据研讨会。大会最后确定了一个包含13个数据单元的元素集,即都柏林核心元素集。后来增加到15个单元。
⑵类别
①资源内容描述类元素:题名、主题、描述、来源、语种、关联、覆盖范围。
②资源知识产权描述类元素:创作者、出版者、其他责任者、权限管理。
③资源外部属性描述类元素:日期、类型、格式、资源标识符。
⑶Dublin Core 的优点
①简单易懂:15个标记元素通俗易懂。
②运用灵活:它既可以用于规范的资源描述领域,也可以用于非专业领域。
③国际通用:已有德语,日语,葡语,西班牙语等20多种不同语种的版本。
④可修饰性:其所有元素都可重复使用,解决了多著者与多出版等重复元素的著录问题,对于需要详细著录的资料,引进了DC修饰词。
⑤可扩展性:不仅15个标记元素和子元素可以扩展,DC还可以与其他元数据元素连接使用。
3.其他元数据规范
VRA核心类目、PICS、Web Collections、CDF频道定义格式、MCF元数据框架、RDF资源描述框架
(四)标记语言及相关标准
1.标记语言
⑴通用标记语言标准(SGML)
SGML:是一种元语言,是用来描述标记语言的语言,适用于电子文档交换、文档管理和文档发布。SGML从结构和内容两个层次来描述文献,其核心是文档类型定义DTD。
⑵超文本标记语言(HTML)
HTML:是经过简化的SGML的DTD的具体应用实现。HTML提供了一种文本结构和格式,使其能够在浏览器上呈现给访问他的用户。是Web上的通用语言,可以方便的制作网页,建立链接,使数据信息由线性组织转化为网状组织。
⑶可扩展标记语言(XML)
XML:它同样是SGML的一个简化子集,它将SGML的丰富功能与HTML的易用性结合到Web的应用中,以一种开放的自我描述方式定义了数据结构,在描述数据内容的同时能突出对结构的描述,从而体现出数据之间的关系。
2.资源描述框架(RDF)
RDF:采用通用标记语言标准(SGML)的子集——可扩展标记语言(XML),是一种人与机器都能理解的描述框架。它提供了一种强有力的表达、交换与利用元数据的机制,使得各种不同元数据体系之间具有互操作性。
3.简单知识组织系统(SKOS)
是万维网联盟(W3C)公布的知识组织系统概念框架表示的推荐标准。提供了一种简单可行的标准描述方案用于描述知识组织系统。具有简单,通用,易扩展等特性。SKOS主要用于表示各种较为简单的网络知识组织系统,如叙词表,分类法,主题词表,术语表等其他类型的概念框架。
四、网络信息组织
(一)网络信息组织的特点
在信息网络环境下,随着信息量,信息种类,信息形态及传播速度的发展,给信息的有序组织带来了新的挑战,网络信息组织也表现出新的特点:
1.海量网络信息及信息生产,传播速度的加快,对传统信息加工方式提出了挑战。信息组织的技术从手工单一发展到半动化,自动化,智能化。
2.信息种类增多,数据库成分复杂化,过去主要适用于文本信息的信息组织方法适用性降低。网络信息中除文本信息外,还包含大量的如图片,声音,视频等非文本信息,全文信息的比重也在逐渐增大。
3.不同于以往信息用户,网络信息用户的信息行为对信息组织有专门需求,他们要求信息组织方式透明化,易用化,希望信息传播快速便捷,组织方式简便实用。
4.网络信息形式上的非线性,交互性和动态性需要信息组织方法及时而灵活。多媒体与超链接的方式使得网络信息从线性的静态资源发展到非线性的动态资源,需要新的信息组织方式来适应这种变化。
(5.网络信息资源共享要求信息组织标准化、兼容化)
(二)网络信息的分类组织
分类组织是一种比较成熟的信息组织方法。目前网络上的信息分类组织主要采用两种方式来进行:一是沿用传统的文献分类方法,主要以学术资源为主;二是采用自编的分类系统,在门户网站上较为常用。
1.传统文献分类法的应用
⑴DDC
DDC严格的等级体系具有很好的实用性,即可用于网络信息组织,也可以利用它的等级结构,概念体系以及类目关系进行网络信息的自动标引。DDC、LCC、UDC等都不同程度地用于网络信息的分类组织。
⑵UDC
由6万多个类目构成,并提供多种复分表,在满足文献资料细分方面有独到优势,它具有分面组配分类法的一些特点,通过符号组配可以获得概念的组合,因此这种分类法较适合于机检。
2.自编分类系统的应用
⑴由于网络信息的复杂性,使得网络信息分类组织模式更具多样性。有些网站采用了多维的分类模式,以此满足网络信息组织与检索的需要,具体表现为网站分类目录(索引)和网页分类索引。
⑵网络自编分类体系的特点 (与传统文献分类法相比)
①重视以事物为中心设置类目。
与传统的文献分类体系不同,网络分类系统虽不完全放弃从学科的角度组织网络资源,但大多从便利用户使用出发,直接以检索的事物为中心设置类目,从学科角度设置的类目很少。
②类目收录范围宽泛。
类目体系展开时,其下位类不仅收入该类的从属类目,而且收入各种相关类目,从而使得一些类目的下位类数量大大增加,远高于传统文献分类法同级类目的数量。
③多重列类、重复反映。
为了方便用户信息查找,这类网络分类体系一般都十分重视结合网络显示特点,采用多重列类的方法对网络信息重复反映,以便可以从不同角度着手加以使用。
④排列方式简便。
对同位类的排列主要有两种方式。一是字顺方式,这种排列方式不能揭示同位类之间的内容联系,但可以方便用户对特定类目的查找,同时也有利于简化新类的增补。二是检索频率确定同位类的排列次序,在同位类中首先列举高频类,突出热门主题,方面多数用户使用。
⑤直接以语词组织信息。
这些系统放弃传统分类法以标记符号表达文献主题的方式,直接以语词表达类目体系,采用链接技术连接网络文献,比使用分类标记更加方便、直观、易于理解。
⑥更新迅速。
由于网络分类体系是通过链接与网络文献建立联系的,类目的调整受原有体系的束缚较少,可以根据网络资源的发展变化及时增设新类或重复反映相关类目等,往往具有较大的动态性。
(三)网络信息的主题组织
主题法是网络信息组织的另一种主要方式,主要可分为两种形式:一是采用现有的词表(如叙词表,即主题词表),主要应用于学科专业型数据库中;二是采用关键词法,在搜索引擎等网站中使用较普遍。
1.叙词表的应用
⑴叙词表,又称主题词表,是叙词法的词汇管理工具,是为采用叙词法标引和检索信息的用户提供规范化的叙词及其语义关系信息的一种索引词汇表。网络化的叙词表联机显示是叙词表在网络环境下应用的主要形式之一,既包括原印刷型词表的数字化,也包括数字化环境下编制和生产的数字化词表。
⑵按照功能和有用性,网络环境下的叙词表可以分为两种类型:①独立叙词表;②集成在数据库或信息检索系统中的叙词表。
2.关键词法的应用
1.由于网络资源数量庞大,使用规范语言将会大大提高信息组织成本,降低文本处理效率,而网络信息的自动词语处理技术,是直接从文本标题或正文中抽取关键词作为信息组织标识。与叙词相比,关键词是一种不受控或者受控程度较低的标准语言。因而,关键词技术在网络搜索引擎和其他信息系统的信息组织中被广泛采用。
2.网络搜索引擎中的自动索引软件如Robot,Spider等都采用了关键词技术。我们所熟悉的Google,Baidu,Bing等搜索引擎采用了关键词法来组织网络信息,此外,网络上的一些文献数据库也广泛使用了词语标识系统,使得用户在进行文献分类浏览的同时,还能够从题名、作者,篇名等检索入口利用关键词作为检索标识进行查找。
(四)网络信息组织方式
信息组织方式是利用各种信息技术和信息组织方法将信息组织起来的具体形式。目前应用较多的网络信息组织方式主要有文件方式、数据库方式、主题树方式、超媒体方式等。
1.文件方式
⑴概念
文件是有序组织的数据的集合,是计算机保存处理结果的基本单位。计算机有一整套文件处理的技术和方法,可以实现“按文件名进行存取”,文件管理程序可根据用户给出的文件名自动完成数据传输操作。我们所熟悉的文件传输协议FTP的作用就在于把各种类型的文本式和非文本式文件通过网络传送给用户。
⑵优点:
①简单方便。计算机有一整套文件处理的技术和方法,在组织网络信息资源时可以非常容易地利用这些技术和方法。
②它是存储非结构化信息的天然单位。对于图形,图像,音频,视频等非结构化信息,可以方便地利用文件系统来进行管理。
⑶缺点:
①难以平衡网络负载与文件数量的关系。
②对结构化信息组织显得软弱无力。
③随着以文件形式保存和管理的信息资源的迅速增多,文件本身可看做信息单元,也需要作为对象来管理。所以文件方式常作为网络信息资源管理的辅助形式,作为其他信息组织方式的补充。
2.数据库方式
⑴概念
数据库组织方式,是将所有已获得的网络信息资源以固定的记录格式存储,用户通过关键词及其组配查询,就可以找到所需要的信息线索(即相关站点链接),并通过信息线索直接连接到相应的网络信息资源。
⑵优点
①这种组织方式利用数据模型对信息进行规范化处理,大大提高了数据操作的灵活性,降低了网络传输的负载。
②多媒体数据库和半结构化数据库的发展,为非结构化信息的组织提供了良方,便于internet信息资源的充分共享和有效传播。
⑶缺点
①对非结构化信息的处理困难较大。对网络环境中日益增多的多媒体信息等非结构化信息的组织,该方式显得困难。
②不能提供数据信息之间的知识关联。数据库组织方法是基于语用的组织,难以显示信息单元的知识内容之间的语义关联。
③对用户和数据库服务端都提出了较高的要求。要求用户掌握一定的检索技巧,包括关键词及其组配方法的选择等,同时,在数据库服务端,对于如何进行数据库的自动扩充,如何提供良好的人际交互,也提出了较高的要求。
3.主题树方式
⑴概念
主题树组织方式,就是将信息资源按照某种事先确定的概念体系结构,分门别类地逐层加以组织,用户通过浏览的方式逐层加以选择,层层遍历,直到找到所需要的信息线索(即相关站点链接),并通过信息线索直接找到相应的网络信息资源。一些比较著名的网络检索工具,如Yahoo!InfoSeek等都是用这种方式组织信息资源的。
⑵优点
①简单易用,屏蔽了网络信息资源系统对于用户的复杂性,提供了一种基于树形浏览方式、简单易用的网络信息检索和利用页面。
②信息检索按照一定的范畴分类体系,逐次查看,按图索骥,对用户而言,目的性强,查准率高。
③采用树形目录结构组织信息资源,具有良好的可扩充性和严密的系统性。
⑶缺点
①必须事先建立一套完整的范畴体系。但是这套体系结构很难包括所有的网络信息资源,也人为地增加了用户的智力负担。
②要保证主题树的结构清晰性和资源可用性,主题范畴体系的结构不能过于复杂,这就降低了其所能容纳的网络信息资源的数量,因而这种组织方式不宜于建立综合性的大型网络资源系统。
③主题目录树是一种人工主导的资源组织方式,因而在管理、维护方面跟不上网络信息的增长速度,收录范围不够全面,新颖性和及时性相对较差。
4.超媒体方式
⑴概念
超媒体技术是超文本技术与多媒体技术的结合,它将文本,图表,声音,图像,视频等多媒体信息以超文本方式组织起来,使人们可以通过高度链接的网络结构在各种信息库中自由航行,找到所需要的任何媒体的信息。
⑵优点
①它以符合人们跳跃性思维习惯的非线性的方式组织信息,具有良好的包容性和可扩充性。
②超越了媒体类型对信息组织与检索的限制,实现了链接浏览的搜寻方式,避免了检索语言的复杂性。
⑶缺点
采用浏览的方式进行信息搜寻,当超媒体网络过于庞大时,很难迅速准确地定位,且很难保存浏览过程中的所有历史记录,难以避免所谓的“迷航”现象。
(五)基于众包的网络信息组织
⑴众包的定义
一个公司或机构把过去由员工执行的工作任务,以自由自愿的形式外包给非特定的(而且通常是大型的)大众网络的做法。众包通过整合计算机和互联网上未知的大众来完成机器单独难以处理的任务。
⑵基于众包思想的技术
①Wiki:是一种在网络上开放、可供多人协同创作的超文本系统。
②Tag:Tag也称标签技术,是用来描述信息内容分类标识,一般一个标签就是一个自然语言词汇。每个标签可由用户自发进行创建和修改,而且标签具有共享性,用户可以访问标签所标注的信息。(在标签等信息自组织技术的应用下,分众分类Folksnomy开始出现,并逐渐成为一种不容忽视的新型网络信息分类组织方法。)
五、知识组织
知识组织是信息组织的高级形式,是信息组织的发展方向。
(一)知识组织的含义及特征
知识组织:是揭示知识单元(包括显性知识因子和隐性知识因子),挖掘知识关联的过程或行为,最为快捷地为用户提供有效的知识或信息。
(二)知识表示
知识表示:是指把知识客体中的知识因子和知识关联表示出来,以便人们识别和理解知识。知识表示是知识组织的基础与前提,任何知识组织方法都要建立在知识表示的基础上。知识表示有主观知识的表示客观知识的表示两种。
⑴主观知识的表示
专家系统的知识表示方法:逻辑表示法、产生式规则表示法、语义网络表示法、框架表示法、面向对象的知识表示。
⑵客观知识的表示
对文献知识的表示:分类标引法和主题标引法。
(三)语义视角下的知识组织 (知识组织的技术和方法)
1.语义网
⑴含义
语义网:就是对万维网第二阶段的设想,它并非是另一个独立的万维网,而是万维网的一个延伸,是一个由大量机器可理解的数据所构成的一个分布式的万维网。在这个语义网络中,数据之间的关系通过一些术语来表达,这些术语之间又形成一种复杂的网络联系,计算机能够通过这些术语得到数据的含义,并且可以在这种联系上应用逻辑来进行推理从而完成一些原来不能直接完成的工作。
⑵语义网的信息组织机制核心的构成
①以XML与RDF为手段的信息描述模块,管理信息,具备部分语义;
②以本体为手段的语义注释模块,提供“意义,实现机器间的语义互操作。
2.本体
⑴含义
本体:是共享概念模型的明确的形式化规范说明。具体地说,在网络信息组织领域,本体就是一整套对某一领域的知识进行表述的词和术语,编制者根据该知识领域的结构将这些词和术语组织成等级类目,同时规定类目的特性及其之间的关系。
⑵基于本体的网络信息组织的特点
①直接体现语义。②分布式共享。③多维、网状的信息组织方式。④对推理的支持。
3.关联数据
关联数据:是万维网的发明人蒂姆.伯纳斯-李提出的万维网上发布数据的方式,是语义Web的一种实现方式。它一般要求采用RDF数据模型,利用统一资源标识符(URI)命名数据实体,发布和部署示例数据和类数据,从而可以通过HTTP协议揭示并获取这些数据。
4.知识图谱
⑴含义
知识图谱:是一种基于图的数据结构,由节点和节点间的边组成。知识图谱本质上是一种语义网络,其节点代表实体或者概念,边代表实体或概念之间的各种语义关系。
⑵作用
知识图谱作为一种新型的知识存储结构,可以把复杂的知识领域通过数据挖掘,信息处理,知识计量和图形绘制的方式显示出来,可视化的结构和网状关系可以揭示知识领域的动态发展规律,为所要研究的学科提供切实的,有价值的参考。
⑶分类
语言知识图谱、事实性知识图谱、领域知识图谱、机器自动构建的知识图谱。
第六章 信息检索
一、信息检索的基本概念与原理
(一)信息检索的含义
信息检索:是指从众多的信息集合中迅速准确地查找出用户所需信息的全过程。广义的信息检索又称信息的存储与检索,包含两个方面的含义:一是信息的存储,即将信息按一定的方式组织和存储起来;二是信息的检索,即根据用户的需要找出有关信息资料的过程。狭义的信息检索仅指该过程的后半部分,即从信息集合中找出所需信息的全过程。
(二)信息检索的类型与特性
1.信息检索的类型
⑴按检索对象的内容划分
①文献检索:是指以查找某一课题的相关文献为目标的检索。文献检索是相关性检索而非确定性检索,其检索对象是包含特定信息的各类文献。文献检索包含:全文信息检索和目录,题录,索引,文摘等二次文献信息检索。
②数据检索:是指以特定的数值型数据为对象的检索。数据检索是一种确定性检索,即检索系统直接提供用户所需要的确切的数据,检索结果一般是确定性的。事实检索是指以特定的事实为目标的检索。
③事实检索:也是一种确定性检索,这种检索既包含数值数据的检索,运算,推导,也包括事实、概念等的检索、比较和逻辑判断。
⑵按检索方式划分
①手工信息检索:是指利用印刷型检索工具书,以手工操作的方式进行信息检索。其优点是:直观,灵活,便于控制检索的准确性;缺点是:查找过程较复杂,检索速度慢,查找工作量较大。
②计算机检索:是把信息及其检索标识转换成计算机可以阅读和处理的二进制编码形式,存储在数据库系统中,由计算机按照设计好的程序对已经数字化的信息进行查找和输出的过程:计算机检索大大提高了检索效率和检索的全面性,拓宽了信息检索领域,丰富了信息检索的研究内容。可进一步划分为脱机检索,联机检索,光盘检索和网络检索等多种形式。
⑶按检索要求划分
①特性检索:也称为强相关检索,强调向用户提供高度对口的信息。这种检索强调检索的准确性,只要检索得到的文献信息能够满足用户的需求即可,通常对于检索结果的数量多少不做要求。
②族性检索:也称为弱相关检索,强调向用户提供系统完整的信息。这种检索注重检索的全面性,要求检索出一段时间期限内有关特定主题的所有信息。为了尽可能避免漏检相关信息,对于检索的准确性相对要求较低。
⑷按检索的时间跨度划分
①定题检索(SDI):是根据用户的检索课题的内容和检索需要,制订检索提问式并将制订好的检索提问式预先存入检索系统中,并定期地对检索系统中的信息进行查询。定题检索的特点是:只检索最新的信息,检索的时间跨度小。这种检索模式非常适合于信息跟踪,便于及时了解有关主题领域的最新发展动态。
②回溯检索(RS):也称为追溯检索,是查找过去一段时间内有关特定主题信息的检索,并将检索结果一次性提供给用户,使用户一次检索就可以全面了解某一课题在某一段时间的发展情况。回溯检索的特点是:既可以查找过去某一段时间的特定主题信息,也可以查找最近的特定主题信息。与定题检索有所不同,每个回溯检索一般只运行一次。
⑸按检索对象的信息表现形式划分
①文本检索:是查找含有特定信息的文本文献的检索,检索结果以文本形式反映特定信息的文献。这是一种传统的信息检索类型,在信息检索中至今仍占据主要地位。
(全文检索:对于检索系统中存储的整篇文章乃至整本书,按照自己的需要获取有关的章、段、句、节等信息,还可以进行各种频率统计和内容分析。)
②多媒体检索:是根据用户的需求,对文字,声音,图形,图像等多种媒体信息进行组织,存储,从而识别,查找并获取有关信息的过程。
③超文本检索:超文本是将诸多文本信息通过超级链接联系起来而形成的一种非线性的文本结构。超文本检索强调中心节点之间的语义联系结构,靠系统提供的复杂工具做图示穿行和节点展示,提供浏览式查询。
④超媒体检索:是对超文本检索的补充,其存储对象超出了文本范畴,融入了图形像以及声音等多种媒体信息,信息存储结构从单维发展到多维,存储空间的范围也不断扩大。
2.信息检索的特性
⑴信息检索的相关性
所谓相关性,是指信息检索时规定的一篇正文与表示信息提问的另一篇正文的符合程度。国内信息界认为:相关性表明用户是否认为一文献与一提问相吻合。在信息检索中广泛地存在着相关性的问题。
⑵信息检索的不确定性
在标引和检索词的选用中都存在着不确定性。①标引的不确定性是指不同标引员在给同一篇信息对象进行标引时会选用不同的标引词,即标引词选用的不一致性。②检索词选用的不确定性是指候选检索词集不止一个,而是多个,检索过程具有试探性。上述两种不确定性作用于检索系统,使得信息检索具有不确定性。
⑶信息检索的逻辑性
信息检索作为信息管理的核心,具有非常强的逻辑性。①在检索语言方面,检索词表作为检索语言的典据性文本,其自身编排具有很强的逻辑性。②在检索策略的研究方面逻辑性表现得更为明显。所谓检索策略是指处理信息检索提问的逻辑与查找步骤的科学安排。正确的检索策略优化了检索过程,有助于取得最佳的检索效果,获得具有高相关度的文献。
(三)信息检索的基本原理
信息检索的基本原理可以概括为:对信息资源集合与信息需求集合的匹配与选择。
⑴信息资源集合
信息资源集合是指有关某一领域的、经选择性采集和组织加工的信息集合体。为了保障信息检索的快速与高效,需要对信息资源集合进行某种形式化的加工,形成它们的特征化表示,即对它们们进行分析与标引,让原来隐含的、不易识别的特征显性化,并获得相应的标识(如分类号,主题词等)。将这些被分析、提取出来的特征及其标识进行存储,便构成了索引库,成为组织和查找信息资源的依据和标准。
⑵信息需求集合
众多用户不同形态的信息需求的汇集,形成了信息需求集合。对用户提出的信息需求也需要进行特征化处理,即分析需求的内容,提取出主题概念或其他属性,并利用与信息资源集合相同的标识系统(即检索语言)来表示需求中所包含的概念和属性,从而得到用户需求的特征化表示结果——提问式。
⑶匹配与选择
为了便于从信息资源集合中快速获取用户所需要的信息与知识,就要求信息检索提供一种“匹配”机制。这种机制的主要功能在于:能够把信息需求集合与信息资源集合依据某种相似性标准进行比较与判断,进而选择出符合用户需求的信息。在信息资源集合与信息需求结合都进行了特征化表示的基础上,它们二者之间的匹配就简化为提问式与已建立的有序的索引库之间的匹配。
(四)信息检索的模型
⑴布尔逻辑检索模型
布尔检索模型采用布尔代数和集合论的方法,用布尔表达式表示用户提问,通过对文献标识与提问式的逻辑运算来检索文献。逻辑运算中最常用的是布尔逻辑运算符,主要的逻辑运算符有逻辑“与”、逻辑“或”、逻辑“非”,分别用AND(或*)、OR(或+)、 NOT(-)表示。
优点:逻辑运算符较少,提问式构造简单且易修改;缺点:检索中的关键词没有权重区别,检索结果没有重要性排序,查全率较难控制,对用户语义提取能力要求较高。
⑵向量空间模型
向量空间检索模型是采用线性代数理论和方法构建的一种新型的检索模型。它的基本前提是将检索文档和检索提问式都看成是一组数值向量,这些数值形成一个空间向量图,这样就将信息检索中文献与提问匹配处理过程转化为向量空间中文献向量与提问向量的相似度计算问题。某一文献与某一提问的相关程度,通过检索该向量对之间的相似度来确定。
⑶概率检索模型
概率模型是一种实现简单,效果较好的信息检索模型,其基本思想是:给定一个用户提问,则检索系统中存在着一个只包含与提问相关的文档的理想结果集合,记为R。如果能知道集合R的特征及其描述,就能找出全部相关文档,排除所有无关文档。
⑷模糊检索模型
模糊检索是将文献看成是提问在一定程度上相关,对于每一个标引词,都存在一个模糊的文献集合与之相关,对于某一给定的标引词,用隶属函数表示每一文献与该词的相关的程度,即隶属度,取值在[0,1]上,0表示不相关,1表示完全相关,数值越大,则相关性越高。
二、信息检索的发展历程
(一)手工信息检索阶段(1876-1945)
1.手工信息检索的起源与发展
⑴信息检索起源于文献的文摘索引工作和图书馆参考咨询工作。参考咨询工作产生的标志是1876年召开的美国图书馆协会第一届大会。到20世纪40年代,“信息检索”发展成为一项独立的用户服务工作,并逐渐从单纯的经验工作向专业化方向发展。
⑵在这一阶段的发展过程中,手工化信息检索活动取得了丰硕成果,并为下一时期的计算机化信息检索发展奠定了坚实的基础。这些成果主要表现在:①大批高质量的文摘性检索工具陆续被编制并投入使用。如,《工程索引》《科学文摘》《化学文摘》等;②检索语言的创建和试验活动十分活跃,在分类语言方面出现了如DDC、UDC;在主题方面,先组式标题语言、后组式单元语言、叙词语言,引文语言等检索语言相继出现。
2.手工信息检索的技术与方法
⑴检索工具:目录、索引、文摘、年鉴、手册、百科全书
⑵排检技术:字顺排检技术、分类排检技术、主题排检技术、地序排检技术、时序排检技术
⑶检索方法:顺查法、倒查法、抽查法、追溯法、循环法
手工信息检索的特点是:操作简单,费用低廉,查准率高,但效率较低,查全率不能保证。
(二)机械信息检索阶段(1945-1954)
1.机械信息检索的起源与发展
⑴机械信息检索系统是20世纪50年代开始的,用各种机械装置进行信息检索的机械系统,是手工检索向现代信息检索的过渡阶段。机械性检索主要包括两种基本类型:①机电信息检索系统:用诸如打孔机,验孔机,分类机等机电设备记录二次文献,用电刷作为检索元件的信息检索系统。②光电信息检索系统:用缩微照相记录二次文献,利用光电检索元件查找文献的系统。
⑵特点:机械信息检索系统利用当时先进的机械装置改进了信息的存储和检索方式,促进了信息检索的自动化;但它并没有发展信息检索语言,而且过分依赖于设备,检索复杂,成本较高,检索效率和质量都不理想。很快被迅速发展的计算机检索系统取代。
2.机械信息检索的技术与方法
⑴机电信息检索系统:机械信息检索最初是从简单的穿孔卡片逐步发展起来的。继手检穿孔卡片之后,出现了机检穿孔卡片和选卡机,这就形成了机电信息检索系统。
⑵光电信息检索系统:光电信息检索系统主要是以缩微胶卷检索方式出现的,大致可以分为两种类型:寻址检索方式、编码检索方式。
(三)计算机信息检索阶段(1954-1991)
1.计算机信息检索的起源与发展
随着1946年计算机的问世,信息检索进入到计算机检索阶段。计算机信息系统的发展历程经历了早期的脱机批处理检索、后来的联机实时检索、功能更为强大的联机网络化信息检索等不同的发展阶段。
⑴脱机批处理检索(1954-1965):在发展初期计算机技术还比较落后,数据存储与数据通信能力都比较差,信息检索的基本特征是“脱机批处理”,表现为:输入计算机的信息几乎全部存储在磁带上,检索提问存储在穿孔纸带或穿孔卡片上,检索结果不能立即获得,必须等待成批或定期的检索处理。
⑵联机实时检索(1965-1975):进入20世纪60年代中后期,随着第三代计算机——集成电路计算机开始出现,高密度海量随机存储器——磁盘及磁盘机的问世和投入使用,信息检索进入了人机对话式的联机实时检索时期。表现为:信息检索中心的主机借助于电话线与远距离检索终端相连,形成联机实时检索系统,用户通过检索终端与检索系统进行对话,并可在终端屏幕上即时获得检索结果。
⑶联机网络化检索(1975-1991):20世纪70年代中后期,大规模集成电路和超大规模集成电路技术,数据库技术,尤其是基于分组交换网的现代通信技术等,将联机检索带入了联机网络化发展阶段。
计算机信息检索时期的主要特点为:①以各类机读数据库为检索对象;②各类情报所、联机服务中心作为新兴的信息服务部门而存在;③信息检索用户逐渐由专业检索人员向个人终端用户转移和扩散,信息检索的社会普及化程度日益提高。
2.计算机信息检索的技术与方法
⑴联机信息检索
联机信息检索是指信息用户利用检索终端设备,使用一些特定的指令和检索语词,通过通信网络与存储大量信息的信息检索系统联机进行人机对话,从检索系统的数据库中查找出用户所需信息的全过程。
优点:①检索速度快;②检索范围广而全面;③检索途径多、质量高;④检索内容新、实时性强;⑤检索辅助功能完善、使用方便,检索结果输出方式灵活、实用。
缺点:①主机负担重,一旦出现故障,则整个网络都将瘫痪;②信息组织方式以线性为主,不够灵活;③联机检索不像internet是面向最终用户的,操作也没有后者方便。
⑵光盘信息检索:光盘是继纸张、缩微胶片,磁存储器之后的一种用激光束记录和再现信息的存储载体。用于检索和阅读的光盘,通常为只读光盘,它是一种信息载体,而要对其中的信息进行检索和利用,则需要计算机的配合。
特点:①使用光盘检索系统可免除使用电讯设备,还可免除由通信线路传输过程中所造成的失误;②光盘系统向用户随盘提供相当于联机信息检索系统功能的软件,并提供菜单驱动与命令驱动两种方式;③光盘存储容量大,耐用,复制费用低;④可以把文本,图形,图像,声音及动态形象结合在一起;⑤如果光盘数据库量不够多,则信息资源就显得有限,购买大量购买数据库又要受到经费限制;⑥在信息需求的适时性上,光盘检索不如联机检索系统,因为光盘只能定期提供;⑦数据库费用大。
(四)网络信息检索阶段(1991-):
1.网络信息检索的起源与发展
20世纪90年代以后,以互联网的出现为标志,系统大多采用分布式的网络化管理,信息处理从传统模式向新型模式转变。这些变化使得信息检索的主流平台迅速转移到以Web为核心的网络应用环境中。一方面,新兴的机遇Web的搜索引擎系统得到日益广泛的应用;另一方面,传统的联机检索系统、各类数据库检索系统及其信息服务业务,也逐渐扩展、转移到具有分布式网络结构特性的Web平台上面,面向网络用户开通WWW站点,并提供内容丰富的功能服务。
2.网络信息检索的技术与方法
网络信息检索的特点:①信息量更大,需要处理各种不同的语言;②信息检索的范围更宽(多学科,多领域);③信息查询的时效性要求更高;④检索结果是检全率较高,而检准率较低。
三、信息检索的步骤与策略
(一)信息检索的步骤
1.分析研究信息检索课题
分析研究信息检索课题是确定信息检索策略的根本出发点,也是进行检索效率高低和成败的关键。
其主要内容包括:①明确信息检索课题所涉及的领域和范围;②明确所需信息的内容及其内容特征;③明确所需要信息的类型,包括文献媒体,出版类型,所需文献量,年代范围,涉及的语种,有关作者及机构等。
2.选择信息检索工具
信息检索工具是人们为了充分,准确,有效地利用已有的信息资源而加工编制的用来报道,揭示,存储和查找信息的卡片,表册,计算机信息系统和特定出版物。信息检索工具种类繁多,各式各样,只需要选择那些与主题相关的,符合时间要求的质量高的信息检索工具。
具体信息检索工具的类型,可按用途分为两大类:①指示线索型信息检索工具(二次文献),包括书目,馆藏目录,索引文摘,工具书指南,词典。②提供具体信息的工具书(三次文献),包括百科全书,传记资料,手册,机构名录,地理资料,统计资料,年鉴,政府文献。目前检索工具大都存在于计算机信息系统或分布于网络上。
3.确定信息检索方法
完成任何一种特定任务的方法都是十分重要的,信息检索也不例外。常用的信息检索方法有顺查法,倒查法,抽查法,追溯法,循环法等,每一种信息检索方法都有自己的特点,在实践中可以根据信息检索要求选择使用或配合使用,以快速、准确地完成信息检索任务,实现预期的目标。
4.掌握获取原始信息的线索
在分析研究信息检索提问,确定检索范围,选定检索工具和方法以后,就可以实施信息检索。在获取信息线索时要仔细阅读,判断所检出的信息是否符合检索的要求。如检出的信息符合要求,则需要记录信息材料的有关特征,如篇名,作者及工作单位,信息出处等,以便查找原始信息。
5.获取原始信息
获取原始信息是信息检索的最后一步,对信息检索最终目标的完成非常重要。
其主要工作包括:①判断文献的出版类型;②整理文献出处;③根据出版类型在图书馆或信息机构查找馆藏目录或联合目录确定馆藏。④尽可能多渠道、多方式地获取原始信息。
(二)信息检索策略
信息检索策略:是针对检索提问,运用检索方法和技术而设计的信息检索方案,其目的是要达到一定的查全率和查准率。
广义上:是指在分析检索课题的实质内容,明确检索目标的基础上,选择检索系统和检索工具,明确检索途径和检索方法,确定检索词之间的逻辑关系以及查找步骤最佳方案的一系列科学安排。
狭义上:是指检索提问表达式的构造,即运用检索系统特定的检索技术,确定检索词之间的逻辑关系,形成表达用户信息需求的检索提问表达式。
从具体操作来看,信息检索策略制定的过程与信息检索的步骤是对应的,信息检索的步骤表明的是要干些什么,而信息检索策略制定则是要确定每一个步骤中的具体问题,并选择优化的方案,取得优良的检索效果。
(三)信息检索语言
信息检索语言:又称标引语言、索引语言等,是应文献信息的加工、存储和检索的共同需要而发展起来的专门语言,是用于描述检索系统中信息的内容和外部特征及其相互关系和表达信息用户需求提问的概念标识体系。
1.信息检索语言的作用
⑴在表面的操作层次上,检索语言被用来描述文献及文献中信息内容的特征,把文献信息转换为一定的文献标识,构成信息检索系统的各种检索途径;同时它也被用来描述检索提问以及需求内容的特征,把提问转化为一定的提问标识或检索标识,以便在检索系统中查找特定的文献信息。从这一层次来看,信息检索语言是一种逻辑语义工具,旨在对各种事物的表达。
⑵在更深的原理层次上,信息检索语言能够把文献标引与检索提问联系起来,把标引人员与检索人员联系起来,把文献信息的存储与检索联系起来,以取得两者共同理解和相互对应。
2.信息检索语言的类型
⑴描述信息内容特征
题名语言、著者语言、号码语言
⑵描述信息内容特征
分类语言:体系分类语言、组配分类语言、混合分类语言
主题语言:标题词语言、单元词语言、叙词语言、关键词语言
(四)信息检索效率的评价
检索效率是指全、准、快、便、省(查全率,查准率,检索速度,检索方便性,检索成本与效益),最主要的是全和准。
1.评价指标
⑴查全率R:是指衡量信息检索系统在实施某一检索作业时检出相关文献能力的一种测度指标,指检出的相关文献数占系统中相关文献总数的百分比。查全率反应检索的全面性,其补数就是漏查率。计算方法为:R=检出的相关文献量/检索系统中的相关文献总量。
⑵查准率P:是衡量信息系统在实施某一检索作业时检索精确度的一种测度指标,指检出的相关文献数占检出文献总数的百分比。查准率反应检索精确性,其补数就是误差率。计算方法为:检出出的相关文献量/检出的文献总量。
⑶漏查率O:作为查全率的补数。计算方法为:未检出的相关文献量/检索系统中的相关文献总量。
⑷误差率E:作为查准率的补数。计算方法为:检出的非相关文献量/检出的文献总量。
2.影响查全率和查准率的因素
⑴影响查全率的因素
①从文献存储看,主要有:文献库收录文献不全;索引词汇缺乏控制和专指性;词表结构不完整;词间关系模糊或不正确;标引不详;标引前后不一致;标引人员遗漏了原文的重要概念或用词不当等。
②从检索过程来看,主要有:检索策略过于简单;选择和进行逻辑组配不当;检索途径和方法太少;检索人员业务不熟练和缺乏耐心;检索系统不具备截词功能和反馈功能,检索时不能全面地描述检索要求等。
⑵影响查准率的因素
索引词不能准确描述文献主题和检索要求;组配规则不严密;选词及词间关系不正确;标引过于详尽;组配错误;检索时所用检索词或检索式专指度不够,检索面宽于检索要求;检索系统不具备逻辑“非”功能和反馈功能;检索式中允许容纳的词数量有限;截词部位不当,检索式中使用逻辑“或”不当等。
3.查全率和查准率之间的关系
查全率和查准率之间具有密切的关系,即互逆关系。在一个信息检索系统中,当查全率和查准率达到一定程度以后,两者就会呈现出非线性的反变关系。换言之,在查准率不断提高的同时,查全率持续下降;反之,在查全率不断提高的同时,查准率也会持续下降。
四、网络信息检索
(一)网络信息检索的特点
1.检索范围大
网络信息检索可以检索internet上所有领域,所有类型,各种媒体的信息资源,远远超过了联机检索,光盘检索等信息检索方式可利用的信息源。
2.用户界面友好
网络信息资源检索工具直接以用户为服务对象,操作简单方便。它一般采用图形窗口界面,并提供多种导航功能和多种检索途径,检索者无需掌握复杂的检索指令,只要在检索界面上按照提示和规则输入检索式,就可获得检索结果。
3.交互式作业方式
网络信息资源检索工具具有交互式作业的特点,能够及时响应用户的要求,从用户的命令中获取相应的指令,并根据指令执行相应的操作,最后将执行结果反馈给用户。
4.传统检索技术和网络检索技术相融合
网络信息检索既沿用了许多传统的检索方法和技术,又借助于网络信息技术的发展,采用了超文本/超媒体,全文检索,智能检索等新的检索技术。
5.检索效率高
通过超级链接技术,网络信息资源的检索过程和信息的浏览过程都在同一界面内进行,用户只要简单的点击鼠标即可以随意浏览和获取可以直接阅读和利用的Web页面文献全文。
6.信息冗余大
网络信息资源缺乏统一规范的管理和控制,动态性强,且目前的网络信息检索工具在信息搜集、标引等方面存在一定的不足,信息检索过程会产生大量的无用甚至垃圾信息,信息检索的准确性,完整性和权威性难以保证。
(二)网络信息检索工具
网络信息资源检索工具是指在internet上提供信息资源检索服务的计算机系统,其检索对象是存在于internet信息空间中各种类型的网络信息资源。
网络信息资源检索工具的类型:
1.按检索内容分类
⑴综合型:综合型网络资源检索工具也称为通用型网络资源检索工具,是指在采集信息资源时不限定资源的学科、主题范围和数据类型,可以利用它们检索到几乎各个方面的网络信息资源。
⑵专科型:专科型网络资源检索工具是指专门采集某一学科主题、范围的信息资源,并提供适合其专业资源和检索需求特点的更细致的分类、深度标引和描述。
⑶特殊型:特殊型网络信息资源检索工具是专门为某种特殊类型的信息资源提供检索服务的工具。
2.按检索的信息资源类型分类
⑴非Web资源检索工具:主要以非Web资源,如FTP信息资源、Gopher信息资源,Telnet信息资源和Usenet信息资源等特殊类型的信息资源为检索对象的一类检索工具。
⑵Web资源检索工具:是以超文本技术在internet上建立的一种提供网上信息资源导航、检索服务的专门的Web服务器或Web网站。它是一个既以Web资源作为主要检索对象,又以Web形式提供服务的线索工具。
①关键词检索工具:即搜索引擎,它使用自动索引软件来发现、收集并标引网页,建立数据库;以Web形式提供给用户一个检索界面,供用户输入检索关键词、词组或短语等检索项;代替用户在数据库中找出与提问匹配的记录,并返回结果且相关度排序输出。
②目录型检索工具:它是按照某种分类体系编制的一种可供检索的等级结构式目录。分类方法以学科分类为主,使用此类工具的检索方法被称为“分类搜索”,这是一种“自顶向下,逐步细化”的搜索方法,层层遍历。
③混合型检索工具:目前,搜索引擎的关键词检索和目录型检索工具的分类检索逐步整合在一起,既可以直接输入检索词,又可以浏览目录了解特定领域范围的资源,以增强检索能力。
(三)搜索引擎及应用
1.搜索引擎的发展
搜索引擎:是一种在互联网上提供给用户进行关键词,词组或自然语言检索信息的工具,其工作的基本原理是:用户提出检索要求,搜索引擎代替用户在数据库中进行检索,并将检索结果反馈给用户。
2.搜索引擎的基本原理
⑴独立搜索引擎的工作原理
①数据采集;②数据分析与标引;③数据检索;④数据挖掘
⑵元搜索引擎的工作原理
①用户接口;②查询代理;③结果汇总输出
3.搜索引擎的应用
⑴综合型独立搜索引擎
⑵垂直独立搜索引擎
⑶元搜索引擎
⑷移动搜索引擎
(四)网络信息检索的重要领域
1.多媒体信息检索
多媒体信息检索是根据用户的要求对图形、图像、文本、声音、动画等多媒体进行信息检索,得到用户所需的信息。分为基于文本的检索和基于内容的检索。
2.跨语言信息检索(CLIR)
跨语言检索是指用户以某种语言(源语言)来构建和提交检索提问式,系统检索出符合用户需求的其他语言(目标语言)表示的文档集。跨语言信息检索是以单一语言描述的用户查询来检索多语种的信息资源,实质就是单语言的用户查询与多语言的信息表示之间的匹配。
目前跨语言信息检索的主要研究热点包括:跨语言的信息检索辅助技术方法,语言转换方法,信息组织与检索模型等,同时还有一些问题有待进一步研究,如基于语义的信息检索,以应用为导向的跨语言检索平台,相关性检索结果合并,可视化处理等将成为新的研究方向。
3.智能信息检索
智能信息系统是由抽词检索与全文检索发展而来,它是以检索词的相关度为基础,对检索词具有较高的判断能力,理解能力和处理能力的人工智能型检索系统。
近年来,基于语义、Agent、本体的智能信息检索成为研究热点。语义智能信息检索系统试图从语义上理解和索引文档,并根据用户的相关信息智能化地理解用户的信息需求。Agent是一个具有适应性和智能性的软件实体,它与智能信息检索相结合,提高了检索技术的智能化,促进人机交互。本体能够较好的描述概念的内涵及概念与概念之间的关系,具有良好的概念层次结构和对逻辑推理的支持。可以利用其对用户检索进行拓展、推理,从而提高检索的效率与精确度。
4.信息检索可视化
信息检索可视化是信息可视化技术在信息检索中的应用,是指把文献信息,用户提问,各类情报检索模型以及信息检索过程中不可见的内部语义关系转换成图形在,一个二维或三维的可视化空间中显示出来。
作为一个前沿性探索方向,目前信息检索可视化研究与应用已取得了一定进展和成果,并主要体现在检索处理活动的不同环节中:(检索前)提问式构造;检索过程的透明化;(检索后)结果处理;可视化检索词表系统的研制等。
5.智能问答系统
当前人工智能发展迅速,机器学习,神经网络等技术的逐渐应用,大大促进了智能问答系统的发展,产生了一些代表性产品,包括自动化问答平台,语音问答机器人等。这些智能问答系统一问一答的服务方式,方便精准定位用户需求,实现实时交互,大大提高个性化服务程度。
第七章 信息服务
一、信息服务的内容和方式
(一)信息服务的含义和内容
信息服务:就是用不同的方式向用户提供所需信息的一项活动,它是以信息为内容的服务业务。
它包括两个方面的内容:①一是对分散在不同载体上的信息进行收集,评价,选择,组织,存储,使之有序化,成为方便利用的形式;②二是对用户及信息需求进行研究,以便向他们提供有价值的信息。
(二)信息服务的特性
信息服务是发生在信息用户与信息提供者、信息资源、信息服务系统之间的可以满足用户需求的一种或一系列行为。在信息服务过程中,信息源、信息活动和信息用户成为三个基本的构成要素。信息服务的特性主要体现在以下几个方面:
1.知识密集程度高
信息服务要求服务人员具有综合知识素质,能够根据用户的信息需求做出判断,确定优化的服务提供内容和方式;同时用户也需要具备相应的知识储备,只有在用户本身的知识与服务方所提供的信息相匹配时,信息服务才能得到有效的利用。
2.信息用户参与度高
由于用户的信息需求不易明确表达,也不易被感知,因而只有在与用户进行更多的交互的基础上,才可能了解其需要并进行信息服务提供。这使得信息服务成为一种以用户需求为驱动,并需要用户高度参与的交互性服务。
3.信息服务者与用户有较深的接触
信息服务是一种面向用户动态且个性化信息需求的服务,由于接触层面深,服务过程中会面临许多的不确定因素,用户可能随时提出新的要求,因而服务人员经常会取代信息资源而成为信息服务主导因素。
(三)信息服务的原则
1.针对性原则
满足特定用户在特定时间的特定需求是信息服务的基本出发点。信息服务机构要认真研究用户的信息需求和需求的变化,掌握用户利用信息的习惯和特征,选择符合用户需求的信息内容,信息载体,信息渠道,向用户提供针对性很强的信息服务。
2.及时性原则
信息具有时效性,即在特定的时间范围内才能发挥其效用,这个时间一般是在用户做出决策和选择需求信息之前。信息提供过早,用户没有需求,信息效用不可能实现;提供过晚,信息毫无价值。
3.易用性原则
实践表明,用户利用信息受到可获得性和易用性的影响。在决定是否选择和利用信息时,可获得性和易用性往往超过信息本身的价值。因此信息服务机构应为用户获取利用信息提供最大的便利条件。
4.成本/效益原则
信息服务既要讲求社会效益,又要讲求经济效益。虽然信息服务的效益具有潜在性和延迟性,很难做出确定的评价,但不论是对信息服务机构还是用户都需要花费一定的成本,应当确保以最小的花费来获得信息服务的最大效益。
(四)信息服务的类型及方式
1.信息服务的类型
信息服务的发展需要依赖人力资源和技术资源。从信息服务的不同资源依赖模式看,信息服务可以分为执行型,经验型,专家型。
⑴执行型信息服务:主要依赖特定服务系统,前台产品往往是按照用户明确要求供应的信息或信息集合。后台工作集中在信息序化,信息系统设计与维护方面。在服务过程中用户是主导因素,如信息资料传递服务,信息分析软件应用服务,检索服务等。
⑵经验型信息服务:主要依赖特定服务经验,前台产品是在现状分析、判断用户需求基础上供应的定制信息。后台需要强化信息采集,并在预测用户需求基础上预先进行一定信息整合。用户和服务人员在该服务过程中均扮演重要角色,如事务型咨询,行业报道等。
⑶专家型信息服务:前台产品主要为针对性报告和解决方案。后台需要集中于信息采集,信息解析工作,特别强调信息解析。在这一服务过程中,主导因素是服务人员。
2.信息服务的方式
⑴信息检索和传递服务
信息检索和传递服务是信息服务机构利用本机构内部以及外部信息资源体系,根据信息用户具体需求,在合适的时间通过合适的方式向用户提供合适的信息,具体形式包括信息搜索服务,查新服务,馆际互借与文献传递等。
①信息搜索服务:是信息机构服务人员根据用户的需求,利用各种检索工具为其查询获取相关文献信息资源。
②查新服务:是一类传统信息查找服务,其应用目的是为了避免科研选题的盲目性,重复性和成果评审的主观失误等现象。该服务广泛应用于科研立项,成果鉴定,申报奖励,申请专利等。
②馆际互借与文献传递:目前已成为公益信息服务的主要形式之一,该项服务借助便捷的网络环境为用户建立畅通渠道,可为用户提供图书,期刊论文,数据库文献全文等资源的馆际借阅和传递服务,从而满足用户的需求。
⑵信息报道与发布服务
即信息机构对搜集到的大量资料和信息进行整理,加工,评价,研究和选择之后,及时报道出去,满足用户的信息需求,常见的信息报道方式有下列三种:
①文字报道:这是信息报道的主要形式,信息服务机构通过研究用户在科研,生产,经营等活动中承担的任务和提出的信息需求,有选择的将有重要价值的资料和信息(原始信息或一次信息)加工成二次信息和三次信息进行报道。这种报道一般分为定向报道和定题报道。文字报道还可按其内容和作用的不同,分为一次信息报道,二次信息报道和三次信息报道。
②口头报道服务:主要是通过直接交谈,专题讲座,学术会议,信息发布会提供信息。口头报道的信息一般都是零次信息,其特点是迅速及时,交互性强,效果好。
③直观传播报道服务:即通过实物如样品,样机,展览,电影,音像等载体传递信息。这种方式直观生动,易于接受,易于理解,但信息传递范围受到限制。
⑶参考服务
在图书馆为代表的信息机构中,参考服务的开展由来已久。在网络时代,该服务更多地表现为数字参考咨询服务,即建立在网络基础上的将用户与专家的学科专业知识联系起来的问答式服务。目前图书馆界的数字参考咨询服务采用分布式合作参考服务的模式,在一定程度上解决了咨询员数量有限与用户提问无限之间的矛盾。其主要分为异步,实时,合作化三种类型。
①异步服务:主要利用E-mail,BBS,留言版,FAQ等方式实施。
②实时服务:主要通过网络聊天,视频会议,网络呼叫中心等实时交流技术来实现。
③合作化数字参考咨询:是由许多成员机构一起组成一个分布式的数字参考咨询网络,以解决单一图书馆或信息机构因种种条件限制而不能解决的咨询问题。
⑷信息咨询服务
信息咨询服务是帮助用户解决信息问题的一种专门咨询活动。它源于图书馆的参考咨询,随着现代信息服务范围的扩展而不断发展。与其他信息服务方式相比,信息咨询服务灵活多样,更具主动性和渗透性,能直接满足用户的信息需求,帮助用户解决问题,对用户也更具有影响力。信息咨询主要向用户提供下述服务:
①从哪里可以获取所需要的信息,最有价值的信息源是什么;
②最方便的信息渠道是什么,其可靠性如何;
③对信息的可靠性,适用性和经济性进行评价。
④为用户提供信息分析研究报告与预测报告;
⑤为用户提供和推荐信息技术的选择与评价方案。
⑥为用户提供信息系统和网络设计的解决方案等。
二、信息服务的演化与现代发展
(一)信息服务的演化及其发展趋势
现代信息服务的新的发展趋势:
⑴信息服务的移动化
①智能手机等移动终端的普及,移动通信技术和移动互联网技术的发展,改变了人们接入网络和利用网络的方式,使得网络信息服务向移动信息服务延伸。移动信息服务面向移动终端用户,通过无线网络或移动通信网络提供信息服务。
②移动信息服务的特点主要表现在:泛在性、个性化、灵活性、可定位性。这些特点改变了信息服务的方式,丰富了信息服务的内容,增强了用户体验。
⑵信息服务的智能化
①随着人机交互,大数据,人工智能等新一代信息技术的崛起,以及互联网技术和信息通信技术的融合发展,人们的信息获取方式和信息需求日益多元化和多样化。在新技术背景下,信息服务开始朝着智能化的方向发展。
②信息服务的智能化的内涵是:利用大数据分析,根据用户的专业领域,行为习惯,需求偏好等因素,创造性地为用户提供更为优化的信息服务,主要表现为:个性服务、主动服务、自我学习。
③信息服务的智能化主要包括:信息资源组织的智能化、信息服务方式的智能化,信息服务内容的智能化三个方面的内容。
⑶服务场景线上线下融合
中国互联网经济发展经历了最开始的线上online时代,以及随后出现的线上向线下渗透的O2O(online to offline)模式。如今移动互联网和移动支付的普及以及人工智能,物联网等技术的发展,使了线上服务和线下服务相互交融,信息服务对实体经济的渗透率越来越高,信息服务与实体经济呈现融合的趋势。在此背景下,业界提出了线上与线下融合的OMO(Online-Merge-Offline)模式。
⑷此外,信息服务的发展还呈现出以下趋势:
①从单一形式的服务向综合性服务发展;②从以部门为主体的信息服务向社会化信息服务模式转变;③各种专项信息服务和系统化信息保证服务将成为信息服务业务发展的一大主流;④信息服务向多元化和多样化方向发展;⑤基于网络的信息服务个性化,知识化与集成化发展。
(二)网络信息服务
网络信息服务:是指信息服务机构为满足用户的信息需求,通过计算机网络提供经过加工整理的信息产品和服务的总称,它包括信息内容的加工处理,信息内容的提供,信息内容的存储与获取,网络增值服务,信息咨询服务。
1.网络信息服务特点
⑴信息提供知识化
网络信息服务提供的是经过加工、处理的高浓缩的信息产品,其内容与纷繁、无序、未经过整理的网络信息资源相比更加规范,并且能针对用户的需求为其建立起“知识库”,“数据仓库”等,从而达到既为用户节约时间和精力,又能快速提供经过加工、整理的信息内容的目的。
⑵信息服务社会化
网络信息服务机构的信息资源社会化,网络化共享是网络信息服务最鲜明的特色。在网络环境下,网络信息服务机构能够最大限度地满足用户的要求,发挥信息资源的最大效用,充分体现网络中资源无限与服务无限的概念,从封闭的一馆一舍走向开放的社会。与此同时,信息服务所涉及的范围在不断扩大。
⑶信息服务虚拟化
网络打破了地域和时间的界限,网络信息服务机构的工作人员可以通过互联网实时地同用户联系,服务内容,过程都已电子化,服务的主、客体也被隐匿,用户面对的是网络化的信息服务系统,而不再是某个具体的人或物,从而突破了传统信息服务中时间、空间限制,使得用户的信息检索、请求和获取更加便捷和及时,为用户节省了时间和精力。
⑷信息服务个性化
网络信息服务的个性化是互联网出现后信息服务的明显特征,也正是由于网络技术和信息技术的提高,才使信息服务的个性化得到充分的实现和发展。它表现在面对不同的用户,信息服务的内容和过程、手段更加具有针对性、目的性。
2.个性化信息服务
⑴个性化网络信息服务:就是面向用户的信息使用行为,兴趣,爱好,习惯,需求特点,为用户搜索,组织,选择,推荐,提供个性化定制信息服务的内容,系统和功能,以满足用户解决现实问题的信息需求。
⑵个性化信息服务包括两个方面:一是用户可以根据自身的需求定制自己所需要的信息;二是互联网信息库针对用户服务的特点,主动为用户选择最需要的资源与服务,根据用户的需求变化,动态地改变所提供的信息,让用户得到个性化的服务。
⑶它包括的服务方式有:学科门户服务,个性化分类定制服务,信息主动推送服务,信息智能代理服务,数字参考服务,信息帮助检索服务,词表导航服务,自动摘要服务等。
⑷比较重要的技术包括:用户兴趣与行为的获取与用户建模技术,数据挖掘技术,个性化推荐技术,信息过滤技术,人工智能技术,智能代理技术,个性化检索技术等。
3.集成信息服务
⑴信息集成服务:是指在现代数字网络环境下,以现代信息集成理论和技术为基础,通过对服务要素进行集成与动态整合,并构建优势互补的集成化服务体系,使用户在最少的时间里通过最小的成本利用到最需要的资源和服务的一种服务理念和模式。
⑵信息集成服务的发展动因主要包括:①用户需求的变化;②信息资源的多样化;③信息技术的推动;④信息服务自身的需要。
⑶信息集成服务的类型:①以资源为中心的信息集成服务;②以技术为中心的信息集成服务;③机构合作为中心的信息集成服务;④以用户为中心的信息集成服务。
4.移动信息服务
⑴移动搜索服务:①移动搜索引擎的搜索服务;②移动应用内的搜索服务。
⑵移动定位服务:基于位置的服务是由移动通信网络和卫星定位系统结合在一起提供的一种增值服务,通过定位技术获得移动终端的经纬度坐标等位置信息,实现各种与位置相关的服务。
三、信息用户及其需求和行为研究
信息用户:从信息管理学意义上来说,信息用户主要是指那些利用各种信息服务方式或者信息交流渠道获取所需信息的个人和团体。
(一)用户信息需求
1.信息需要与信息需求
⑴信息需要:信息需要是人们在实践活动中为解决各种实际问题而对信息的不满足感和必要感。信息需要在实践活动和待解决的实际问题相对稳定的情况下,处于一种多层次的结构状态。
⑵信息需要的层次:
①(客观状态):在人们因要解决实践活动中的各种实际问题而换取的信息需要状态中,有的信息需要没有被意识到而仍然处于内在状态,有的信息需要被意识到而成为由外在反应的状态。这是状态结构的第一层。
②(认识状态):我们把意识到的信息需要定义为信息需求,即信息需要一旦被意识到就成为信息需求。意识到的信息需要状态中,有的无法用语言文字表达出来而处于“意会”状态,有的被人们用提问等方式表达出来而成为问题状态。这是状态结构的第二层。
③(表达状态):意识到而未达出来的信息需要就叫做潜在信息需求,意识到并未表达出来的信息需要叫做现实信息需求,人们常说的“信息需求”往往是现实信息需求,即用户以自己方便的形式及时获取问题解决所需要的完整可靠的信息需求。当人们表达出自己的信息需求时,他可以面向许多信息源提出这个需求。他可能向信息服务机构提出一个查找信息的需求,也可能将其他信息源提出要求。我们常把用户向信息服务机构提出的具体要求称为信息提问。由此形成了信息需要的第三层结构。
2.信息需求理论
⑴意义构建理论;⑵知识非常态理论
3.信息需求特征
⑴信息需求的多样性特征
用户信息需求具有多样性,而这种多样性是由其所承担的社会角色的多样性决定的。人的社会角色以其获得的方式可以分为先赋角色和自致角色两大类。根据用户不同角色扮演的信息需求,可以把用户的信息需求结构分为个人信息需求,组织信息需求和社会信息需求三个部分。同时用户信息需求的多样性还来自于信息需求产生环境。
⑵信息需求的知识性特征
信息需求不同于其他需求,不仅需要需求强度的刺激,而且有赖于用户自身条件,尤其是其认知能力。作为信息需求从客观状态正确转化到主观状态的条件,用户至少具备三个方面的知识,即行业知识,专业知识和信息资源知识。
⑶信息需求的模糊性特征
用户信息需求是一种派生需要,产生于用户对特定知识的特定欠缺状态,而且信息需要往往与一定的问题或决策相关,对于一个较广范围的知识领域,甚至无法确定其主体,范围或所属。因此用户的信息需求往往处于一种模糊状态。这种用户个人认识的模糊性成为用户信息需求的一种普遍特征。
(二)用户信息行为及其特征和规律
用户的信息行为:是指用户寻求他所需求的信息时所表现出来的需求表达、信息获取、信息利用等行为。用户的信息需求千差万别,影响因素多种多样,用户的信息行为也复杂多变,但是我们从用户信息需求,心理动机,信息行为的特征方面去考察,就可以发现某些共同的规律。
⑴用户所需解决问题的重要性,或所需信息的价值大小是决定用户的信息需求是否转化为信息行为的根本原因。
如果用户所要解决的问题至关重要,某一信息能帮助解决该问题,在信息源唯一的情况下,则用户利用某信息中心的信息服务便唯一地被确定了。
⑵信息和信息服务的可获得性以及信息资源和信息系统的易用性是决定情报用户是否利用某种信息服务的最重要因素。
①可获得性是由信息源的物质载体、信息源及信息机构的地理位置,网络条件等因素所决定的,是信息及信息服务是否方便获取和使用的属性。用户对信息源的选择或对信息服务选择几乎都是建立在可获得性的基础上的,最便于获得的信息源首先被选用,对质量可靠性的要求则是第二位的。
②信息系统的易用性存在着著名的“穆尔斯定律”,该定律指出:“一个信息检索系统,如果对用户来说,他取得信息要比不取得信息更伤脑筋和麻烦的话,这个系统就不会得到利用。”这个定律实际上是著名的齐夫定律的一个具体应用。信息用户总是希望检索系统越便于使用越好,越是简便易用的检索系统,用户使用的频率也越高,反之则很少有用户去使用,这正是“省力法则”的体现。
⑶用户寻求信息的过程首先从个人的资料库中查寻,然后转向非正规渠道,取得同行的帮助。
①只有在这些方法不能达到目的,才考虑到信息系统或信息中心。这种行为特点具有两种原因:易用性所致;可获得性所致。
②信息用户的这些行为与可近性选择理论密切相关。该理论认为,用户利用信息的行为分为选择性确认,选择性吸收和选择性记忆三个阶段,并且每一个阶段的行为都受可近性选择规律的制约。这里的可近性概念是指用户与信息资源之间的相互关系,其内涵包括物理可近性,智力可近性和心理可近性三个方面。
⑷任何信息用户既通过正规渠道,也通过非正规渠道寻找所需要的信息。
对许多用户来说,非正规渠道被认为比正规渠道更为重要。虽然非正规渠道不如正规渠道严谨和可靠,但由于可获得性和易用性以及用户的习惯等原因,它至今仍在信息交流系统中占有重要地位。
⑸用户对提供信息服务及信息资料的时间要求的总趋势是更快更新。
①这一方面是因为,现代社会的生活节奏加快,各种社会系统都在超速运转,人们的各种决策都是刻不容缓,因此要求信息服务更快,更及时。
②另一方面是因为,社会经济和科学技术迅速发展,信息越来越多,老化不断加速,这就要求信息机构所提供的信息应当最新。这两个方面的因素使得信息用户需要最快的服务,最新的信息。
⑹用户向信息中心的信息服务工作者提出咨询的两种现象。
①第一,用户在向信息服务人员提出咨询时,有一种强烈的倾向,即他的提问所表达的往往是他认为该信息中心能够提供给他的东西,而不是他真正想要的东西。出现这种情况的原因有两个:一是信息系统的功能不能令用户满意,二是新用户初次利用信息系统的信息服务。
②第二,用户用书信方式提问比直接向信息人员提出咨询更能准确地表达其信息需求。对计算机信息检索系统的提问往往会发生这种情形。
③针对以上两种现象,信息服务人员在提供服务时,首先应该使用户了解信息系统的特性和功能,其次应该仔细揣摩用户未表达出的真实信息需求,必要时应当尽量让用户在提问单上填写信息需求。
(三)信息用户研究的内容
1.信息用户构成及分类研究
研究信息用户划分的依据或标准以及用户划分的类型,在此基础上研究各类用户的数量构成和知识构成。
2.用户信息需求调查分析
调查分析信息用户需要什么内容、形式、范围和期限之内的信息,什么时候要,习惯于以什么方式,从什么途径去获取自己需求的信息。
3.用户信息心理规律研究
利用心理学的理论和成果研究用户信息心理特点,探索用户信息需求变为信息查找行为的心理状态和过程,分析用户在查找信息和进行信息咨询过程中的心理规律,帮助信息用户消除心理障碍,减少信息系统对用户的约束,为改进信息服务方式,提高服务质量提供依据。
4.用户信息效用及用户吸收信息的机理研究
用户选择、评价和吸收信息的过程是信息价值得以实现的重要环节。这方面需要研究:用户如何选择和评价信息,用户吸收信息做出决策或进行创造的过程,用户信息效用的原理和评估办法等。
5.影响用户信息需求和信息活动的因素研究
信息用户的信息需求是一种特定的社会需要,它受到许多因素的影响,要综合研究社会政治、经济、文化和科学技术对用户信息需求的影响。还要分别研究用户本身的知识素养,个人兴趣,信息能力和职业特点对信息需求的影响。用户的信息活动包括复杂的心理活动和对信息的搜集,查询,吸收及使用的行为活动,这些活动受到大量因素的影响和作用,包括用户的个性因素,环境因素以及信息活动因素等。
6.用户的信息保证研究
用户的信息保证是指通过一切可能的途径和方式给用户提供适当的各种形式的信息,供其选择、使用,它是“信息服务”的系统化,是满足用户信息需求的关键。“信息保证”的目的是及时地,恰当地供给用户所需的信息,为用户所从事的工作服务。研究用户信息保证包括信息保证的原则,用户对信息和信息服务方式的选择,信息保证的方式与系统,用户信息保证的组织与管理,用户培训等方面的内容。
(四)信息用户的研究方法
问卷调查法、访谈法、观察法、实验法、出声思维法、眼动跟踪法、视频捕捉法、网络日志分析
四、网络用户的信息需求及行为
(一)网络用户的信息需求
网络信息用户的信息需求是指用户对具体信息的需求,信息检索工具的检索需求,信息服务的需求。网络用户信息需求表现出了一些新的特点:
⑴信息需求量大幅度增加
人类加工和传递信息的能力越来越强,进一步刺激的对信息需求的强度。随着社会的发展,人类社会的文明进步,在人们的日常上都得以满足之后,要提高生活质量,对休闲,购物,旅游的信息需求会越来越大。社会的可持续性需要大量信息来支持。此外,现代信息技术能够改善用户所处的社会环境,间接的导致用户数量的增加,需求的信息总量也不可避免地增加。
⑵对信息内容的要求越来越高
用户要求信息准确,传递速度快,时间性强,就是由信息本身所具有的时效性特点决定的。面对日趋信息化的高速发展社会,快速,准确,高效地获取和利用信息显得尤为重要,人们对信息的质量要求也必然会来越高。
⑶用户信息需求的社会化
在网络环境中,信息服务部门信息服务的传统模式越来越难以满足用户开放化的信息需求,用户信息需求由原来的稳定性、集中性向开放化的社会性转变。Internet、城域网、局域网给用户创造了开放性的信息需求客观环境,加速了用户信息需求社会化进程。
⑷用户信息需求的集成化
信息网络的发展将计算机技术、远程通信技术和网络信息处理技术有机结合,从根本上改变了信息资源开发、组织和分布的状况,从而使用户可以方便地按主体客观需求在网络环境中集中获取所需信息,即在网络中将各类信息获取方式融为一体,使信息交流、查询、数据获取、全文阅读和信息发布集成为多功能、多渠道、多方式的信息需求与服务利用行为。
⑸信息需求的马太效应和罗宾汉效应
用户信息需求的马太效应是指用户信息需求及其累积信息量之间的相关性。一般而言,信息需求量大的用户,随意时间的推移,其累积的信息量越多,其信息需求也越来越高于平均水平。而信息需求量小的用户,随着时间的推移,其累积的信息总量出现停滞的态势,其信息需求量也因而越来越低于平均水平。另一方面,用户需求水平总是比较平衡的,大多数用户的信息需求总量趋于平均,这是用户信息需求的罗宾汉效应。
(二)网络用户的信息行为
网络用户信息行为:是网络用户在认知思维支配下对外部条件做出的反应,是建立在信息需求和思想动机基础上,利用网络提供的信息内容和信息服务,所从事的信息需求认识与表达,信息查询,信息选择,信息存储,信息吸收与利用以及信息加工,信息交互等活动。
1.网络用户信息查询行为
网络信息查询行为是指用户为获取所需信息,在与网络互动过程中所采取的一系列身体活动和心理活动,它主要通过信息检索行为与信息浏览行为两类行为来完成。
2.网络用户信息选择与存储行为
网络用户的信息选择行为是指用户根据自己的需求,在个体既有知识积累的基础上,利用一定的分析和判断能力,对呈现的网络信息进行相关性判断,选择,从而过滤出对其最为有用的信息或信息链路。
信息存储指用户将挑选出的对其有帮助的信息进行保存的行为。
3.网络用户信息吸收与利用行为
面对搜集的信息,用户需要在头脑中对其加以反应,识别,整理,借助个人的消化学习能力,将其理解吸收并转译为自身知识序列的一分子,从而充实个人的知识储备。
信息利用行为是建立在信息吸收基础上的,即用户使用所掌握的信息并作用于其生产,评价,决策,求解,创新,生活,休闲,人际交往,思想库的充组以及思维层次的提高等方面。它是使信息真正发挥效能的关键环节。
4.网络用户信息交互行为
网络用户信息交互行为是用户利用网络作为交流平台的在线信息交流行为。这种信息交互中,用户既可从网络资源和网络交互对等实体方获取信息,又可向网络上载或向对方传递信息,即成为信息发布者,是一种双向的信息交流行为。根据交互的参与对象,我们可以将网络信息交互行为分为人-机交互型和人-人交互型两种。
5.网络社群用户协同信息行为
与单个个体用户相比,网络社群用户的信息行为表现出较强的交互性和协同性特征。他们除了在网络上查找浏览自己所需信息之外,还发布和分享自己感兴趣的知识,同时更期望与具有相同兴趣的其他用户进行关联互动和协作,体现出强烈的群体性,并影响周围其他用户的网络意识和行为。
第八章 信息系统
一、信息系统的基本概念
(一)信息系统的概念与组成
信息系统:是由计算机硬件、网络和通信设备、计算机软件、信息资源、信息用户和规章制度组成的以处理信息流为目的的人机一体化系统,目的是及时、正确地收集、加工、存储、传递和提供信息,实现对组织中各项活动的管理、调节和控制。
信息系统的组成:①计算机硬件系统、②计算机软件系统、③数据及其存储介质、④通信系统、⑤非计算机系统的信息收集处理设备、⑥规章制度、⑦工作人员
(二)信息系统的功能
1.输入功能
信息系统的输入功能决定于系统所要达到的目的及系统的能力和信息环境的许可。一般情况下,信息系统的输入内容包括信息资源的采集,控制指令的输入,信息检索条件的输入等。
2.存储功能
存储功能指的是系统存储各种信息资料和数据的能力。当原始数据和资料输入信息系统后,首先需要将其存储起来,以便多次使用,并在多个处理环节和过程中实现数据资料共享。
3.处理功能
大量的信息资料和数据得以存储之后,必须及时进行加工处理。处理是信息系统内部的生产过程。信息系统处理功能的大小取决于系统内部的专业技术力量和信息处理技术设备的现代化水平。
4.输出功能
信息系统的各种功能都是为了保证最终实现最佳的输出功能。信息经过处理后,输出内容包括经过信息系统加工处理后的资料信息,信息系统运行过程中状态的反馈信息,以及需要人工干预时的提示信息。
5.控制功能
为了保持信息系统的输入,存储,处理,输出等环节均匀连续地进行,系统必须具有进行管理和控制的能力。信息系统的控制功能体现在两个方面:其一是对构成系统的各种信息处理设备进行控制和管理;其二则是对整个信息加工,处理,输入,输出等环节通过各种程序进行控制。通过控制功能的作用,使信息系统的各项功能最佳化,从而使整个信息系统运行最佳化。
(三)信息系统的发展与类型
1.信息系统的发展阶段
⑴最初的信息系统主要是信息处理系统,如图书情报中心等基于文档的信息检索系统。它是手工的,即传统意义上的系统。
⑵自20世纪40年代电子计算机问世以来,信息系统进入现代信息系统阶段——计算机信息系统,并随着信息技术的飞跃以及现代社会信息需求的增长,迅猛发展。
⑶20世纪50年代,计算机在数据处理技术上的突破,为计算机的应用拓展了空间,陆续出现了数据统计系统,数据更新系统,数据查询系统,数据分析系统,系统状态报告系统等。同时出现了电子数据处理系统,有力地促进的信息系统的发展。
⑷20世纪60年代后期到70年代又出现了多种形式的信息系统,如管理信息系统,决策支持系统。
⑸80年代又出现了支持企业最高决策层的高层主管支持系统和支持中高层管理人员的经理信息系统。同时,不同领域的信息系统也有了新的发展。在人工智能领域出现了专家系统,在加工制造企业中,计算机集成制造系统的应用,使得企业生产经营环节实现自动化。
⑹步入90年代,信息技术进一步发展,出现了群体决策支持系统,智能决策支持系统,产品数据管理系统等。
⑺21世纪,各个行业均出现了大量的不同风格与应用的信息系统,信息系统已经成为评价组织信息化程度的一个最重要的指标。同时,随着数据挖掘技术的出现和发展,计算机对信息的处理上升到了对知识的处理,出现了知识管理系统和基于数据挖掘的客户关系管理等。
信息系统发展进程的阶段理论——诺兰模型
⑴起步阶段:这个阶段从企业引进第一台计算机开始,一般都是先在财务,统计,物资等部门开始使用,随着企业对计算机应用认识的深入,人们体会到计算机应用的价值,开始学习,使用,维护计算机。
⑵扩展阶段:随着计算机在一些部门见到成效,从最初的一些应用部门向其他部门扩散,大量的人工数据处理转向计算机处理,人们对计算机的热情增加,需求增长。但对于整个组织来,说无整体的信息系统,这个阶段需要大量的投资。
⑶控制阶段:由于人们对计算机信息处理需求的增长,造成财务支出大幅度上涨,企业领导不得不对之进行控制,注重采用成本/效益去分析应用开发,并针对各项已开发的应用项目之间的不协调和数据冗余等进行统一规划。控制阶段是实现从以计算机为主转向以数据管理为主的关键,一般发展较慢。
⑷集成阶段:即在经过第三阶段的全面分析后,引进数据库技术,在开发数据网络的条件下,数据处理系统又进入一个高速发展阶段,逐步改进原有系统,发一个能为中、上层管理提供支持,为企业提供各种信息资源的管理系统。该阶段的投资和费用将再次迅速增长。
⑸数据管理阶段:即系统经过集成、综合之后才有可能进入有效的数据管理,实现数据共享,这时的数据已经成为企业的重要资源。
⑹成熟阶段:信息系统成熟表现它与组织的目标一致,从组织的事务处理到高层的管理与决策都能支持,并能适应任何管理和技术的新变化。
2.信息系统的类型
从组织的管理过程和层次角度可将信息系统分为:事务处理系统、管理信息系统、战略决策支持系统,分别对应于组织管理的作业层,管理层和决策层。
⑴事务处理系统(TPS):是处理组织事务和业务数据的系统,它面向数据,对组织事务过程中的数据进行记录,计算,分类,汇总,存储和输出。这类信息系统从结构上相对简单,功能单一,可以在单机上运行,也可以在网络环境运行,主要面向单项应用。事务处理虽然简单,但是数量大且非常重要,是组织所有管理和决策信息系统的基础。
⑵管理信息系统(MIS):是处理组织管理信息的系统,主要用户是组织中的中层管理者。MIS是面向信息的,中层管理者需要使用管理控制信息来衡量绩效,确定控制行动,制定运行人员使用的规章以及分配各种资源等,辅助实现组织各部门的管理功能,为半结构化问题的决策提供支持。
⑶决策支持系统(DSS):是处理非结构化与半结构化问题的系统,支持管理者非程序性决策。它利用事务处理系统中的数据与管理信息系统中的信息,其他组织信息与知识,组织外部信息与知识,为决策者提供决策支持。高层管理者根据自己的知识经验和决策支持系统的支持,在可选方案中选择最优方案。DSS包括三个部分:数据、模型与用户界面。与MIS相比,DSS面向的是知识,有更高的智能水平,可以处理非结构化的问题。
①智能决策支持系统(IDSS):是将人工智能技术引入DSS而形成的一种信息系统。
②群体决策支持系统(GDSS):是DSS的扩展,是把计算机处理,数据通信,电子邮件等多种技术结合起来,提供被称为群件的GDSS软件来支持决策过程,使不同地点的决策人员可以通过自己的计算机终端参与共同决策的计算机辅助决策系统。
③专家系统(ES):是设计用来模拟专门领域的人类专家的提问-解答活动的计算机软件系统。
(四)信息系统的架构模式
1.主机——终端模式
这种模式是一种集中计算环境,使用大型主机作为服务器集中化管理,通过终端来访问数据。在集中模式下,信息系统所提供的服务完全依赖于主机服务器,客户端每个请求都需要在服务器处理,然后将结果返回到客户端,所以对服务器的要求极高。优点是:系统稳定,易于维护;缺点是:对主机资源要求过高,对大规模应用支持不够,难以实现跨硬件和跨平台的信息共享,同时终端机应用任务简单,造成了资源浪费。
2.客户机/服务器(C/S)模式
该模式在分布式计算环境下,结合大型主机机构及网络工作组两者优点,以高性能的数据库服务器为中心,集中管理核心资源,向客户机提供应用所需的数据支持。优点: 既充分地共享服务器的资源,同时也使客户机的本地资源得到了充分利用,整个系统的负载在客户和服务器间得到合理分配,使得大规模,网络化的应用成为可能;缺点:开发成本较高,系统配置、维护管理和升级麻烦且费用大,可管理性差,工作效率低。
3.浏览器/服务器(B/S)模式
B/S模式是在C/S模式的基础上发展起来的,其利用浏览器作为客户端的应用程序,采用浏览器-应用服务器/Web服务器-数据库服务器三层结构,数据信息以网络页面的形式传输。具有更简单,更低成本,能够提供更多信息等诸多优势,使用非常方便,成为信息系统架构的发展趋势。
4.多层架构模式
自三层结构的概念提出和应用之后,其不断被引申和发展,进而逐渐产生了多层结构,即前台界面(如浏览器)、Web服务器,中间件(应用服务器)及数据库服器。这种逻辑结构的出现不仅意味着电子商务系统框架的基本形成,更重要的是它使系统在结构和性能方面趋于合理。
二、信息系统的开发
(一)技术基础与运行环境
信息系统的基础是信息技术。一般认为信息技术是计算机硬件技术,计算机软件技术和通信与网络技术的总称。
1.计算机硬件技术:计算机硬件主要由运算器,控制器,存储器,输入设备和输出设备五大功能部件构成。
2.计算机软件技术:软件系统帮助用户使用计算机硬件完成数据的输入,处理,输出,存储等活动。软件分为系统软件和应用软件。
3.计算机网络技术:计算机网络是用通信介质把分布在不同的地理位置的计算机、计算机系统和其他网络设备连接起来,以功能完善的网络协议实现信息互通和网络资源共享的系统。计算机网络包括:网络介质;协议;节点;链路。
4.数据库技术:数据库是以一定的组织方式存储在一起的相关数据的集合。数据库系统包括:数据集合、硬件、软件和用户四个组成部分。
(二)信息系统开发的阶段
系统开发生命周期(SDLC):是指开发信息系统的一种结构化的按部就班的方法,描述了信息系统开发项目中,从最初的可行性研究一直到完整程序维护的各个阶段。
1.系统计划阶段
①界定要开发的系统;②确定项目范围;③制定项目计划
2.系统分析阶段
①收集业务需求;②对需求进行排序
3.系统设计阶段
①设计技术框架;②设计系统模型
4.系统开发阶段
①建立技术框架;②建立数据库与编程
5.系统测试阶段
①编写测试条件;②实施系统测试
6.系统实施阶段
①编写详细的用户说明书;②为系统用户提供培训
7.系统维护阶段
①设立为系统用户服务的服务处;②提供支持系统变化的环境
(三)信息系统开发方法
信息系统开发方法是基于信息系统开发规律来组织、构造和管理信息系统的,包括人们的思维方法,指导策略,技术途径,活动规则及步骤。抽象思维和形象思维方法是系统开发方法的基本思想;概括与划分、归纳与演绎是系统开发使用的基本逻辑方法。从工程技术角度分析,较有影响的系统开发方法有:结构生命周期法,原型化方法,面向对象法,CASE方法等。
1.结构化生命周期法
结构化生命周期法是一种最常用的信息系统开发方法,又称为结构化开发方法或者瀑布开发法。其基本思想是:在系统分析与设计阶段是自顶向下,逐层分解。在系统实现阶段则是自底向上,通过模块链接形成完整的信息系统开发过程,严格按照系统分析,系统设计,系统实现等流程去开发。
2.原型法
原型法是指系统开发人员在初步了解用户的基础上,借助功能强大的辅助系统开发工具,快速开发一个原型,并将其演示给用户,开发人员根据用户的意见和评价对这个原型进行修改,如此反复,逐步完善,直到用户完全满意为止。步骤:①识别基本需求;②建立初始原型;③系统用户评价;④修正和提高原型
3.面向对象法
面向对象的技术把对象的属性(数据)和处理(方法)封装在一起,通过子类对父类的继承,使得软件便于维护和扩充,提高了软件的可复用性。阶段:①系统调查和需求分析;②面向对象分析;③面向对象设计;④面向对象编程
4.CASE方法
计算机辅助软件工程(CASE)是一种支持整个软件开发生命周期的软件开发自动化技术,是一种从开发者的角度支持信息系统开发的计算机技术。功能是:①支持不同的开发方法;②支持软件开发生命周期的各个阶段;③具有文档出版功能和文字图形编辑功能;④支持开发信息资源共享。
5.测试驱动开发方法
测试驱动开发(TDD)是一种全新的软件开发思路和方法,可以有效地让程序开发人员开发出更高品质的,经过完整测试的程序。TDD方法要求在进行某个功能的代码实现之前,先编写该功能的测试代码,然后只编写使测试通过的功能代码,通过测试来推动整个软件开发的进程。流程:①测试;②实现;③重构
三、信息系统的管理
信息系统的管理:就是对信息系统的开发期,运行期,更新期整个过程进行计划控制,维护和评价。
信息系统项目管理、信息系统质量管理、信息系统运行与维护管理、信息系统评价
四、信息系统的安全
(一)信息系统安全的含义
信息系统安全:是指确保信息系统结构安全、与信息系统相关的元素安全,以及与此相关的各项安全技术,安全服务和安全管理的总和。包括4层含义:⑴信息安全;⑵计算机安全;⑶网络安全;⑷通信安全
(二)信息系统安全体系结构
⑴基于协议的安全体系结构;⑵基于实体的安全体系结构;⑶基于对象的安全体系结构;⑷基于代理的信息系统安全体系结构
(三)信息技术安全保护策略
1.非技术性安全策略
非技术性安全策略是指利用法制保证,行政管理和其他措施等防止信息系统安全事故的发生;
⑴法制保证:目前针对信息系统的法律法规大体可以分为社会规范和技术规范两类。这些法律和标准是保证信息系统安全的依据和主要保障。①社会规范是调整信息活动中人与人之间的行为准则。包括保密法、数据保护法、计算机安全法、计算机犯罪法等。②技术规范是指各种技术标准和规程,如计算机安全标准,网络安全标准,操作系统安全标准,数据和信息安全标准等。
⑵行政管理:是安全管理的一般行政措施,是依据系统的实践活动,为维护系统安全而建立和制定的规章制度和职能结构。主要有:①组织及人员制度;②运行维护和管理制度;③计算机处理的控制与管理制度;④机房保卫制度等。
⑶人员培训:对于信息系统的工作人员,如终端操作员,系统管理员,系统设计人员等,由于他们对系统的功能和结构比较熟悉,因此对系统安全的威胁很大,必须进行全面的安全保密教育,职业道德和法制教育。
2.技术性安全策略
技术性安全策略是指通过采取与系统直接相关的技术手段防止信息系统安全事故的发生。
(四)信息系统安全技术
⑴数据加密技术
利用技术手段把重要的数据变为乱码(加密)传递,防止数据在传输过程中被他人窃听。目前加密技术有对称加密和非对称加密。
⑵身份认证技术
身份认证技术主要通过一次性口令技术和数字签名来验证用户身份是否合法,以减少采用公共网络进行数据传输的风险。
⑶防火墙技术
防火墙是一种隔离技术,通过对特定的网段和服务建立有效的访问控制,在内外网之间形成一道安全屏障。
⑷交换式虚拟局域网技术
是一种以交换机作为网络中心,同时采用虚拟局域网逻辑拓扑结构来加强网络安全的技术。
⑸数据安全存储技术
是指在网络环境下对数据进行集中备份管理,实现备份自动化和灾难恢复的技术。存储备份方法有三种:完全备份,增量备份和差异备份。数据恢复有:硬件恢复和软件恢复两种方法。
⑹漏洞检测技术
漏洞检测技术就是通过对网络信息系统进行检查,查找存在系统安全漏洞的一种技术,常用的方法有被动式和主动式两种。
⑺入侵检测技术
入侵检测技术是一种通过采集和分析被保护系统的信息从而发现入侵行为的技术。入侵检测工作通常由特定的入侵检测系统(IDS)承担。
第九章 信息机构及其管理
一、信息机构的类型与职能
(一)信息机构的含义及类型
1.信息机构的含义
信息机构:是实施信息搜集,加工,分析,储存,传递等有关信息管理活动的组织形式,它普遍存在于各种产业形式中,并且在国民经济和社会发展中具有与日俱增的地位与作用。
2.信息机构的类型
⑴在国家信息部门产业结构研究中,波拉特依据信息产品或服务是否进入市场交易为标准,将国家经济部门划分为一级部门和二级部门。
①一级信息部门:指那些向市场提供价格信息商品或服务,参与市场交换的部门。
②二级信息部门:指那些满足政府或信息企业内部消费而提供信息生产与服务的部门。
⑵结合波拉特对信息部门的划分方法,我们将信息机构划分:
①独立的信息机构:对应于第一信息部门,其信息产品和服务是面向市场或公众这类外部对象的,又细分为公益性信息机构和营利性信息机构两类。
②组织内部的信息机构:对应于第二信息部门,这类机构不是独立机构,而是依附于特定的组织,作为组织内部下设的部门存在,其生产的信息产品和服务只是提供给组织内部,而非面向市场或公众。
(二)信息机构的职能
1.促进科技创新
科技信息资源的建设是科技信息机构的立业之本,是信息服务的内核。科技信息机构可通过创新管理体制和运行机制,加快构建科技文献信息资源与服务平台,实现从以“指示信息来源”为主的信息服务向面向用户、解决问题的“一站式”网络化信息服务模式的转变。
2.为政府部门提供决策支持
面向政府部门服务的信息机构,其职能在于促进改善政府机关的信息环境;满足政府机关人员的日常信息需求;为管理者提供一个可供选择的信息收集与分析的渠道以及为政府机关工作提供后援支持。
3.服务企业
为了应对日益加剧的市场竞争,企业纷纷开始重视和开展情报信息工作,以支撑企业战略决策,技术创新和市场经营等活动。
4.支持科学研究与发展
信息机构开展的信息工作可为科研活动提供三个层面的支持:一是科技文献保障,二是技术监测与分析,三是科研活动的评估评价。
5.其他社会功能
信息机构的工作对人类社会的知识传播具有重要作用。以图书馆为代表的信息机构,作为国家文化事业的重要组成部分和社会文献信息中心,在信息素养教育工作,提高公众信息素养方面发挥重要作用。
二、信息机构的运行与管理
(一)信息机构的运行机制与运行效率
机制是事物自身运行调节的方式与规律,它直接决定着事物自身的运行效率。
(二)信息机构的管理策略
1.战略规划
战略规划是确定一个信息机构发展方向的关键。构想一个成功的战略规划应遵循以下几个相协调的步骤:⑴任务的确定;⑵评价竞争对手的行为;⑶外部环境的评价;⑷支出和收入的预测;⑸制定具体目标;⑹建立工作规范和反馈机制
2.履行管理的各项职能
信息机构的管理是在特定的环境下,对信息机构所拥有的各种资源进行有效的计划,组织,领导和控制,以便达成既定的组织目标——为信息用户服务。具体包括:计划、组织、领导、控制。
3.以流程再造为导向的信息机构组织结构设计
目前信息机构已发展到数字化方式,面对信息用户日益更新的需求,市场日益系列的竞争,环境日益频繁的变化,信息机构需彻底改变传统的工作组织方式,以一体性工作流程取代以往的被各门割裂的、片段黏合式的破碎工作流程。
4.强化激励
信息机构可采取下列措施对员工进行激励:实行功效挂钩,运用晋升激励。
5.从人本管理到知本管理
所谓人本管理就是以人为本,即信任人,尊重人,关心人,理解人,激励人,培养人。以知为本,就是要考虑如何能够激励和活用人员的知识,使人员能够做出可持续的贡献,使人员愿意将其知识用于他们的工作,提高整个信息机构的运行效率。
三、公益性信息机构及其管理
(一)公益性信息机构的性质与定位
公益性信息机构界定为非盈利机构的一种。公益性信息服务是指主要采用无偿或低价服务,让广大用户能够较为公平便利地获取所需的信息资源,但不以营利为目的,其服务效益主要是社会效益和间接的经济效益。
公益性信息机构主要由以下三类组成:⑴隶属于各个政府部门的信息中心,情报所等;⑵图书馆;⑶面向社会的信息研究所,信息服务中心。逐步被定位成非营利性-研究型的信息服务机构。
(二)公益性信息机构的经营思想
公益信息机构在坚持其非营利性-研究型定位的基础上,可具有经营思想和营利行为,在提供免费信息服务为主的同时,对高端和增值的信息产品和服务可以实行收费。
确定了实行有偿信息服务的合理性,公益性信息机构还需要采用“市场导向”的策略,随时了解市场的需求,以满足顾客不断变化的需求。并将通过多种渠道获取的资金转化为资源,从而产生更大的社会效益。
(三)公益性信息机构的协作管理
公共信息服务:是一种开放性的信息服务,即以包括各行业用户在内的公众为对象,以提供公共信息发布,交流和利用服务为内容,以服务于社会为目标的社会化服务。
公共信息资源主要有以下特性:①普遍性②基础性③公开性④共享性⑤广泛性
四、营利性信息机构及其管理
(一)盈利性信息机构的涵义和特点
盈利性信息机构:又可称为信息服务企业,是信息市场化和信息商品化的产物,为了满足信息市场消费需要,从事信息生产、流通等经济活动,进行自主经营,实现独立经济核算,具有法人资格的专门经济单位。
特点:⑴服务格局市场化;⑵经营管理灵活性;⑶服务项目特色化;⑷技术手段先进性。
(二)营利性信息计划的市场营销管理
1.营利性信息机构市场营销战略
⑴信息市场细分;⑵目标市场选择;⑶目标市场定位
2.营利性信息机构市场营销策略
⑴产品和服务策略
⑵价格策略:①高价撇脂策略;②低价渗透策略;③差别价格策略;④免费定价策略。
⑶渠道策略
⑷促销策略
(三)营利性信息机构的发展策略
1.产业集群发展模式
信息产业集群是指大量信息产业及相关支撑机构在一定范围内的集中,具有机构地域化集聚、创新型强,各企业高度专业化,企业之间协作分工等特点。
营利性信息机构的集群发展模式的特点:①知识技术密集;②产业链条化;③协同网络化;集群生态化
2.协同创新发展方式
协同创新的关键是形成以企业、高校、研究机构为核心要素的大跨度整合的创新组织模式,以金融机构,中介组织,创新平台,非营利性组织等为辅助要素的多元主体协同互动的创新模式。它具有整体性和动态性的特点。
3.生态系统运行机制
信息产业集群生态系统是由自然子系统,社会子系统以及经济子系统共同构成的产业集群生态系统。在生态系统中,营利性信息机构及其他生态主体之间形成环环相扣的,具有依存关系的生态链。
第十章 信息政策与信息法律
一、信息政策
(一)信息政策的基本问题
1.信息政策的含义和内容
⑴信息政策的含义
国家信息政策:是指在一国范围内,国家或政府为解决信息管理和信息经济发展中出现的、关系和涉及公共利益、权益、安全问题,保障信息活动协调发展而采取的有关信息产品及资源生产、流通、利用、分配以及促进和推动相关信息技术发展的一系列措施、规划、原则或指南。
⑵信息政策的范围
①确定社会的信息需求;②设计适当的方法以便使信息需求得到满足;③促进信息资源的有效利用;④信息专业人员的人力发展;⑤确定必须的基础建设;⑥确保持续的经费支持。
⑶信息政策的分类
①从信息政策研究的历史看,信息政策大致可以分为四类:规范性框架和指南;具体研究报告和咨询报告;一般性理论方法研究;与信息技术发展有关的信息政策。
②从制定信息政策的主体和适用范围划分:国际性信息政策、区域性信息政策、国家性信息政策、地方性信息政策。
③从信息政策规范的领域划分:经济信息政策、科技信息政策、教育信息政策、文化信息政策等。
⑷信息政策的作用
①确定社会信息活动的发展方针,指明信息事业的大方向,指导信息事业的发展。
②调动或约束社会信息力量,促进信息资源的合理开发和有效利用。
③协调信息环境系统各部门与外部环境的相互关系,保证社会信息环境的健康发展。
④干预信息资源的建设和信息资源的利用过程。
⑤规范信息工作的标准化。
(二)国家信息政策体系的构建
1.政策主体
政府是国家信息政策的主体,除了政府之外,信息政策主体表现出多元化属性。从信息系统和网络的普遍性观点来看,信息政策主体可能涉及社会的各个方面,从国家到地方政府,从政府的各个行业主管部门到社会团体。
2.政策目标
信息政策目标是指通过制定信息政策所实现的利益协调和分配关系。当前我国国家信息政策的目标是:深入践行新发展理念,准确把握国际国内信息化发展大趋势,全面落实国家重大战略部署,统筹各地区各部门信息化工作。
3.政策问题
信息政策问题是指能够列入政策制定议程的客观社会问题,即信息政策应该解决的社会矛盾和问题。现代社会的信息政策问题具有复合性和关联性,要求对信息政策从整体上进行综合性的研究,以便理清信息政策所涉及的各种复杂关系。信息政策问题分为经济问题和法律问题。
4.政策内容
国家信息政策内容简化成经济的和法律的两个层面加以研究。⑴经济层面:宏观产业发展经济问题;微观市场经济问题。⑵法律层面:知识产权保护;信息自由流通与信息安全。
5.政策形式
政策形式指政策内容的外在表现形式,是宣传、执行政策的有效工具和合法依据。信息政策的形式是指国家制定并发布执行的有关信息政策内容的文件、指南,或规定。在建设社会主义法治国家的背景下,应将国家信息政策转变为具体的、可操作的法律法规,进行有效的贯彻和实施。
(三)国内外信息政策概述
二、信息法律
(一)信息法律的基本问题
1.信息法律的含义
信息法律:是指在调整信息活动中产生的社会关系的法律规范的总称。这里的社会关系主要涉及利益、权益与安全问题,这些法律规范涉及信息系统、处理信息的组织和对信息负有责任的个人等。信息法律的主要内容包括知识产权法,信息安全法,信息公开法,新闻出版与传播法,电信法,电子商务法,有关计算机犯罪的法律等。
2.信息法律的作用
⑴信息法律的规范作用 (根据规范作用的对象不同)
①指引作用:是指对信息主体的行为所起到的导向、引路的作用。其对象是信息主体自己的行为。
②评价作用:是指信息法律作为信息主体对他人的行为的评价标准所起的作用。其作用对象是他人的行为。
③预测作用:是指信息主体根据信息法律的规定,可以预先估计人们相互间怎样行为以及行为的后果等,从而对自身的行为做出合理的安排。对象是人们之间的相互行为。
④强制作用:它主要体现在对信息违法行为以及犯罪行为的震慑、惩罚和预防。
⑵信息法律的社会作用
①保护和促进科学技术进步:建立和完善信息法律的目的之一在于通过确认技术规范,维护技术发明者的利益,保护和促进信息科技进步,使其更能更多地造福于人类。
②保护国家利益和社会公共利益:这种保护作用在保护各信息主体的信息权力方面,同保障基本人权在根本上是一致的,它是充分保护信息权利的必然要求。
③及时妥善解决信息化所产生的各种矛盾:在信息化社会,人们将要面临信息社会必然产生的效率与公平,信息相对不足或过多过滥、信息质量低劣或信息虚假。信息的营利性和社会公益性之间的矛盾。这些矛盾的解决,离不开信息法律的社会规范作用。
④促进信息产业的发展与社会信息化进程:信息法律适应了信息社会的发展特点与技术特征,弥补了传统法律规范的不足。它不仅可以为经济效率,效益的提高提供保障,而且可以保护新的社会关系、新的生产力。客观上促进了信息产业的发展壮大。同时,有效规范和调整新的信息社会矛盾,为信息化发展排除障碍。
⑤推动经济与社会的良性运行和协调发展:这是信息法律在发挥上述作用的基础上,间接产生的更深层次的影响,并且这种影响体现了信息法律的终极目标。
⑶信息法律的调整对象
信息法律的调整对象是信息关系,是指在实现信息过程时所产生的社会关系。它包含两个方面:一方面是围绕信息的生产,传播,收集,处理,存储,应用,交换,消费等信息活动所产生的社会关系。另一方面是围绕信息技术发展所产生的一系列新型的社会关系和社会问题。
信息法律关系:是指信息法律在调整人们的信息活动过程中形成的权利、义务关系。信息法律关系的构成要素主要包括:主体、客体和内容三个方面。
⑷信息化给社会带来的矛盾冲突
①信息自由与信息安全的矛盾
信息自由权是公民的一项重要权利,公民依法可以自由地采集,加工,处理,传播,存储和利用信息。计算机网络的发展为人们享有更广泛的言论自由提供了广阔的空间和方便条件,然而信息自由并非是绝对自由和滥用信息。在现代信息技术构成的网络结构中,信息系统的安全性正受到严重威胁,其脆弱性不单单是一个技术问题,同时也是一个法律规则问题。
②信息不足与信息过滥的矛盾
人类社会的信息流动呈现出不均衡性。一方面,不能充分满足人们对信息获取的需求;另一方面还存在着信息过剩问题。信息过滥现象是指在当今信息爆炸的时代,在浩瀚的信息面前鱼目混珠,真伪难辨。当真实的精确的信息和失真的模糊的信息混杂在一起时,相对信息量反而减少了,于是信息过剩反而带来新的信息匮乏。
③信息的社会公益性与个体盈利性的矛盾
信息的社会公益性要求它广泛、无偿和公开地提供给社会公众利用,这就与信息所有者的经济利益产生了矛盾。效率与公平之间的矛盾表现为个人利益和社会利益之间的矛盾,信息的社会共享与个体盈利之间的矛盾,只有通过法律手段来加以协调解决,兼顾效率与公平两个方面。
④信息保密与信息公开的矛盾
在社会化进程中,一方面应当对保密的信息进行有效的保护,另一方面应该对需要公开的进行充分公开。信息保密和公开之间如果缺乏应有的协调,就会使应当公开的信息得不到公开,应当保密的信息不能有效地加以保护。尤其是政府信息和社会公益信息更需要用法律规范来促使其在充分公开的同时又不损害国家利益。
⑤信息商品流通过程中的矛盾
信息商品在流通过程中存在着很多矛盾。不仅存在着信息商品的拥有者,生产者,传播者的信息权的问题,也存在着信息商品在信息活动主体之间交易转让时的所有权和许可使用权等财产权益纠纷,同时各个信息商品主体的个人利益与社会利益之间的冲突也相当突出。目前信息市场还缺乏完善有效的管理规范和运行机制,迫切要求制定相应的法律来解决这一问题。
(二)信息法律与信息政策的关系
1.信息法律与信息政策的区别
⑴两者制定的机关和程序不同。
①信息法律是由国家专门的立法机关及全国人民代表大会及常务委员会,或者拥有造法权能的机关如国务院及其各部委等依照法律程序创制的,其立法权限和创制程序具有严格而复杂的规定。
②信息政策的制定则出于多门,程序也显得不很严格,我国的信息政策是按部门、划领域制定的。
⑵两者的表现形式不同。
①信息法律通常采用制定法的形式,主要有民法通则,一些单行法律,如《著作法》《专利法》《商标法》《反不正当竞争法》和一些单行法规。
②信息政策则经常以国家机关制定和颁布的决议,决定,命令,规则,规定,意见以及通知,会议纪要等形式出现。
⑶两者调整的范围、方式不同。
①从范围上看,信息政策所调整的社会关系要比信息法律广泛的多;而信息法律所调整则往往是那些在信息活动中对国家社会有较大影响的社会关系领域。
②从方式上看,信息法律一般调整较为稳定的社会关系,所以他偏重对既有的社会关系的确认,保护或控制;而信息政策是应对的手段,它不仅要处理既有的问题,而且要对正在形成或将要出现的问题做反应,因此它偏重采用灵活多样的措施,以适应社会形势不断发展的需要。
⑷两者的稳定性程度不同。
①信息政策作为社会信息活动的指导原则,往往是宏观的方针性号召,在政策执行中允许有灵活性,而且随着信息环境的变化,要不断的修正,补充和完善,由于动态性较大,因此时效性较短。
②信息法律一般是在信息政策长期实施以后取得一定经验的基础上确定下来的比较具体的行为规范,时效较长,而且它的制定,修改或废除都要经过严格复杂的法定程序,就相当的稳定性。
⑸两者的本质属性和功能不同。
①信息政策则代表的是政治组织的利益和意义,不具备强制力的属性;而信息法律代表的是国家的利益和意志,具有强制力的属性。
②从功能上讲,信息政策的基本功能是“导向”,即运用行政手段,鼓励和支持社会信息活动以达成信息政策的目标;而信息法律的基本功能是“制约”,即运用法律手段限制和约束社会信息行为,以保护信息环境的健康发展。
2.信息政策与信息法律的联系
⑴信息政策对信息立法有指导作用。
信息政策对一切社会信息活动进行指导,信息立法作为社会信息活动的重要组成部分,也离不开信息政策的指导。同时信息政策又是信息法律制定的依据。
⑵信息政策需要依靠信息法律贯彻实施。
信息法律是实现国家和执政党信息政策最为重要的手段,信息法律具有强制性,而信息政策则不具备这一属性,因此如果没有信息法律的体现和贯彻,仅仅依靠信息政策本身的力量和自由,往往达不到它所要达到的经济,政治目的。
(三)信息法律体系
信息法律体系:是指信息法律的结构及分类,也就是信息法律包括哪些法律制度,即国家制定的调整信息的获取,加工处理,传播,使用,转让等信息活动过程以及信息技术活动领域中所产生的各种利益问题和安全问题的全部法律规范。
1.信息基本法
该法主要是对信息立法的宗旨,原则,调整对象和范围,信息,法律关系的主体和客体等作出规定。
2.信息法律制度和法律规范
信息技术法律制度、信息资源管理法律制度、信息产权法律制度、信息产业管理法律制度、信息市场管理法律制度、信息机构组织管理法律制度、信息安全、保密与信息犯罪法律制度、信息人才法律制度、国际信息合作与交流法律制度。
(四)信息法律的立法模式
1.专门立法模式
一些国家根据实际情况,先从某些领域入手,通过专门的立法,构筑用以调整该领域内信息化发展的新的法律规范体系。
2.修改适用模式
许多信息技术相对落后,信息化程度相对欠发达的发展中国家都主要应用这种立法模式,他们基本上只对已经存在的相对完整且普遍适用的传统法律部门中的主干法律作出补充性修改,一般不另外专门单独立法。
3.谨慎暂缓模式
由于国家的信息化发展整体上正处于在迅速发展的过程中,有许多具体问题还需要研究、探索和试验。许多国家目前主要采用“谨慎”的态度,暂缓立法,而主要依靠政府的政策导向推动国家信息化的自由发展。
三、信息政策与信息法律的制定原则
1.务实性原则
制定国家信息政策与法律必须要从国情出发,实事求是,与社会信息化的现状与实际发展水平相一致。
2.协调性原则
①国家原有的政策法律与新制定的政策法律相互协调和配合。
②在国家信息政策法律内部,无论是纵向上还是横向上的信息政策法律之间相互都能够取得协调,达成一致。
③信息政策法律既要与宪法相协调,即合宪,同时又要能够相互与经济,政治,科技,文化,军事等其他领域部门的政策,法律相互协调。
④做到尽量与国际惯例接轨,即做好与国际信息信策法律的协调工作。
3.均衡性原则
人类所处的信息环境存在着四大基本矛盾:①信息自由与信息保密;②信息不足与信息过滥;③信息公开与信息安全;④信息的社会共享性(信息共享)与信息的私人占有性(信息独占)之间的矛盾。
国家在制定信息政策与法律时必须要正视并解决好这一问题,要充分体现均衡性原则,注意对矛盾双方的利益的协调,找到双方都能够接受的一个利益平衡点,即使双方最终达到均衡状态。
4.经济性原则
从经济性原则出发,在制定信息政策、法律时,要使整个制定成本小于社会从它所获得的收益。
另一方面,国家信息政策法律本身也应该具有经济功能,即能够起到降低交易费用,提高经济效益,提供激励机制,减少不确定性,将外部性予以内部化以及促成合作等经济作用。
5.弹性原则
该原则要求国家信息政策法律不仅是作为当前已经存在的信息活动的总结、概括和提炼,还要具有导向、预示的功能,能够对信息技术的前沿发展和信息社会日新月异的变化趋向有所预见,以便当前已有的国家信息政策法律能够根据环境的变化和时代的发展而及时进行补充和修改。
6.全面性原则
①在数量上,所制定的信息法律远远不能满足信息社会日益增长的法律需求;②在质量上,法律内容较为宽泛,条文不精细,可操作性较差,严重影响了法律的效力于司法效率。因此在国家信息政策与法律制定过程中必须要积极实施并认真贯彻全面性的原则,从而构建出系统全面的信息政策法律体系。
7.动态性原则
由于信息政策一般是在一定的历史时期内发挥作用,具有阶段性,灵活性和可变的特点;而信息法律是由成熟的政策转换而来的,具有较强的稳定性。因此相对于信息法律而言,动态性的制定原则在国家信息政策的制定中表现的尤为明显。
8.重点性原则
在制定国家信息政策法律时,应该集中力量去解决所面临的众多问题中的要害问题与关键问题。从空间角度来看,既要实施全面性原则,方方面面均要涉及,同时也要明确方向,重点突出,优先考虑当前当前需要迫切制定政策和进行立法的领域。从时间角度来讲,则是在不同的发展时期要有不同的重点。
四、网络环境下的信息政策与法律
(一)网络信息政策
1.网络信息政策的含义及产生背景
网络信息政策:是国家信息政策的有机组成部分,是针对互联网的特殊性而制定的有关规范、管理和发展网络信息活动的行为准则和指南。
2.网络信息政策的内容框架
信息网络系统的建设和发展政策、信息网络资源政策、网络信息产业政策、网络信息市场政策。
(二)网络环境下的信息法律
网络知识产权、电子商务、网络隐私、网络信息安全、人工智能法律问题