导图社区 以用户为中心的系统设计UCSD
以用户为中心的系统设计(User-Centered Systems Design)包含对用户需求的关注,对活动、任务以及需求的分析,早期的测试和评估,以及迭代式设计。比其他方法有更加广泛的关注点,但是它实际上更加强调用户,而不是关注于征集需求和说明的规范化方法,不是一个线性死板的设计过程,而是一个更加灵活、迭代式的设计方法。
编辑于2025-05-10 16:55:24媒体可及性(accessibility)技术可以为感官功能缺损的用户提供可供替代的技术支持和信息获取方式,从而实现用户信息获取和传播的无障碍。传统的媒体可及性研究将视角集中于计算机硬件的技术实现上,对于无障碍内容、用户使用和可及性技术的影响方面缺乏关注,使研究范式以“技术”为中心。网络技术的兴起和广泛应用,使用户的能动性被激发,技术不再是阻隔残障者与健常人信息获取和使用的屏障,数字技术与多媒体互换技术为无障碍传播的实现提供了有利的技术条件。本研究正是对新媒体可及性技术及其传播无障碍实现方面的多维度研究。本书将分为三大部分(共七章),从新媒体的可及性技术实现、视听障碍用户新媒体技术的使用和评价、基于新媒体可及性技术的用户传播行为及影响三个方面,对基于新媒体技术的无障碍传播问题进行研究。
库存管理实际上涉及所有与运筹学有关的基本理论,在理想的情况下,学生至少应该掌握了最优化理论、随机过程及动态规划.
以用户为中心的系统设计(User-Centered Systems Design)包含对用户需求的关注,对活动、任务以及需求的分析,早期的测试和评估,以及迭代式设计。比其他方法有更加广泛的关注点,但是它实际上更加强调用户,而不是关注于征集需求和说明的规范化方法,不是一个线性死板的设计过程,而是一个更加灵活、迭代式的设计方法。
社区模板帮助中心,点此进入>>
媒体可及性(accessibility)技术可以为感官功能缺损的用户提供可供替代的技术支持和信息获取方式,从而实现用户信息获取和传播的无障碍。传统的媒体可及性研究将视角集中于计算机硬件的技术实现上,对于无障碍内容、用户使用和可及性技术的影响方面缺乏关注,使研究范式以“技术”为中心。网络技术的兴起和广泛应用,使用户的能动性被激发,技术不再是阻隔残障者与健常人信息获取和使用的屏障,数字技术与多媒体互换技术为无障碍传播的实现提供了有利的技术条件。本研究正是对新媒体可及性技术及其传播无障碍实现方面的多维度研究。本书将分为三大部分(共七章),从新媒体的可及性技术实现、视听障碍用户新媒体技术的使用和评价、基于新媒体可及性技术的用户传播行为及影响三个方面,对基于新媒体技术的无障碍传播问题进行研究。
库存管理实际上涉及所有与运筹学有关的基本理论,在理想的情况下,学生至少应该掌握了最优化理论、随机过程及动态规划.
以用户为中心的系统设计(User-Centered Systems Design)包含对用户需求的关注,对活动、任务以及需求的分析,早期的测试和评估,以及迭代式设计。比其他方法有更加广泛的关注点,但是它实际上更加强调用户,而不是关注于征集需求和说明的规范化方法,不是一个线性死板的设计过程,而是一个更加灵活、迭代式的设计方法。
以用户为中心的系统设计 UCSD
书本信息
Foundations for Designing User-Centered Systems
作者:弗兰克·里特(Frank E. Ritter)、戈登·巴克斯特(Gordon D. Baxter)、伊丽莎白·丘吉尔(Elizabeth F. Churchill)
译者:田丰、张小龙
Springer,机械工业出版社,2018
导论
设计一个好的与用户交互的系统、工具或产品涉及很多学科领域,包括传统的人因、逐渐成熟的人机交互,以及新兴的社会计算等领域
本书核心假设:理解人们有助于创建更好的交互技术和系统
未来的需求不再是面向计算机的人,而是面向人的计算机(Nickerson, 1969)
理解用户
许多设计和开发人员容易犯两类错误
假设技术的被使用方式是符合他们的想象
这个假设又建立在另一个错误假设之上:每个人都是相同的
eg硬币设计
研究发现很多人需要只通过触摸来辨别硬币比如口袋中的硬币,因此为盲人所做的设计也就是为每个人所做的设计
人们会记住他们所注意到的细节,但只是那些足够他们去完成任务的细节
我们认为会怎么做和实际上会怎么做存在着差别
多数情况下我们忙于完成任务而无法准确观察我们是怎样做的,也很少记笔记,关于我们行为的回忆都会受到人类记忆的固有弱点的影响
我们不能准确地估算时间,也难于成功和失败
行为的某些方面(比如基本知觉)是难于观察的,而有些方面(如进行某些空间推理任务)则难以用语言进行描述和溯因
了解用户的收益和成本
用户通常不能像设计人员那样去使用系统,因为他们不像设计者一样了解那么多
但有时真实情况恰好相反,用户可能很有创新性地以设计者从没设想过的方式使用技术
eg电子表格最初是为会计设计的,但现在很多人用它处理各种表格数据
eg短信系统最初是为了让工程师调试手机的通信系统而设计的,但现在成为手机用户的一般通信方式
三大收益
更可用的产品
好的可用性带来更广泛的使用和更快速的接受率
有时一件工具可用性的提升并不是直接因为界面的改善,而是因为实用性的增强和使用率的提高
eg传统手机重量和尺寸的减小
评估鸿沟:用户有时难以理解他们在寻找什么
执行鸿沟:用户可能不知道在使用某个特定界面完成什么任务时应该做什么
很多情况下,因为对用户缺乏了解,一部分用户被排除在外
eg视障用户、拨号上网用户和距离网站很遥远的用户
更低的成本
为支持用户而进行的设计可以为公司节省资金,甚至达到上百万美元的程度
疏忽和错误
“错误”往往是由于人们错误的计划进行操作造成的
“疏忽”在相当成熟的界面和使用者上面也可能出现
良好的界面设计可以减少培训时间,在一个设备的整个使用周期可以节约大量培训费用
反面,有些系统不可用而造成对系统的废弃或成本高昂的改动
使用有多种不同模式的机器通常会使用户出错,用户可能意识不到默认模式
成本1:了解用户也不能保证成功
可用性差的系统也可能因为各种各样的原因成为一个成功的系统,可能它们提供了一种独特且有用的功能
eg飞机、计算机的最初版本都很难用
只有当一个产品或系统的绝大多数方面都是对的时,它才能是成功的
可用性好并不能保证上市时间是对的,也不能使定价准确
可依赖性和营销等其他的关键因素同样可能失败
系统对于用户也必须是可接受的,一个局部的新界面设计可能是成功的,但是如果它与现行的设计惯例有太多冲突(即使新设计才是正确的),系统也会很快遭到抛弃
Glashko, Tabas 2009:要了解成功,必须先了解用户、商业模式和所需的技术
成本2:知道何时停止分析用户是困难的
很多可用性相关的设计问题能够通过研究一小部分用户就确定下来,但需要注意的是,这种方法的结果高度依赖于所选用户的种类和特定的界面
系统部署的传统方法主要聚焦于让用户适应系统,让合适的人去用系统,进行培训来弥补系统和用户的落差
但现在人们对技术比过去更了解,并且期待系统是立即可用的
最近环境变化要求系统要让更多人使用(如残疾人),让用户去使用系统越来越不能接受
应该在项目的最初阶段就开始考虑用户
定义系统的功能需求时,应该同时定义它的可用性需求
需求定义所需要的细节层次应该由所涉及的相关风险来决定,交付风险和生命危险
建议设计人员需要在相关领域做一些背景研究,观察与要设计的系统相似的现有系统,查阅咨询相关的合适的资源和信息
和用户会面,观察他们的工作场景和任务,并进行一些研究来探究他们的想法,建立对于系统使用情景的理解
明确为专业人员设计的系统,用户界面的设计可能不需要考虑太多。成本远远大于收益
设计人员应该研究用户和任务,直到对用户的不了解所带来的风险比其他风险要小为止
更安全的系统
飞行员、药剂师、X光等一出错就很容易导致重大金额乃至生命的损失
简史
UCD 以用户为中心的设计
有时在中间加个system,变成User-Centered Systems Design即UCSD
20世纪80年代开始显露头角
包含对用户需求的关注,对活动、任务以及需求的分析,早期的测试和评估,以及迭代式设计
比其他方法有更加广泛的关注点,但是它实际上更加强调用户,而不是关注于征集需求和说明的规范化方法,不是一个线性死板的设计过程,而是一个更加灵活、迭代式的设计方法
以人为中心的设计
更进一步,考虑系统还可以怎样影响人们的能力和特征
人类应该被看作是信息系统中最重要的元素,应该被引入设计
根植于多个基础和应用领域
认知和社会心理学
认知建模和可编程用户模型
20世纪50年代后期,心理学家意识到可计算过程或许可以较好地模拟人类的思维过程
20世纪60年代后期到80年代,认知模型关注的是人类如何符号化地解决问题,往往局限于处理一个/一种任务,关注了人类信息处理,但是不关注从外部世界获取信息的方式、行为在实践时的执行方式,以及外部条件对相关认知过程发生速度的影响方式
一个个研究特定行为、相互独立的微观系统
把微观理论集成的需求与日俱增,催生了认知统一理论Unified Theories of Cognition, UTC
执行感知、学习、推理、问题求解、记忆、决策、本体感受和行走等复杂任务
认知建模和人机交互的知识重叠已经有很长时间
人机交互HCI
SIGCHI协会定义:一个关注于供人使用的交互计算系统的设计、评估和实现,以及对相关的主要现象进行研究的学科
知名方法
MHP模型:Model Human Processor
GMOS: Golas, Operations, Methods, Selection
KLM: Keystroke Level Method
PUM: Programmable User Model
用户体验UX
用户对于使用或预期使用产品、系统或服务的感知和反应
影响用户体验的三个因素
系统
用户及其特征
使用技术或系统的环境背景
经常和“可用性”交替使用,但二者关注点不一样。可用性关注的是完成工作,用户体验把用户的感觉、心情、价值观、即时/延迟反应放在首位
语言学
数学
计算机科学
工程学
人因工效学
human factors and ergonomics
人因human factor开始涵盖工作实践中更为广泛的背景因素,超越了物理环境因素和生物力学,扩展到人员的选拔和培训(让人适应环境)
工效学ergonomics一词来源于希腊文字中表示工作的ergon和表示自然法则的nomos,因此人因工效学包括解剖学、工程学、生理学、心理学等许多研究内容(让环境适应人,措施互补)
目的:使工作环境和工作操作中的安全和健康达到最优,并确保工具、设备还有其他物品的可用性(fit)
传统工效学classical ergonomics
设计师的主要贡献在于刻度盘和仪表、控制旋钮、面板布局的改进设计,一定程度上指定了涉及温度、湿度和工作面位置等最佳物理工作环境
这个经典方法起源于军工设备的设计,现在也用于民用物品和工作环境的设计
经常使用咨询模式,咨询建议通常以原则、指南和标准的形式出现
缺点
传统工效学仅仅应用在开发的末期,为最终产品提出建议,而不是贯穿在整个产品的开发过程,有些不合理的设计决策已经深入到设计中了,难修正
设计活动的准则和规定往往太过泛化,,欠缺相关背景的具体细节
错误工效学error ergonomics
主要对人类在使用系统时出现的错误进行研究并加以解释
这个方法往往倡导针对安全程序培训和保障安全材料的重视,从而提高工作人员安全意识和积极性
系统工效学
20世纪50年代在美国开发的方法
用户和系统被看作某个工作环境中的一个整体交互系统
使用该方法,系统设计是一个并行开发过程
工作
注意最终产品的物理、行为和认知方面因素
先从一个符合逻辑和语法的角度考虑任务,确定需要的任务功能,并把功能在用户和系统之间进行分配
不同:UCD是考虑人类用户的处理能力,并从用户的角度来分析任务
设计人员子系统
设计工作描述和工作支持资料,如手册和培训方案
认知系统工程/认知工效学
最早出现在20世纪70-80年代早期,随后又经过了不断的演变和发展
该领域现在更多被称为认知系统工程(cognitive system engineering, CSE)
关注的是人机系统(human-machine system),机器可以代表任何一种为某种特定目的而设计的人工产品
融合了心理学的规划、语言、解决问题、学习、记忆和感知等领域,让这些过程能一起协调工作
与其他的很多心理学分支相比,认知系统工程的实际环境可能对实验条件处理有更加细致的要求,比如个体差异、不确定性、特定的问题求解等情况,并且更加强调用户和机器之间行为的协作性(co-agency)
大多关心在复杂动态领域中的应用,如飞行、工业过程控制、医疗护理等
社会技术系统设计STSD
socio-technical system design,用来描述那些包括人、机器以及工作系统环境之间复杂交互关系的系统
二战结束后由塔维斯托克研究所提出,20世纪70年代全盛期,80、90年代曾一度低迷,仍然广泛应用在健康信息学领域用来开发医疗健康保健系统
但是在实践过程中,这些方法更像是设计指导哲学,而不是通常能与系统工程结合起来的设计方法
科学管理
劳动、工业及职业心理学
人际关系
组织行为学
标准/原则/指导方针
标准
由专家指定,汲取了研究领域中公认的知识和最好的实践
制定好的标准可以产生出对用户来说更加一致、通用互换性更强,并且更易于集成的系统
设计领域的标准往往需要关注人类的适应性和差异性,如果超出这些界限,用户可能产生精神压力
原则
没有像标准一样详细列出人类能力的限制,并且相较于指导方针来说更具宽泛性
理想情况下,原则是以大量数据的采集和测试中的得到的理论观点为基础的
指导方针
规范性的,同时要提供一些供设计决策使用的一般性指导
与原则相比应该更加具体,但是依然是把现有的理论、知识与新的或已存在的设计问题相结合
一些有用的原则和指导方针
功能性
可用性
易学性
效率
以计算机为中心的系统效率
以人为中心的角度,最佳效率要求考虑任务、任务的环境背景以及用户特征
不能将效率与运行速度相混淆:速度或许会很重要,但也有可能是完全没有效率的
可靠性
最终系统的动态属性
可维护性
实用性/有效性
系统将是一个经常使用的系统,还是一个偶尔打开的系统
ABCS框架
Anthropometrics 人体测量学
考虑用户的物理特征,如身材、肌肉力量
在设计时我们应该考虑设计是为了个人、大多数人还是一些极端情况
在计算机系统中,应该包括控制装置(旋钮、转盘、按钮等)的大小可以被大多数用户所使用
交互中的身体因素
姿势
如果用户使用不正确的姿势或保持静止的时间太长,会导致交互效率降低,如随着时间推移注意力降低、错误增多,也会导致健康问题,包括眼睛疲劳、背痛和上肢功能障碍
上肢功能障碍
重复性劳损、积累性扭伤错乱、职业过劳综合征
包括手臂从手指到肩膀或者颈部任何部位的疼痛、病痛、紧张和失调等症状,涉及软组织、肌肉、肌腱、韧带,以及维持四肢正常运作的循环和神经系统,重复性工作往往会导致或加剧上肢功能障碍
如何放置电脑显示器和工作区域的有用信息,避免手腕和上肢功能障碍
影响因素
任务相关
不舒服的工作姿势、连续用力过度、长时间的任务
工作组织条件
恶劣的工作环境
缺乏温度调节、照明不足
工作要求
时间压力、缺乏休息,或工作轮换
评估重复任务的工具:英国健康与安全执行局开发的Assessment of Repetitive Tasks, ART
承重
越来越多人使用便携式和移动设备,使用这些设备的用户通常在交互时需要负担显示器和相应界面的重量,通常用户还得随身溴代这个设备
设计人员需要注意设备的适宜重量,研究现有的标准和类似的设备,观察用户并与他们交谈
与触觉设备交互
触摸通常被认为是视觉和听觉之后第三个最重要的感知通道
触摸其实包括肤觉和动觉
肤觉
仅来自皮肤刺激变化的感知,总是出现在某种特定的静止姿势下,并可能取决于该姿势
触感知tactile perception
动觉
产生一种静止和运动的身体姿势的意识,来自于从肌肉、关节、皮肤(传入信息)等获取的信息,同时将信号副本发送到运动系统(传出副本)
动感知kinesthetic perception
触觉haptic perception
包括触感知和动感知,并利用这两种信息来理解和解释环境中的对象与事件
物理键盘
按下键的感觉提供了有关按键响应是否被检测到的触觉反馈
按钮的位置和形状、按键的压力
打字员四种显著的错误类型
替代字母:word打成work
多余字母:word打成worrd
遗漏:word打成wod
移位:word打成wodr
并不互斥,有时候交叉存在
触摸屏
手指的大小是大多数系统中正常光标指针的10倍左右,在设计触屏交互界面时需要了解这一点,并考虑手指大小的个体差异,以避免胖手指的问题
在某些情况下仍存在风险,比如屏幕上显示已投票了实际上并没有计入票数
点击设备
鼠标
Fitts定律
使用设备驱动的屏幕光标运动通常遵循Fitts定律:一个物体的时间与光标和该物体的距离呈正相关,与该物体的大小呈负相关
当目标的大小或距离非常大时,Fitts定律并不准确
Fitts定律也适用于将手移动到键盘上一个特定按键的过程,只不过方程中的常数不同
移动电话
拇指是交互界面的一个重要部分,许多用户在使用手机时,使用拇指而非其他手指(单手操作、两手握手机两个拇指输入数据
用户通常会使用设计意图外的其他方式使用设备
大按钮电话虽然使得布置其他功能的空间变少,它却使现有的功能更容易访问和使用,很适合老年人和视力障碍用户
电子游戏和虚拟现实系统
使用振动控制器的电子游戏
虚拟现实的力反馈
触觉交互界面的优缺点
适宜使用触觉界面的用户和任务类型
需要在视物昏暗条件下作业的用户
异常天气情况如大雾
触觉感知低下或者退化的用户
需要额外输入通道或者需要将触觉当作输入通道的用户
视觉表述的东西也可以通过触觉感知
输入要求很低,使用目前的技术易于获得,而且指尖对压力的变化非常敏感
触觉提供了另一种输入通道,对盲人用户而言,它是有效的主要输入通道。对有视力的人来说,触觉方式进行的信息传递并不会对运动系统或其他感觉功能产生实质影响
Behavior 行为
知觉和动机的特征,考虑用户感知到什么以及她们行动的原因
行为分析支持并促进了两类任务的分类
一类任务最好由人类来执行
一类最好由机器来执行
行为心理学术语
阈值和恰可察觉差
一些代表性的阈值(理想条件下)
视觉:晴朗的夜晚,50公里外一支蜡烛的烛光(100个光子射入人眼,或视杆细胞可吸收10个光子)
听觉:在安静环境中,6米外手表的滴答声(0.0002dyn/cm2)1 dyn/cm²=0.1N/m²
味觉:含1克食盐的500升水(0.0001M)
嗅觉:弥散在3个房间中的一滴香水,或1×10-12mol/L的乙基硫醇
触觉:从1厘米高度处掉落在脸上的蜜蜂翅膀(10mg力)
恰可察觉差:just noticeable difference(JND),感知的灵敏度是由可感知的变化程度来度量的,这种变化叫恰可察觉差
反应弱化
一个刺激反复产生,适应后变得不明显
反应弱化有效地释放认知资源,当施加新的刺激时,人们可以利用这些资源来处理这些新的刺激
信号检测理论
Signal Detection Theory, SDT,本是为了在雷达显示屏上进行敌机识别,目前已广泛应用于分类任务及决策任务之中,比如医学和电子游戏
d'代表灵敏度,β代表偏差
视觉
视觉生理学
眼睛基本结构
晶状体
视网膜
根据进入视网膜的光线强度,眼睛的瞳孔会相应地扩张或收缩,以保持感光强度的恒定
适应机制:使眼睛在整个光照强度范围内工作的中间机制,是一种最为深刻及普遍的感知现象。眼睛通过连续不断地移动防止对被观察物产生适应。这种常规的移动通常不明显,比扫视速度快而范围也小,称为微眼跳
视杆细胞
一种最适合日光,负责彩色视觉
视杆细胞对蓝色区域的光线更为敏感
视锥细胞
一种最适合微光或月光,对光线更敏感,在黑暗条件更为活跃,在明亮条件会过载
在其他条件不变、只有光线由明亮变为昏暗的情况下,不同彩色的物体会让人感觉到物体的亮度看起来产生了差异
黄斑中心
视神经
眼动追踪仪
低层视觉感知
视觉及光线测量
入射光:照度illuminance
反射光:亮度luminance
亮度以cd/m2来度量,随着对象亮度的增加,眼睛的视敏度或分辨细节的功能也相应增加
对比度
=(物体亮度-背景亮度)/背景亮度
赫尔曼网格
高亮度和低亮度的分界处会有奇特的视觉效果,中间好像有黑点,设计师应该增加阴影/颜色/图标间距来消除影响
色觉
明度lightness
饱和度saturation
色调hue
颜色恒常性color constancy:当颜色发生变化时,我们对颜色的知觉仍然保持不变的现象
色盲
绝大部分人是三色视者(红绿蓝),红绿色盲是双色视者
四色视者有更好的辨色能力
颜色系统
RGB
CMYK
闪烁
人类对闪烁的灯光很敏感,但当闪烁频率超过闪烁融合频率时,也无法感知
以每秒7~10次闪烁的灯光能够导致一些人的癫痫症发作
弹出效应
字母形状、颜色等特征让元素凸显
单词补全效应
看到FCUK自动处理成FUCK…
高层视觉感知
运动空间知觉
当一个目标的运动超过一定速度时,眼睛就可以自发地跟踪这个目标
与深度感知相关的视觉信息线索
大小、遮挡、阴影、纹理、运动视差、立体深度等
感数subitizing
当物体不超过3个时,对数量的感知非常有效,大概是50ms/物体
到4个以上尤其是到5个时,就得一个个去数了,响应时间增加了约250~300ms/物体
分组的格式塔原则
邻近:邻近出现的多个元素看起来更像是成组的,而不是随机无关的
相似:具有同样形状或颜色的多个元素会被看成是一组
同类表现:一起运动的多个元素会被归为一组
良好的延续,连续性:能纳入一条线或一个形状的物体会被归为一组
闭合:图中缺少的部分会被填入所缺的图以使其完整,所以它们会被视为一个整体
对称:由对称边界界定的区域往往被视为一致的、相关的图形
图-背景:所感知到的几何组织结构往往是那些最好的、最简单、最稳定的几何形状。例如,把四个点放置在一个想象的正方形的四个角,这些点会被视为一个正方形而不是一个三角形加一个额外的点
听觉
声音有两种用途
声音输出
通常要求比普通的声音进行更多的处理,能传达更多的信息,对视障人士而言它们会尤其重要
一般认为自动女声输出更容易理解
需要考虑系统在什么地理环境使用,允许用户选择与语音输出的声音
在设计包括老年用户的系统时,选择输出的声音时需要考虑用户的可能听觉衰退程度
提供听觉警报
作为视觉警报的补充来使用
最容易的方法是使用突发的信息来提供听觉警报(如电喇叭铃铛的声音),问题是会给用户造成惊吓,如果声音的音量很大甚至能引起恐慌
如果想传达紧急性,需要避免高强度的声音,而加强警报音的速度
动机
马斯洛需求理论
外在动机
外部奖励把人的注意力集中在奖励上,这种注意力助长了那些奖励所驱动的行为,也阻碍了相关行为,奖励超出一定程度效率可能会降低
Pink认为提升基本工资水平,同时降低甚至取消奖金
内在动机
自主
能选择做什么、如何做、为谁工作、何时工作的能力
精通
想要去理解一个过程或任务,并想做到更好的愿望
目标
改进事物的愿望
为了公司、家乡、祖国甚至地球的利益而工作
强制功能forcing function
一些要求特殊用途或者交互方式的设备属性
预示性(affordance)会强制要求某种特殊的交互方式
eg有把手的门无法推开的话,只能是拉
Cognition 认知
学习、注意力、认知的其他方面
所接受的培训
教育
先期使用经验
个人风格
策略选择
记忆
含义
人所拥有的把那些即将消失的事物信息保存下来的能力
大脑中存储信息的存储系统
指存储的信息本身
类型
映像记忆
只能存放少量内容,大概2-3项,但这些内容会比较快地衰减消失
短期记忆
常用来存储需要处理的信息列表或信息组
效应
在列表前端和末端的内容更容易被记住
范·雷斯托夫效应:列表中与众不同的内容更易于记忆
→增强记忆需要有一定的辨识性,把所有的文字都用红色标记不能帮助记忆,但十个字里只写一个红色字就会有帮助
有意义的内容相较于其他和个人无关的内容更容易被记住
eg IBM和LKP
工作记忆
比短期记忆更动态的一个概念,能协调短期记忆和信息处理过程之间的互动
专注于单一任务能够直接提高可用于该任务的工作记忆容量
工作记忆存在个体差异,有些人会比其他人拥有更多的工作记忆
做某件事时同时讲话会提供一些额外的记忆(通过听觉回路的更多记忆,暂时增加有效工作记忆),但也会降低工作绩效
长期记忆
包含永久编码的记忆内容,内容经过足够的处理就会被放入长期记忆
编码:指将内容存储到记忆中以便之后的检索
陈述性知识需要刻意将内容转换为长期记忆
陈述性记忆和程序性记忆
陈述性记忆
内容是关于世界的事实或陈述
用来存储和检索信息
通过练习可以改善陈述性记忆的检索,并且这些内容是为了分享和言语表达而有意生成的
为了后续检索而对内容进行编码大约需要6秒来处理(Simon 1974)
程序性记忆
内容是动作或描绘如何执行特定任务的步骤
内容通常衰减地更慢,同时检索也不像陈述性记忆那样对背景条件很敏感
可以通过练习加快检索
内隐记忆和外显记忆
存储在外显记忆中的内容是可以被叙述的,存储在内隐记忆的则无法被叙述
大多数陈述性记忆是外显的,大多数程序性记忆是内隐的
如果信息保存在外显记忆中,用户可以更坚定地执行任务,同时由于他们可以描述如何执行任务,因此也更容易帮助其他人
通过建立任务的心智模型,以及用更多的时间来让用户反思自身的学习,用户可以将信息存储在外显记忆中
当用户缺乏领域知识,通过试错来学习时,信息就被存入内隐记忆
前瞻记忆
记住在某些事件或绝对时间条件下,再恰当的时间去执行某项任务
帮助前瞻性记忆的工具如手机上的日程表、日历、待办
记忆偏差
干扰
eg两个相似的单词
检索偏差
出现在序列首尾的内容更容易从记忆中检索,当对一个情境或一组活动推理时,对那些出现在首尾的信息的推理就可能会有偏差
使用外部记忆辅助和形式分析可以帮助减少偏差
编码效应
一个条目存储在记忆的内容会受到编码方式的影响,编码方式可包括:条目位置、用户位置、视角、气味、声音、精神状态……
某些人只会在特定的环境背景下才能识别物体
用户在系统中检索到的信息可能在某些情况下与界面的某些方面相关联,而这些方面并不被界面设计人员知道和控制
启动效应
在启用某个对象之前,预先向用户展现该对象,即使是很短暂,也会有助于该对象和与之相关物品的使用
用户更容易从记忆中检索最近使用过的内容
系统内部的一致性和系统与系统之间的一致性十分重要,如果用户手册与用户界面使用的名称一致,对界面上这些事物的识别就会很快
洛夫特斯效应
也称误导信息效应,引导人从问题中获取隐性知识,但这个知识可能是错的
如果使用恰当能帮助用户,在和用户沟通、帮助解决问题时,向用户提问的问题本身所包含的背景信息,甚至一个默认操作,都可以给予用户帮助
助记符和记忆辅助
助记符
位置记忆法
eg记忆宫殿
使用短语作为检索一组内容的线索
识别再现
再认记忆比回想记忆更加可靠,相比回想起之前见过的东西,认出它们更加容易
跟交互相关的物体或动作可以放到被识别出的地方,而不是要求用户去回想位置
eg对话框上的链接、下拉菜单
再认记忆的使用要求为用户提供多种相关的、用户需要从中识别并选择的选项
专家用户的回想比识别快很多,对他们能够使用回想记忆并用它来获得更高的效率
权衡方法:提供快捷操作方式供专家用户使用,同时保留利用再认记忆的用户界面
反常或更有趣的东西更容易从记忆中检索
PQ4R
preview 预览
question 设问
read 阅读
reflect 反思
recite 背诵
review 回顾
注意力
指知觉的选择性特点,使得用户在某个时刻只会专注于环境的某些特定特征而忽略其他特征
注意力可看作一个认知空间,同时我们认知的很多部分都对注意力给予了支持
在没有注意到信息的情况下,我们仍然可以做一些信息处理任务
鸡尾酒会效应:在拥挤的房间里我们可以留意到有人在谈话中提到自己的名字,尽管我们没有特别注意
在没有集中注意力的情况下,信息处理能力局限于表面特征、句法属性或者类似的浅表特征
通过练习,一些负责的技能可以不需要太多地关注,允许同时做另一件事
eg开车时说话
注意资源论
威肯斯,2000
用户有不同类型的资源,资源可以影响被用到的感知部分(视觉/听觉)、响应方式(响应类型的选择、响应的执行、空间/口头的)、处理的阶段(感知、认知和响应)
大多数支持威肯斯注意力资源模型的证据来自于对双重任务绩效的研究
ACT-R理论的注意力模型
把注意力看作脑力活动中一个指向正在思考的内容的聚光灯
注意力被表示为陈述性记忆中的概念处于激活状态,能关注更多内容的人有更多概念被激活
每个对象都有一个关联强度,熟悉的对象具有较高的关联强度,因此需要更少的激活来与程序性知识相匹配
分配性注意
同时执行两个任务时,需要分配注意力的焦点
注意力同时受到访问频率和所使用内容的类型的影响,使用不同感知缓冲的双重任务相互之间的干扰也会少一些
动作失误
正确的意图但做出了错误的动作
使用开环控制
行为主要基于预期,前馈而非反馈,因此很少需要或不需要对行为进行监控,其他动作可以同时进行
eg玩游戏、打字
失误通常出现在使用开环控制的时候
使用闭环控制
使用已完成动作作为反馈来调节工作绩效,因此需要有意识地对行为进行监控,一次只能进行一种行为
eg学习驾驶、编辑稿件
中断
中断实际上是次要任务,这种任务不太重要,一般不被当作是用户主要任务的一部分,且不受用户控制
中断看上去确实能造成任务绩效的降低,且会带来情感上的变化,因此用户也不喜欢
有时候中断对解决困难问题很有用(酝酿效应)
学习
可以提高用户执行任务的效率,也是让用户适应机器的最重要过程
改善用户记忆强度的主要方式,也能改善注意力
绩效理论
无论用户是正向学习还是反方向回溯学习,都存在以下关键现象
先有识别正确/不正确内容的能力,然后才有创建正确内容的能力。
知识不是以一种要么全有要么全无的方式获得。新手会经历这么一个脆弱知识的阶段:相信已经获得的知识是正确的,尽管这些知识有时也可能是不正确的。
专家具有一套丰富的知识表示方式。他们不只是比新手知道得更多,而且他们的知识会组织得更好,理解得更深入,也更容易提取。
人类行为最主要的规律在于通过不断尝试,学习所带来的改变会加快任务执行的速度和错误率
学习类型
陈述性学习
程序性学习
内省法
内隐性/外显性学习
集中式/分散式学习
专业知识
通过不断练习,用户能够成为某个任务上的专家
一般来说要达到世界级一流水平需要大约10年的实践以及一些刻意的反思和叙述性学习
虽然练习是一个通常和必要的条件,但简单的练习不足以保证能够达到专家级的水平,需要有人指导和刻意练习
知识变得更多,能够更好地预测任务即将发生的情况,并且几乎在所有情况下,他们对任务细节的感知也变得更加准确
学习迁移
学习一项技能后,在新场景中复用或应用该知识
当知识的相似性是在结构上而不是表面时,问题求解中的知识和策略迁移就会有困难
心智模型
是用户关于外界某些方面的一个表征,包含外界的结构(相关物体的本体论),它们如何相互作用,以及用户如何与之交互
被用户用来理解系统并与系统进行交互,当用户的心智模型不准确时,系统使用起来就会很困难
心智模型的复杂度会因人而异、因系统而异、因使用环境而异
设计人员有一个关于用户行为的功能化心智模型,这些模型可能很初级、内容不准确,因为它们是基于设计人员自己的行为经验来创建和完善的,而不是基于用户实际行为的经验
虽然用户并不相同,但是他们在很多方面都是相似的,用户之间的知识、能力和属性各不相同,但他们接收和处理信息的方式,以及与外界交互的方式是相似的
心智表征
语义/命题式表征
文字数字
视觉/空间式表征
可视化图表
知道感和判断置信度
判断置信度
分析方法在每个研究领域各不相同,但在每一种情况下置信度的度量构成了心智模型的另一部分
好的界面会帮助用户对于自身表征和决策形成适度的置信度
→提供信息来支持学习
→对任务的执行情况提供反馈
→提供所需的信息来构建心智模型
知道感
用户的知道感会以广泛的的信息为基础,包括之前成功使用过的答案、对一个领域熟悉的程度、提出问题人的社会期望(你知道去某地的路吗)、与他人的比较(其他人知道,我也要知道)。
刺激-反应相容性
行为的刺激和反应须一致
在界面的物理部件和显示要与它们的实际情况相匹配
eg电梯的向上按键应该在向下按键的上面
好的刺激-反应相容性比差的映射减少了70%的错误,同时反应时间提高了30%
任务/行动的恰当映射
第12章的执行鸿沟
问题求解
如何采取适当行动,从事物的当前状态达到要实现的目标
出现在用户不知道下一步要做什么的时候
经典案例:汉诺塔游戏
一些用户会在头脑中推理问题,考虑哪些移动是可行的以及移动的后果是什么
一些用户会直接开始移动,他们的行为可见,研究求解方式会简单一些
需求和潜在困难
影响问题求解的因素
基于心智模型
问题求解和决策完全根植于我们的知识和经历
回溯
回溯:从问题求解的 早期工作中发现,解决问题的人不喜欢远离目标
eg农夫过河问题
如果一个需要执行的动作看起来像是远离目标,可以给用户提示信息,说明这个行动的方向是正确的
功能固着和思维定势
人们将某个物体的功能拘泥于某个特定的用途
一个人长期用一种方法来解决问题
往往出现在人们没有充分利用他们的知识,而同时被之前的成功过度影响的情形
顿悟问题
大多数人在第一次解决该问题时会有困难,解决它需要非凡的洞察力
一个人受挫一段时间后得到的答案
解决顿悟问题的阶段
僵持期 Impasse
个体试过所有可能解决问题的想法或策略后达到的状态
固着期 Fixation
个体一遍遍重复相同类型的解决方法,即使他们明白这不能解决问题
潜伏期 Incubation
将问题搁置一段时间有时有助于找到解决方案,就像一个人在清空脑袋中的错误想法
顿悟期 The Aha experience
顿悟问题的解决方案似乎是一下子冒了出来
事后错误
在任务的目标已经完成,但是子任务的目标还未完成的时候产生
eg拿到钱但把卡忘在了ATM
系统应该在所有重要的子任务完成之前,防止用户认为他们已经完成了整个任务,在技术和情况允许的情况下,将最重要的目标放在最后
认知需求
很多用户不想做问题求解,喜欢直接去执行任务,然而有些用户喜欢解决问题、喜欢思考
高认知需求用户
可能倾向于将不好的界面视作一种挑战而非不可能的任务
专注于提出争论
低认知需求用户
专注于周边的线索,比如肢体语言、发言者的社会地位、发言者的流利程度
对于游戏来说,可以鼓励用户做更多的问题求解;对于娱乐和非正式系统,可以包含一些问题求解;对于高风险界面,比如健康、运输和财务系统,大部分用户不会想去做问题求解
问题本身结构不良
问题没有被给予明确的定义
也被称作界定不清淅问题/混乱问题
设计上帮助用户解决结构不良问题
清晰的操作符
菜单和他们可以采取行动的动作列表有助于定义问题空间
动作列表上可以表明当前选择的操作符的限制条件是什么
决策
问题求解的结果,当问题且介所需的工作量很小时,问题求解和决策可能会被混为一谈
决策可能很小也可能很大,可以很简单孤立,也可以是一个决策序列,也可能发生在解决问题时
决策通常是非理性的
最为合理的选择通常不会在决策中被采纳
决策者在做决策时通常不会考虑大量潜在的相关信息,他们做出决策的过程表现出普遍性的、已知的偏见,也就是说错误的决策制定是有迹可循的
简单决策
Hicks法则
做出决定的时间与选择的数量之间的关系
时间=b log2(n+1)
n:有效的选择数量
b:常量,表示做出选择的时间与任务细节的变化有关
速度与准确性的权衡
反应相容性
与刺激相匹配的反应更快且更可靠
影响决策的因素
基于心智模型
问题求解和决策完全根植于我们的知识和经历
系统应该通过显示、帮助或是在周边背景信息来提供决策所需的适当信息
如果信息很难从记忆中被检索出来,或者很难被做到心理推理或心算,设计人员就应该考虑如何避免或者至少减弱这些影响,比如移除对决策无用的信息
确认偏见
用户想在世界中找到能够证明自身行动和推理过程是正确的证据,因此,人们会寻找可以证实他们对于情况的理解是正确的信息,这样一来他们就更难看到与他们对外界的理解相冲突的事物
确认偏见与缺失对象或者缺失刺激的注意有关
回归均值/样本量
用户倾向于过度概括,对于一个概念的某个实例,他们会假设所有情况都具有相同的特性,这导致他们做出的假设不被支持并且可能最终被证明是错误的
eg人们有时候第二次去一个餐馆的感觉没有第一次去的时候那么好,可能第一次去的时候正好赶上生意好、非常饿,使得食物味道变得更好,第二次去回归正常情况
可获得性偏差(代表性)
用户比较容易记住表头和表尾几个条目,和因特殊原因脱颖而出的条目
用户被要求探究和决策时,通常会检索和使用那些容易检索的记忆,这些记忆不一定是有代表性的,也不一定覆盖记忆的分布范围
用户很快对人和事物做出判断,这些判断是基于少量的资料,如果这些判断是负面的/不正确的,纠正起来需要更长的时间
人们会根据自己的经验而不是现实世界来检索记忆
框架效应
结果的展示方式对用户的选择有很大影响,当结果以如挽救生命、赚取资金等积极的方式呈现时,表明决策者可能厌恶风险,他们会表现出希望保护自己财产,并选择一个确定的结果
失去一个功能在用户看来比不添加该功能的损失更大
最常见的可被观察到的用户行为, 也可能是最重要的行为
人与计算机的交流
语言
符号
用来代表另一个对象、标记或关系的标识
词语是象征性的,因为它们代表了其他事物
语法
如何将词汇组织起来使之有意义
物体被选中的顺序和交互的顺序
语义
文字和符号的意思
界面中选择的符号类型(通常是文字或图标)取决于它的语义
Grice会话准则
确保对话的内容是必要的,是出现在适当时刻的,是与所进行的对话的目的和方向相符的
四个基本准则
量的准则
所说的话应该满足交流所需的信息量(为了当前信息交换的目的)
所说的话不应超出交互所需的信息量
编写手册和说明书时
质的准则
不要说自知是虚假的话
不要说缺乏足够证据的话
系统不应该报不存在的错误
关联准则
谈话要切题
自动帮助信息应该与用户当前执行的任务有关,而不是其他任务或之前已完成的任务有关
方式准则
避免晦涩
避免歧义
要简练、避免啰唆
要有序
阅读
最重要的三个规律
词长效应
较长的单词需要更长的时间来阅读
词频效应
常用的单词读起来比不常用的单词快
图片命名与阅读
阅读所花的时间要比为图片命名花的时间少
然而当一个人一旦熟悉了一个图标,这个图标要比文字更容易识别
使阅读更困难的因素
复杂或不常见的字体
eg哥特字体,小篆
字体的细节超出了显示器的显示能力
文字过长
行间距过小
使得眼睛难以跳转到下一行的开始位置
较小的字体
难以感知,而且通常伴有文字过长和行间距过小等问题
拼写错误
需要更长时间识别正确的词
两端对齐的文本
这会导致字与字之间的间隔不均匀或者存在过大间隔
全部使用大写字母
读者缺乏阅读大写字母和词语的经验,同时也会影响行间距
模棱两可和远端的引用和代词
eg它、那个的使用
抽象单词
糟糕的语法
否定和双重否定的概念
字体
不同字体之间存在可读性差异
使用的字体不要超过三种
纸上阅读和屏幕阅读
在纸上阅读时,打印质量一般都比较高(高级打印机能到1000dpi,大多数打印机至少是600dpi),阅读的光线主要来自纸的反射
高分辨率文本的阅读通常更快,也不容易造成疲劳
反射光有更强烈的明暗对比,也会使阅读更快,更加不易疲劳
在屏幕上阅读时,分辨率会低很多(大多数显示屏≤250dpi),光线主要来自显示设备
纸和屏幕在翻页等与文本信息相关的功能的差异
扫视显示和菜单
大多数人不会阅读页面上的所有内容,但是他们会扫视网页,寻找视觉因素
长的菜单需要更多的时间去阅读,超出的时间大约是120ms/菜单项
用户阅读时,以系统性和随机性两种方式扫描菜单:系统性一般是从上到下,有时候会随机跳过
信息检索
人类与信息交互的背景有时候被描述为信息之旅(information journey)
人类的信息行为包括用户如何加工、使用以及生产信息
设计内容
内容策略
信息架构information architecture
内容创建
内容组织
内容发布
Social factor 社会方面
用户身处的环境、用户与其他人的关系
情景
用户和其他人共同完成某个任务,电脑用来支持和协调交流
用户和其他人线下合作,了解、使用一个系统
用户与计算机系统的交互受到某些监管机构的约束(比如航空业和核能业)
最典型的失败是下级没有充分及时向上级说明问题
社会因素对决策的影响
社会责任的影响
社会责任的扩散
人众无知
人们利用他人对该情景的理解来建立自己对该情景的理解
归因
设计人员在设计上的一个基本错误是将他们自己的感受、需求、知识、目标等归因于用户,相信用户和他们完全一样
多数和少数的影响
从众做出选择
更激进or更保守谨慎
影响团队表现的因素
差错
人机系统性能中的固有部分
故障-差错-失败 fault-error-failure
差错普遍被认为是事故的先兆
三个概念构成一个三元组链,系统一个层面的失败可能会造成另一个层面的故障,但这并不意味着故障一定会导致失败
重大事故几乎总是将原因归为人为差错,但这个词很模糊
人采取了应该的行动,但产生了错误
人故意不作为
人采取了不应该的行动
研究用户的方法
用户知识和行为模拟
GOMS认知任务分析方法
Goal 目标
Operation 操作
Method 方法
Selection rule选择规则
侧重于描述那些无错误的、专家级行为的细节,并利用得到的行为规范来预测任务的易学性、可用性和执行时间
KLM
描述键盘敲击层面的行为
Keystrokes 敲击
打字或点击鼠标的单位时间(0.08-1.2s
Pointing 指向
移动鼠标到目标位置的时间(约1.1s,也可以用Fitts定律
Homing 回位
把手移到或移开鼠标与键盘的时间(约0.4s
Drawing 拖动
去哦东鼠标几段直线距离(0.9 ×线段数量+ 0.16 × 距离总长度) s
高端方法
认知维度
鸿沟
用户模型的类型
现在认知架构有100多种,可以分为四个类型
隐式描述模型
对于用户行为所涉及的功能部件和过程并没有明确表达,但隐含了一些与认知和行为相关的假设
eg椅子的设计是关于用户身高范围的假设
显示描述模型
描述系统中的组件或结构,但从不描述机制,也不去执行任务
eg上面的KLM和GOMS模型
显示处理模型
描述了运转的机制和方式,虽然这类模型往往有软件支持,但模型本身不提供信息处理功能
人类处理机模型 Model Human Processor
作为最早的尝试,该模型力图脱离只是对不同的心理观察进行说明解释的普遍做法,提出了一个关于用户的同意描述方法,也开创了定量分析方法
由一组记忆体与处理器,以及一套原则组成
三个相互交互的子系统
感知系统
运动系统
认知系统
对人的行为假设高度理想化,同时很难对行为差错进行描述
显示信息处理模型
包括一个能产生行为的完整信息处理架构,能预测信息处理的时间、步骤及结果
统一认知理论
ACT-R理论
架构图
结果规则系统
模拟眼-手系统
计算机环境
Soar理论
State,Operator And Result 状态、算子和结果
Soar既是认知理论,也是该理论的计算实作。自1983年莱尔德发表论文以来,人工智能研究人员已经根据不同的人类行为面向,广泛使用Soar来建立智慧代理人和认知模型
多个假设
1.问题空间假设
在尝试实现目标时,所有目标导向的行为都可以被看作是对可能状态空间的搜索(问题空间)。每个步骤都会选择一个算子,将其应用到代理的当前状态,这可能导致内部发生变化
eg从长期记忆、世界的改变或外部行为中提取知识
2.虽然每一步只能选择一个算子,从而造成一个连续的瓶颈,但是选择和应用的过程是透过平行规则触发来实现的,因此能够脉络依赖地提取程序性知识
3.如果选择或应用算子的知识不够完整或不够确定时,就会产生僵局,结构会自动创建一个子状态
子状态中,会递回地使用相同的问题解决过程,但是目标必须是提取或发现知识,以便决策能够继续
规划或分层任务分解等传统的问题方法自然会产生
当在子状态中创建的结果解决僵局时,子状态及其相关结构被移除
4.底层结构是模块化的,但是并非像计划或语言这样基于任务或能力的模块,而是作为独立于任务的模块
决策模块、记忆模块、运动模块、学习机制
5.记忆元素(空间/视觉记忆中的记忆元素除外)被表示为符号的关系结构
所有符号结构都具有相关的统计元数据(例如使用频率、近期资讯或预期的未来回报),这些统计元数据会影响符号结构的提取、维护和学习
Soar着重于通用AI(功能和效率),而ACT-R着重于认知建模(对人类认知的详细建模)