导图社区 词汇组成模型汉语研究对普遍阅
词汇组成模型汉语研究对普遍阅的思维导图,讲述了词汇阅读的对比分析、汉字书写系统、利用语音进行词汇识别等。
编辑于2022-04-04 14:18:11词 汇 构 成 模 型 | 汉 语 研 究 对 普 遍 阅 读 理 论 的 启 示
问题提出
阅读模型
单词阅读模型的发展主要得益于对英语单词识别的研究
符号模型
非符号模型
均如此
建立汉语阅读模型
必要性
阅读模型依据是英语或其他字母语言单词阅读的实证研究
可行性
非字母书写系统中阅读的研究已经积累了足够的数量
汉语系统与字母系统的反差最大
立足比较词汇阅读理论
双路径模型
词汇路径:访问词汇表征并读出其存储的发音
亚词汇路径:将连续的语素-音位映射组合在一起,产生组合的结果作为发音
词汇路径用于特殊单词的正确发音(e.g., colonel),而亚词汇路径用于没有词条的非词。规则词可以通过任一过程正确阅读。
单一路径模型
从单一类型的亚词汇输入输出连接计算发音,因此没有词汇过程
能否成功阅读非词有争议
提出问题
非字母阅读采取什么形式?
非字母阅读是否通过包括词汇表征和词汇程序的模型来解决?
关于阅读模型
字母阅读模型是否足以解释非字母阅读?
汉语阅读和英语阅读的关键区别是什么?
思路:提供一个比较分析的总体框架,并回顾了汉语书写系统的基本性质和阅读方式
更具体的层面上,需要用阅读模型解释的汉语阅读的新的实验特征是什么?
思路:描述汉语词汇阅读的模型以及引发其模型的研究成果
词汇阅读的对比分析
在比较阅读的研究中,有两个比较点
语言
书写系统
语言变量完全独立于书写系统,可以影响阅读策略
英语和Hangul的例子
表明阅读中观察到的音节结构差异的来源是语言而不是书写系统
汉字书写系统
汉字书写系统是以意义为基础的 ,而不是以发音为基础
汉语默读是一种视觉形式—意义映射的系统
在语篇和句子层面,汉语书面语涉及的语音过程
并且汉语阅读中的语音证据延伸到了单个词汇的语义任务中
书面汉语为语素或 甚至是语素音节的系统
汉字映射到口语中的单音节语素上,而不是音位上
研究者倾向于将书面汉语 描述为一种文本——意义的系统
原因
汉字起源
汉字的象形起源
象形文字在汉字库中所占的比例不到1%
书写系统
合体字中存在形旁
形旁提供的语义信息并不总是可靠的
合体字
少数合体字有两个形旁
多数
一个声旁
映射到一个音节上,而不是音位上
说明对于单个汉字来说, 语音组合是不可能的
一个形旁
汉字中的语义 和语音信息都 不是高度可靠的
广泛存在同音字
子主题
对于阅读来说,发音本身对选择意义没有太大帮助;在口语中,语境对于从语音相似的口语词汇中选择起着很大的作用
汉语阅读是一个严格意义上的视觉形式到意义的转换过程
但语音也在汉语词汇阅读中起着非常重要的作用
语音识别假说 (identification-with-phonology hypothesis)
语音音节是作为汉字识别的一部分被激活的
由书写系统映射的语音单位作为单词识别的一部分被激活
利用语音进行词汇识别
实验已经在几个层面上 为汉语阅读中的语音提供了证据
词汇层面
语音识别假说
语音是单词识别的组成部分
不同的书写系统语音激活的不同之处
字母书写系统
启动语音的基本字形单位对应于音位
音节系统
基本单位对应于口语音节
在汉语中,基本单位也是一个口语音节,恰好是一个语素,通常是一个词
实验证据
从任务的角度看
语义相关任务
语义分类任务
词汇判断任务
如后向掩蔽
语义相似性判断
语音过程主要通过干扰表现出来,研究结果支持语音作为汉字识别的一部分很快出现--速度足够快,足以干扰明显较慢的语义加工
语音任务
Stroop颜色命名任务
命名任务
有助于揭示词汇成分激活的时间过程
汉语单字词命名模型
目标是解释在朗读过程中,语音是如何与单词表征的其他成分相互作用的
不干扰的情况下观察语音效应
词汇构成理论框架
关键假设
单词识别是对语音对象及其相关非语音成分的恢复
词汇构成模型
单词表征由三个相互关联的成分(或变量)组成
三个成分
正字法(OR)
语音(PH)
和语义(SE)
单词身份是这些构成变量值的具体化:单词(PHi,ORj,SEk)发音为PHi、正字法形式(拼写) 为ORj和意义范围为SEk
其他一些假设单词可以用三个成分表征的理论
分布式表征三角形模型
符号双路径模型
构成框架是通用的,不依赖于语言或文字系统
举例
略
内涵
语音是被识别的单词的组成部分,所以它是被识别的成分
单词阅读的失败可以被描述为不完整的检索或异步检索
检索失败的原因在于词知识不完整或不可靠
与词汇质量假说一致
词的层面上,语音优先于语义
与动态系统理论一致
起源
determinacy principle:在词汇层面上,字形-字形关系在大多数书写系统中都是非常可靠的,而字形-语义关系则不是
词汇构成模型的计算版本
主要假设和原则
假设正字法、语音和语义成分指定单词身份
确定性原则的基础上,它假设形式-形式关系是快速可用的,从而可以在给定图形输入的情况下快速检索语音信息
启动命名中成分信息的时间进程
图形信息开始识别过程,并最先显示启动效应
在启动命名中,语音信息先于语义信息
在SOA上,图形相似性的影响是非单调的
语音启动只是在图形相似性变得抑制的时候才变得有促进效应
解释:最初的促进作用来自于启动中词汇成分(形式和意义特征)的激活,这些成分最终出现在目标语中。当启动本身被识别为一个汉字,从而与目标竞争时,随后的抑制就会出现
已实现的词汇构成模型
该模型是由正字法、语音和语义成分组成的链接单元组成的网络,激活通过该网络传播
适用于启动汉字命名
不同输入水平
部首
该模型是由正字法、语音和语义成分组成的链接单元组成的网络,激活通过该网络传播
部首水平和正字法水平之间的连接
正字法水平
正字法水平内的连接
语音水平
语义水平
语义水平内的连接
正字法和语音的连接
语义层和语音层之间的连接
形式和语义相似性表征
阈值
Perfetti和Tan(1998)的时间进程数据的模拟
真字和假字的区别
模型的另一个检验
出现了非常短暂的正字法促进和抑制的时间模式
听觉和语音效应的事件相关电位(ERP)证据
发现早期基于部首的正字法效应和后期的汉字水平语音效应
讨论
该模型的意义和贡献
意义
词汇身份有三个成分,所有这些成分都在正常的阅读过程中被激活
书写系统之间的区别不是是否与语音有关,而是相关单位是什么
在汉语中,语音单位是音节
部首之于汉字就像字母之于单词
然而,部首的作用也是复杂的
贡献
展示汉语模型如何调整现有的模型设置以适用汉语书写的特定特征
语音在阅读中的普遍性
证据表明汉语和英语语义任务和命名中均存在语音加工,其无论效应是否受其他变量的调节
语音在书写系统中高度通用或普遍
书写系统如何发挥作用
正字法到语音的过程
汉语
基于视觉形式的图形抑制和语音促进的同时出现
阈值式
单词级别的语音在汉字的完整正字法规范之前不会被激活
字母语言
观察到正字法和语音效应是同时上升的
级联式
单词级别的单元在激活单词级别的语音之前不等待所有字母单元的完整规范
亚词汇单元
字母系统
字母和单词代表两个不同的层次,因此字母成为整个单词的组成部分(全部包含在其中)
汉语
部首本身通常是独立的汉字,它们既参与了更高的词汇层面,也参与了“亚词汇”层面,即在更高的层面上作为一个词参与,在亚词汇层面上作为潜在的意义或发音线索
除了激活其自身的汉字表征之外,汉字的部件(例如,形旁)还激活包含它的所有汉字
前词汇语音(Prelexical Phonology)
字母语言
词前语音可以在字母系统中出现,因为该系统包含可以在单词激活之前立即激活的亚词汇单元(音位)
汉语
语音激活不能是前词汇的
语音中介
字母语言
语音可以中介语义
即用语音来理解意义
语音清晰
汉语
语音的中介作用是不可靠的
语音扩散
给定的语音激活水平分布在许多词汇单位上
阅读理论的启示:路径、命名、识别和中介
路径
双路径级联模型
从正字法词典直接到语音输出词典
从正字法词典到语义再到语音词典
语音路径是非词汇的
双路径级联模型实际上有三条路径
词汇-语义
词汇-非语义
汉语路线
非词汇-语音(字形-音位)
命名
实际上是发音
英语允许前词汇加工,但在汉语中,可能帮助汉字阅读的亚词汇单位的运作方式并不完全相同,因为它们以不同的方式参与了多个层面的表征
中介
英语中语音的中介功能很显著,但在汉语中可能不同
汉语的中介会因为同音字而效率非常低
语音是否只在字母和音节系统中起作用,而在汉语中不起作用?三种解答方案:
书面词形式和口语形式之间的习得联系太强而无法抑制,它们强迫加工而没有可观察到的功能
口语形式支持下游(词汇后通达)过程,它们的自动激活作为单词识别的一个组成部分服务于这些记忆和理解过程,而不考虑任何中介
sense of phonological mediation
模型的意义
对不同书写系统的阅读进行比较分析,对于了解阅读是如何工作的更大图景具有重要作用
表示疑问
表示反驳
浮动主题
1
浮动主题
Perfetti, C. A., Liu, Y., & Tan, L. H. (2005). The lexical constituency model: Some implications of research on Chinese for general theories of reading. Psychol Rev, 112(1), 43-59. https://doi.org/10.1037/0033-295X.112.1.43