1. 引言
许多研究已经表明N400作为一个晚期负事件相关电位(ERP),对语言加工敏感(Bentin, McCarthy, & Wood, 1985; Fischler, Bloom, Childers, Roucos, & Perry, 1983; Holcomb, 1988; Holcomb & Neville, 1990; Kutas & Hillyard, 1980, 1984, 1989; Neville, Kutas, Chesney, & Schmidt, 1986; Rugg, 1985, 1987; Van Petten & Kutas, 1987, 1990, 1991)。这些研究结果都一致认为N400很可能代表识别单词过程中的语言加工的某些方面。这一假设最有力的证据来自语义启动实验,这一实验最早使用的是传统行为方法,比如反应时(Meyer & Schvaneveldt, 1971)。很多类似研究已经证明,命名或者分类靶字(如:dog)时,当先呈现不相关启动字(如:car)比先呈现相关启动字(如:cat)反应慢(Neely, 1991)。Holcomb和Neville (1990)也发现当靶字前呈现不相关单词(如:car-cat)比之前呈现相关单词(如:dog-cat)诱发的N400更大,而且在视觉和听觉两种渠道都发现这种启动模式,那么N400波幅可能反映了单词水平的语义启动。
但是之前很多类似的语义启动实验都没有控制靶字的字频。Van Petten等(1991)采用新旧词判断任务,发现当靶词作为句子首单词出现时,低频靶词比高频靶词引起的N400波幅更偏负,而当靶词出现在句子的中间位置或者末尾时均无频率效应出现,因此他们认为语义启动与字频在N400上的交互作用。国内,Peng & Tan (1987)使用汉语双字词材料,通过操控靶词的字频及其与启动词的语义相关性,发现了靶词的频率与语义相关之间在反应时上存在交互作用。孙海静(2012)采用启动任务,发现汉字模糊度、字频和语义启动在N400上存在三重交互作用,其中字频与语义启动交互作用显著。但是至今都没有采用单个汉字作为材料,探讨汉字频率与语义启动之间的关系。
对于词汇识别,很多研究者给出了不同的解释。交互激活模型是由McClelland和Rumelhart (1981)提出的,该模型认为字母特征水平、字母水平和单词水平这三个水平之间是串联加工的,各水平之间激活传递是无阈限的,且相邻水平之间存在的反馈作用,使得各个水平的加工趋近于同步状态。每个单词都具有单词水平的探测器,在词汇识别过程中这些探测器会被激活,具有一定的基线激活水平并且敏感于词频与语境。高频词或有语境的词,单词探测器的基线激活水平高,因此高频词比低频词识别更快,反应时更短,即词频效应;语义启动词比无语义启动词识别更快,反应时更短,即语义启动效应。根据交互激活模型假设,汉字的频率、语义启动均属于单词表征这一水平,因此频率与语义启动表现出交互作用。
然而Borowsky & Besner (1993)等人提出的多阶段激活模型则认为,字母水平、词汇水平、语义水平这三个加工阶段是相互独立和分离的。词汇频率影响词汇水平,语义启动影响语义水平,而且各个水平之间的传递激活是有阈限的。Brown & Besner (2002)认为语义水平到词汇水平的反馈作用是受到被试对语义相关比例的认知的。当被试知道语义启动比例低时,语义水平到词汇水平的反馈作用是不能产生的,也就是说语义反馈是无效的,因此,频率与语义启动是作用于相邻的两个阶段,表现出频率与语义启动的加法效应。
本实验采用汉字作为材料,在语义启动比例一比三的条件下,两个因素——汉字频率(高频、低频)和语义启动(启动、无启动)的被试内设计。如果N400语义启动在高频、低频条件下产生显著差异,即汉字频率与语义启动存在交互作用,则支持交互激活模型;若频率与语义启动存在加法效应,则支持多阶段激活模型。
2. 方法
2.1. 实验目的
本实验采用汉字作为实验材料,在语义相关比例一比三条件下,探讨汉字频率与语义启动的交互作用。
2.2. 被试
西南大学本科生19人(男生10人),视力或矫正视力正常,被试都是右利手,以前没有参加过此类实验,精神正常,实验后给与一定的报酬。
2.3. 实验材料
从《现代汉语频率词典》(北京语言学院语言教学研究所,1986)中选取280个汉字作为靶字,高频字(字频范围0.22111%~0.01217%)、低频字(字频范围0.00984%~0.00077%)各140个,另有280个与靶字语义相关较强的启动字,构成280对语义相关词对。为了平衡实验材料,将启动字与靶字的配对打乱,即原来与靶字语义相关的启动字与另一靶字匹配,构成280个语义无关词对。因此得到四种条件,即高频启动、高频无启动、低频启动、低频无启动测试材料分别是140个词对,每个靶字、启动字出现在启动、无启动两种条件下的机会相等。将材料分为互补的两组,即每个小组从每种条件无重复的抽取70个,使得每个靶字在每一组只出现一次。因此,两个小组间靶字字频和语义相关强度都没有差异。另有560个汉字(280个高频字、280个低频字)作为填充字,构成280对无语义相关词对。所有靶字用作“是探测字”,另280个汉字作为“否探测字”,并且按照启动字–靶字–探测字的顺序组合成测试材料。因此,我们得到语义启动比例一比三的实验材料,以及实验是否反应一比一的实验程序。高低频启动字与填充启动字、靶字与填充靶字的笔画t检验均无显著差异:高频启动字与填充启动字笔画无显著差异,t = −0.773, p > 0.05;高频靶字与填充靶字笔画无显著差异,t = 0.085, p > 0.05;低频启动字与填充启动字笔画无显著差异,t = 1.472, p > 0.05;低频靶字与填充靶字笔画无显著差异,t = 0.352, p > 0.05。高频靶字与填充靶字频率无显著差异,t = 0.111, p > 0.05;低频靶字与填充靶字频率无显著差异,t = 0.748, p > 0.05。
另有20名被试对启动字和靶字之间的语义相关程度进行7点量表评定,数值越大,语义相关强度越强,即1为相关弱,7为相关很强。高频条件下语义启动得分M = 5.81, SD = 0.286;低频条件下语义启动得分M = 5.65, SD = 0.287。
启动字、靶字都以50号汉字宋体输入Flash MX 2004文档中,制成58 X 58像素大小的黑底白字的BMP格式的图片,探测字以60号楷体输入Flash MX 2004文档中,制成68 X 68像素大小的黑底白字的BMP格式的图片。
2.4. 实验程序
采用E-prime软件编制程序,实验流程如图1所示。一个刺激序列为:首先呈现注视点300 ms,然后是200 ms空屏,接着是300 ms启动字,300 ms空屏后是350 ms靶字呈现,然后是500~700 ms随机空屏,之后出现“?”500 ms,紧接着是300 ms空屏,然后呈现探测字200 ms,空屏1500 ms的事件记录被试的反应,900 ms之后是下一个刺激序列。正式试验有个试次,7个block,每个组块有80个试次均包含四种条件,并且随即呈现。每个组块完成后可以休息片刻再进行下一组。
Figure 1. Stimulus presentation process
图1. 刺激呈现流程图
2.5. 脑电记录与数据分析
采用德国Brain Products 公司的记录与分析系统,64导电极帽记录脑电信息,右眼外侧记录水平眼电(HERO),右眼眶上、下记录垂直眼电(VEOG),一双耳乳突连线为参考电极,接地点在前额FPz和Fz的中点。每个电极处的头皮电阻保持在5 KΩ以下,滤波带均为0.01~100 Hz,采样频率为500 Hz。完成连线记录EEG后离线(off-line)处理数据,记录时程1000 ms,用−200 ms作为基线进行校正,选择靶字呈现后800 ms作为分析时程。自动校正VEOG和HEOG,并排除其他伪迹。波幅大于±80μv的在叠加中被自动剔除。本实验只叠加正确判断反应,叠加后得到四种条件(高频启动、高频无启动、低频启动、低频无启动)下的ERP波幅总平均图和差异波的地形图,叠加次数依次为63.08、64.59、64.42、64.65。根据波形图和地形图,选取330~400 ms时间窗口对N400成分进行平均波幅检验。采用Massol等(2010)使用的经典全脑区分析方法,将电极点分为四个区:1区(FC1、C3、C1、CP1、FC2、C4、C2、CP2)、2区(F3、F1、FC5、FC3、C5、CP5、CP3、P3、P1、F4、F2、FC6、FC4、C6、CP6、CP4、P4、P2)、3区(FP1、AF7、AF3、F7、F5、FT7、T7、TP7、P7、P5、PO7、PO3、O1、FP2、AF8、AF4、F8、F6、FT8、T8、TP8、P8、P6、PO8、PO4、O2)和中线(Fpz、AFz、Fz、Cz、CPz、Pz、POz、Oz)。使用SPSS 16.0对N400进行三因素重复测量方差分析,即频率(高频、低频)、语义启动(语义启动、语义无启动)和电极点,方差分析结果采用Greehouse-Geisser进行校正。
3. 实验结果
3.1. 行为结果
四种条件下反应时与正确率结果如表1所示。对正确反应的反应时分析表明,频率主效应显著[F(1,18) = 4.721, p < 0.05],语义启动主效应[F(1,18) = 3.091, p > 0.05]以及二者的交互作用[F(1,18 = 2.046, p > 0.05]均不显著。对正确率进行分析,频率主效应[F(1,18) = 0.595, p > 0.05]、语义启动主效应[F(1,18) = 0.409,p > 0.05]以及二者的交互作用[F(1,18) = 2.916, p > 0.05]也均不显著。
Table 1. The average response time (ms) and the correct rate of four experimental conditions
表1. 四种条件下的平均反应时(毫秒)与正确率
注:小括号内是标准差
3.2. EEG结果
选取330-400 ms时间窗口对N400平均波幅进行三因素重复测量方差分析,结果显示:中线区:语义启动主效应显著[F(1,18) = 14.792, p < 0.01],频率主效应边缘显著[F(1,18) = 4.149, p = 0.057],语义启动与频率交互作用不显著[F(1,18) = 0.007, p > 0.05];1区:语义启动主效应显著[F(1,18) = 16.826, p < 0.01],频率主效应显著[F(1,18) = 8.911, p < 0.01 ],语义启动与频率交互作用不显著[F(1,18) = 0.328, p > 0.05];2区:语义启动主效应显著[F(1,18) = 13.502, p< 0.01],频率主效应显著[F(1,18) = 6.454, p < 0.05],语义启动与频率交互作用不显著[F(1,18) = 0.244, p > 0.05];3区:语义启动主效应显著[F(1,18) = 6.838, p < 0.05],频率主效应不显著[F(1,18) = 0.152, p > 0.05],语义启动与频率交互作用不显著[F(1,18) = 0.195, p > 0.05]。
4. 讨论
本研究采用汉字作为实验材料,探究在语义相关比例为一比三的条件下,汉字频率与语义启动在N400上的交互作用,从而检验多阶段激活模型与交互激活模型的词汇识别过程。
实验使用经典的语义启动范式,刺激序列以启动字–靶字–探测字逐一呈现,要求被试判断靶字与探测字是否为同一字,在靶字呈现后不需要立即作出反应,在探测字出现后做反应,这是同一字延迟判断任务,可以避免反应相关成分P300对N400的混淆。
实验中行为结果显示,在反应时上频率主效应显著,语义启动效应与二者交互作用均不显著;而正确率方面,无论高频还是低频条件下,启动字的正确率要明显低于无启动字。这与孙海静(2011)结果不一致,后者发现语义相关条件的正确率要显著高于语义无关条件。我们认为存在这种可能,后者实验材料使用的是模糊字判断,被试对于模糊字,在语义相关条件下会倾向于认为二者是同一字。然而我们实验使用的是清晰字材料,两者在材料上的不同可能导致不同的结果。
实验中的ERP结果发现,在中线区、1区与2区均发现频率与语义启动效应显著,未发现汉字频率与语境的交互作用,就是说二者存在加法效应,符合多阶段激活模型理论的预期。实验结果与孙海静(2012)第二个实验结果一致的,频率与语境不存在交互作用,但是其实验材料依旧选择的是模糊字。从ERP波形图可以看出来,无论低频还是高频条件下,无启动字的波幅较启动字波幅更负。已经有研究发现N400波幅反映了加工的难度,任务越复杂,相应的反应时就越长,N400偏负。Becker和Killion (1977)认为,低频条件下,语义无关比语义相关的N400波幅偏负,是因为前者的核证次数要多于后者;语义无关条件下,低频比高频的N400波幅偏负,也是因为前者比后者的核证次数多;而语义相关条件的高频和低频的N400波幅无差异,是因为在语义相关较强时,词频效应就会消失;在高频条件下,N400语义启动效应并没有低频条件语义启动效应大。但是图2中我们可以看出语义启动条件下,高频N400波幅较低频更负,这与核证模型是不相符的。而且ERP结果中中线区与1区出现了频率效应,按照Becker理论,在语义相关条件下频率效应不存在。导致不一致的原因有很多方面,可能是我们的反映变量与以往的研究有不同,以往选择的是反应时为指标,本文选择ERP为反应变量,也可能是由于材料的选取与被试的任务不同。
Figure 2. Left: The average amplitudes of four experimental conditions. Right: Topographical maps of the voltage amplitudes for semantic priming differences (no prime-prime)
图2. 四种实验条件下的平均波幅图及不同频率下的语义启动差异波(无启动–启动)地形图
而多阶段激活模型认为各个阶段的加工是独立的,频率作用于单词水平,语义启动作用于语义水平,两个分别作用于不同加工阶段的因素不会表现出交互作用,只有当语义水平到词汇水平的反馈联通,产生反馈作用,使得语义启动可以经由反馈而作用于字母水平时,频率和语义启动才会出现交互作用。而被试意识到语义相关比例低时,不产生反馈作用,汉字频率和语义启动则表现出加法效应。这与我们的实验结果是相一致的,我们实验中语义启动与无启动比例为1:3,启动比例低,语义水平到词汇水平的反馈不能联通,因此频率与语义启动不能产生交互作用,出现了加法效应。这也就解释了我们的实验结果,验证了词汇加工多阶段激活模型理论。
5. 结论
(1) 汉字加工过程中,频率与语境存在加法效应,不存在交互作用,支持多阶段激活模型,为汉字认知加工提供依据。
(2) 多阶段模型受多种因素影响,如频率、语境等。