1. 引言
面孔识别包括对自我和他人面孔的识记、对表情的识别以及社会信息的理解。面孔识别是反映个体的人我认知、情绪体验、情绪智力和社会能力的一个关键指标(刘宏艳,葛列众,2014),它还可以作为一种诊断指标,既可以检测个体的功能情况,又可以检测个体接受治疗后的恢复情况。人脑对面孔加工的过程及其背后的机制、识别模式是人工智能发展的依据,近年来人工智能的兴起,体现出面孔识别研究的重要性和实践价值。
面孔识别与个体的社会生活息息相关,包括个人的心理健康、人际关系、工作以及生活质量,因此,研究面孔识别的学科分布十分丰富,但是较少有研究对心理学领域的面孔识别文献做一个可视化的现状整理。面孔识别现状的整理至关重要,首先对于心理学科而言,面孔识别的研究分布领域、研究进度、研究重点、研究集中的机构和作者等情况,这些可以帮助心理学研究者了解这一领域的权威作者、相关研究成果、需要被关注但是目前的研究较少的主题、还需要进行深入探究的领域。其次,面孔识别的研究现状也有助于计算机算法、人工智能、医学、精神病理学、教育学等领域进行借鉴,为这些学科提供研究现状和研究方向指引,节省时间,此外,还能给这些领域提供实践应用的理论基础,促进面孔识别在各领域的应用。
可视化整理能够使面孔识别研究领域的现状得到一个清晰直观的总结和呈现,总之有助于减少后续研究的工作量。因此,本研究想要通过对1993年1月到2023年9月17号近三十年心理学领域的面孔识别相关文章的梳理来探查面孔识别的研究变化、研究现状和研究热点。
2. 研究过程
2.1. 数据来源与处理
在知网上,利用“面孔识别”、“表情识别”、“人脸识别”、“面孔识别”、“脸部识别”作为关键词,进行搜索,剔除非中文,非心理领域和非学术期刊以及影响因子较低的期刊,共获得可分析的论文440篇。
2.2. 研究工具与分析方法
利用软件Cite Space 6.2.R5 (陈悦等,2015)对知网上的1993年1月01日到2023年9月17日间的相关论文进行可视化分析。时间切片为1年;文本处理板块的词汇来源为:主题、摘要、关键词(DE)、关键词Plus (ID);节点类型板块选取了:合作作者、关键词、机构;进行合作作者共线、研究机构共线、关键词共线、关键词聚类和关键词突显分析。
3. 结果与分析
3.1. 发文量
Figure 1. Trend chart of “face recognition” published in the field of psychology from 1993 to September 2023
图1. 1993年到2023年9月心理学领域“面孔识别”发文趋势图
将每年发表的论文数量以折线图的方式呈现,结果如图1所示。从1993年到2023年9月17号期间,每年都有相关论文产出。具体来看,1993年到2012年都是处于上升的状态,从1篇到29篇;2013年到2014年在下小幅度下降;而到了2015年,数量猛然增长,达到了研究顶峰时期,达到最高38篇;自2015年以后,除了2017年相对于前年增加了4篇以外,此后发表论文数量开始成下降的趋势。最近的2023年,1月到9月17号间只发表了11篇,相对于最鼎盛时期来说,是下降了三分之二左右,可以看到近几年的研究趋势是下降的。图中虚线为1993到2023的发表论文量的总体趋势线,表明从总体而言,这三十年间相关研究是处于上涨的趋势。
3.2. 合作作者分析
作者共线分析可以看出作者之间的合作关系,以及论文之间的引用情况。由图2可知,进行分析后,最终得到节点数为412个、连接线为374条、密度为0.0044的图谱。用Price公式来计算核心作者最低发文量,公式为M = 0.749
,Nmax为该时间阶段内发表论文量最多的作者的论文数(丁学东,1993),在1993到2023年间,傅小兰发表相关论文最多,为14篇,公式计算后发现M ≈ 2.8,即把发表3篇及以上的学者列为核心作者,见表1。从图2的节点大小和连线多少可以看出,前十年研究者分布比较零散。中间十年以傅小兰、贾竑晓作为合作研究的主体,刘洪广、刘嘉、朱虹、黄希庭、冉光明等作为第二阶梯团队;后十年以张林作为主体,涌现出了多个研究团体,但每个团体的发文量多数都少于中间十年团体的数量,而且研究作者多分散。
Table 1. Number of publications by core authors
表1. 核心作者的发文量
Figure 2. Collinearity plots of the co-authors
图2. 合作作者的共线性图
3.3. 作者机构分析
机构的共线分析可以知道这些机构间的发文情况与合作情况。由图3可知,进行分析后,最终得到节点数为351个、连接线为246条、密度为0.004的图谱。这些机构中发文数的Nmax由中国科学院心理研究所和西南大学心理部发出,均为12篇,利用上面公式计算出得出M ≈ 2.59,将发文为3篇及以上的机构作为核心机构,见表2。对图3进行分析,仅有8所机构发文超过7篇,其余的研究机构相关论文都较少,而且研究机构多为高校和医院,只有少部分研究结构间有合作,大部分研究机构间比较分散,较少有合作研究。
Table 2. Issued of core institutions
表2. 核心机构发文情况
Figure 3. Collinearity plots of the authors’ institutions
图3. 作者机构的共线性图
3.4. 关键词分析
关键词共线分析可以快速发现相关领域研究热点。由图4可知,进行分析后,最终得到节点数为389个、连接线为644条、密度为0.0085的图谱。这些关键词中使用次数最多的是“面孔识别”为102篇,因此Nmax为102,利用公式计算出得出M ≈ 7.56,将关键词出现8次以上的作为核心关键词,见表3。从图4可以看出,排除“面孔识别”这一检索词,其他频次较多的是情绪、面部表情、表情识别、情绪理解、情绪识别,可见对面孔的情绪的研究是重点;此外,异族效应、眼动、大学生儿童、抑郁症、孤独症也是核心关键词。异族效应说明关注个体对本族和对外族面孔识别上存在的差异是较多被研究的方向;而眼动是近些年兴起的研究面孔识别的有效技术;也可以看出大学生与儿童是较为常见的被试群体;最后抑郁症和孤独症这些个体的负面状况也是影响其面孔识别的强力因素。
Table 3. Frequency and centrality of keywords (frequency is 8 times)
表3. 关键词的频次和中心度(频次 ≥ 8次)
3.5. 关键词聚类分析
Table 4. Key word clustering table
表4. 关键词聚类情况表
Figure 5. Keyword cluster analysis map
图5. 关键词聚类分析图谱
在关键词共线分析的基础上进行聚类分析,Q值为0.7018 > 0.3,S值为0.9465 > 0.5,说明该聚类网络的聚类和同质性均显著,聚类网络可接受。关键词聚类分析一共有13个,但是排除了轮廓值 < 0.7的#9和#15,见表4和图5。通过表4和图5可以发现,除去检索词#0面孔识别,#1面部表情、#2表情识别、#5情绪理解、#6情绪面孔、#10心理理论均属于是对面孔情绪的识别;#3独特性、#4异族效应、#11内部特征、#12特质攻击属于对面孔识别的神经机制、认知过程、心理反应及其特异性的研究;#7性别差异、#8老年人属于对不同人群特征的研究,这些是近30年面孔识别领域的研究主要内容。
3.6. 关键词突显分析
关键词突显可以展现在短时间内突然大量增加的研究内容,帮助发现该时间段的研究热点。从图6可以看到,情绪理解和眼动是突显的关键词,情绪理解在2006年到2010年间被大量研究,而眼动在2014年到2016年间出现比较频繁。眼动技术相较于ERP、FMRI等技术,更加简便、易操作、易懂、结果直观,因此近几年常被使用到面孔识别研究中。
Figure 6. Key words are highlighted and analyzed
图6. 关键词突显分析
4. 讨论
4.1. 现状
从关键词聚类结果看到目前面孔识别的主要研究主题,概括起来有面孔情绪识别、面孔特异性识别和不同人群面孔识别情况三大领域。
4.1.1. 面孔情绪识别
面孔作为一个社会信息源,情绪的信息作用巨大。面孔表情识别是个体情绪功能和社会功能的重要体现,其过程包含了知觉、认知、记忆和社会意义的理解等(刘宏艳,葛列众,2014),对个体的社会生活、工作质量、心理健康存在重要影响。因此,寻找面孔情绪识别的神经机制、行为表现、影响因素对解码面孔情绪识别至关重要。心理理论是面孔情绪识别的基础,指的是对自我和他人心理的理解与推断,心理推断能力较差也会引面部表情识别的障碍。此外,面孔情绪的强度、背景线索、呈现方式、身体动作等也会影响个体对情绪识别(白鹭等,2017;刘宏艳,胡治国,2012)。
4.1.2. 面孔特异性认知
(1) 认知特点:人脑对面孔识别的内在机制是一个独特的过程,因为面孔不同于别的物体,人对面孔的识别是天生且立体的、特征信息和整体结构综合加工的(樊倩等,2014),如对面孔进行倒置,人对其的认知将会变的困难(汪海玲,傅世敏,2011),而人对其他物体的识别则不存在倒置效应。特殊面孔和外在因素也会影响识别,如遮挡的、卡通的、错乱的、模糊的、缺失的面孔,情绪状态、背景条件等,对这些因素的研究都有助于了解面孔的认知机制(王磊等,2020;王玲等,2012)。面孔识别还存在区域化效应,眼睛和嘴巴在情绪面孔识别、面孔熟悉度等过程中所起的作用不同(韩瑽瑽等,2008;王哲等,2023)。
(2) 神经机制:ERP研究发现N170是一个面孔识别的相关脑电波(韩磊等,2010;彭小虎等,2002),P100、N300、VPP是在面孔识别不同脑区不同时段出现的脑电波(孔祥慧等,2017);FMRI研究得出梭状回、枕叶、颞上沟(徐岩等,2003)是面孔反应的定向脑区。
(3) 跨文化研究:跨文化典型的是本族效应和异族效应,对本民族面孔的记忆、辨别力及速度要好于对外族(吴红,黄青,2018),这其中存在自我群体偏向(温芳芳等,2020),因此,对本族和外族的面孔的电生理活动存在差别。跨文化的面孔研究对我们了解文化对人认知、行为的影响有很大的意义。
(4) 自我面孔识别:自我面孔识别具有优先权、高速度和持续吸引注意力的特质(吴昱,高湘萍,2013),但是患有精神疾病的群体的自我面孔识别却会受损。自我面孔识别与许多脑区域和机制存在相关,如其诱发的P300波幅要高于熟悉的他人面孔(杨红升,2005)。自我面孔识别与内在自我概念、自我形象等相关的自我心理密切关联,是一个探测潜意识自我的通道。
4.1.3. 不同人群的研究
可视化研究发现,目前对不同人群的面孔识别的研究比较丰富,主要是关于性别、年龄、特殊人群的面孔识别特点。
(1) 性别差异。女性面孔比男性面孔更容易辨识(陈睿等,2017)。脑电表现和面孔区域也不同,如男性在识别面孔时的N170的波幅和潜伏期与女性存在显著差异(盖毅等,2009;孙天义,2018),女性比男性更多的注视眼睛(郭英,张榆敏,2016)。女性的生理特质如月经、怀孕引起的身体激素(雌激素、孕激素)浓度变化也会显著影响面孔识别情况(陈春萍等,2010)。
(2) 老年人和婴儿、儿童面孔识别研究。随着年龄的增大,老年人的大脑机能在下降,心理状态、认知能力、态度都有变化,面孔识别可以反映老年人状况,了解这一过程也能了解衰老过程和帮助延缓衰老,如研究发现长期步行和太极拳锻炼都能增强老年人对面孔情绪的识别能力(罗丽等,2017)。婴儿面孔辨认和偏好、儿童面孔识别变化情况的研究有助于我们了解人类面孔识别的发生发展过程、其相关脑区,及了解人类在不同年龄的面孔知觉、识别、记忆、社会信息处理等的相关能力的表现(郑晨烨等,2021)。
(3) 特殊人群与正常人群在面孔识别上的行为表现、认知以及脑机制有不同(韩磊等,2010)。特殊状态如抑郁、焦虑、恐惧等会影响个体的面孔识别情况,但特殊状态可以通过心理咨询、干预治疗改变,因此,面孔识别可以作为检查异常和恢复情况的指标(王璐等,2018)。障碍和器质性病变人群也是研究热点,如自闭症谱系障碍,其面孔识别障碍与脑区中的梭状回和杏仁核的低激活以及脑电中N170、N300、P400和Nc等波的异常有关(王丽娟等,2009)。此外,精神分裂症、人格解离障碍、躯体疾病等人群也被较多关注(厚皎皎等,2020)。
4.2. 未来研究取向
4.2.1. 面孔识别的认知加工过程和神经机制
面孔识别的神经机制还需要借助仪器进行更细化的研究,如对面孔识别过程中对应的神经元、脑区域等的确认。面孔识别的认知加工过程、影响因素,比如面孔的熟悉度、可信度、面孔代表的社会信息的处理、及面孔识别与记忆、感知觉等的关系等依然值得探讨。此外,局部的、模糊的、动漫的面孔背后的识别机制对于人工智能领域发展的意义重大,值得进行深入研究。
面孔识别的元认知研究是近几年兴起的。面孔认知的认知有助于个体评估自身面孔识别能力并及时做出调整,对这个方面的研究或许帮助我们从本质上理解面孔识别。当前面孔识别的研究尚停留在元认知监测层面,未来可扩展至面部认知的元认知控制、与机器学习结合等方向,促进其实践应用(周星辰,贺雯,2022)。
目前关于面孔识别的研究主要是横断研究,纵向研究较少,而纵向可以帮助我们查看个体面孔识别在时间上的变化进程,同时也能增加研究结果的可信度。
4.2.2. 老年人面孔识别是新的研究趋势
我国已逐渐进入老龄社会,但目前对老年人的研究还较少,我们要更多关注的老年人的身心状况,努力为老年人提供心理健康服务,这需要我们对老年人做更多的调查研究。面孔识别作为一个反映老年人状况的指标,能帮助检查老年人的认知状况、衰老过程,了解变化特点。最后,老年人面孔识别研究也是一个生态效度较强的领域,相关研究可以应用到功能检查、生活质量改善上,这对老年人和社会和谐的意义重大。
5. 研究结论
本文对440篇论文进行可视化研究,通过发文量及其年份可以得出面孔识别的研究热度相较于鼎盛时期是下降的,但总体情况而言是上升的。作者和机构间的关联性不紧密,比较分散。这表明不同机构间的合作研究比较薄弱。关键词共线和聚类分析结果发现,目前面孔识别的研究主要集中在面孔情绪识别、面孔特异性认知、不同人群面孔识别三大领域。关键词突显分析发现,基于眼动追踪技术的情绪理解在快速增加。未来可以对面孔识别的认知加工过程和神经机制、老年人面孔识别进行深入研究。