Digital Trace Collection Techniques in Media Psychology Research
As digital media becomes ubiquitous, people’s daily lives are increasingly “mediatized”, making the psychological impact of media usage a focal research topic. However, traditional research methods relying on self-reports exhibit strong subjectivity and struggle to capture complex digital experiences. This paper examines the application of digital trace collection technologies in media psychology research, analyzing their advantages and limitations. Digital traces—activity records left by users during digital media interactions—provide new perspectives for objectively assessing individual digital experiences. The study introduces three primary digital trace collection techniques: API integration, data donation, and screen tracking, analyzing their specific applications in capturing user content consumption patterns, usage motivations, temporal scales, and contextual information. Nevertheless, limitations persist, including challenges in applying these methods to specialized devices, incomplete representation of real-life details, and constraints imposed by participants’ digital literacy levels. Future research should focus on developing more efficient data collection/analysis techniques, constructing multimodal data integration frameworks, and exploring designs for digital health intervention systems.
Media Psychology
根据《第55次中国互联网络发展状况统计报告》,截止2024年12月,我国手机网民规模达11.05亿人,占全体网民的99.7%;人均每周上网时长为28.7小时(
在学术界,自互联网诞生以来,学者们便开始探讨电子设备使用对个体心理行为的影响,如儿童对电视教育节目内容理解能力模型的研究(
用户日常使用数字媒介时形成的连续交互数据序列,即数字痕迹(digital traces)可被定义为“通过在线信息系统进行的活动记录”,因为这些数据往往是在用户使用数字媒介过程中由互联网平台、设备传感器及其他软硬件收集和保留的(
数字痕迹的收集技术主要包括从公开的互联网平台上获取数据(通过API访问、爬虫等)、由用户主动捐赠数字平台上的数据以及通过实时截屏获取用户正在浏览的信息。
API (应用程序接口,Application Programming Interfaces)是一种以平台为中心的数据痕迹收集方法。研究者可通过互联网平台开放的API,按照特定的格式批量获取需要的用户数据,如发帖数、点赞数、关注数、粉丝数等(
然而,使用API的权限可能会遇到来自用户和平台的限制。一方面,用户可以自由地编辑和删除在互联网平台上产生的痕迹。另一方面,平台通常会限制研究人员通过API允许访问的数据范围,这导致由API所收集的数据往往缺乏统一性,降低了后续研究的可重复性(
数据捐赠(data donation)是一种以用户为中心的方法,指被试主动将存储在个人设备上的数据提交给研究人员。这些数据多为聊天记录、通话记录等非公开的数据。研究人员可以通过使用插件或者通过手动记录在手机上的特定内容来获取此类数据(
数据捐赠方法能够与传统问卷、访谈等的研究方法相结合,获得有关个体在过去的特定生活事件中的详细数据,且能确保被试得到充分的知情同意,并明确数据使用范围和权限。但该方法也有其局限性。首先,对于需要从平台上请求获取的数据,用户可能不太容易操作,需要研究人员耐心指导;其次,由于数据捐赠依赖用户的主动提供,研究人员可能无法获得足够大的、多样化的样本。另外,与API相比,以这种方式收集到的数据往往缺乏结构化,需要研究者进行进一步的整理。因此,数据捐赠方法适用于明确目标群体类型的研究。
屏幕追踪(screen tracking)与数据捐赠同样是以用户为中心的方法,指通过安装在设备上的特定软件收集用户实时屏幕信息,形成与个体实际行为密切相关的时间序列数据。这些信息能够最大程度反映用户正在浏览的应用程序和内容以及花费的具体时间(
斯坦福大学Bryon Reeves教授团队开展的“人类屏幕组项目(Human Screenome Project)”是使用屏幕追踪来研究媒介心理的系统尝试(
屏幕追踪技术使研究人员得以摆脱特定媒介、平台、应用程序的限制,从电脑、手机、平板、电视等各种电子设备,以及即时通讯、网络购物、网络视频等各类应用上获得个体独特的数字体验。屏幕追踪技术获得的原始数据——截屏,包含了从文字、图片到视频(通过截屏可判断是否是视频内容)的多模态信息。同时,这些多模态信息又有着精确的时间戳记录,保留了用户数字体验的先后顺序和持续时间,以便分析诸如快速切换(
由于屏幕追踪技术涉及大量专业的开发知识,研究团队通常由跨学科背景的研究者组成,分别负责软件开发和部署、被试招募、隐私保护说明及数据处理和后续研究。Yee等人开发的“Screenlife Capture”开源软件降低了开展屏幕追踪实验的门槛(
数字痕迹收集技术,尤其是屏幕追踪技术,能够获取涵盖媒介使用内容、功能、时间以及情境等方面的信息。下文将阐述数字痕迹收集技术在上述四个维度对媒介心理学相关理论发展的推动作用。
过往媒介心理学的理论大都围绕着媒介本身来研究,如电视、电脑、手机等电子设备,或是Twitter、Facebook、微博等社交媒体平台。然而,用户最终接触到的是承载在这些设备和平台上的各种类型的内容。根据主题划分,有娱乐、时政、健康、金融、生活、社会内容等;根据模态划分,有文本、图像、视频、音频、虚拟现实内容等;根据产生主体,由用户生成的和他人生成的内容等。如果把媒介本身视作瓶子,那么在媒介上消费的内容则是瓶子中的水,后者往往对个体起到更直接的影响。数字痕迹收集技术能够直接访问到用户接触到的内容,不论其分布于何种平台和设备。同时,这些内容往往具备众多可识别的特征。对文本数据,有单词数量、文本移动速度等特征;对图像数据,有图像复杂度、图像移动速度等特征(
依据使用与满足(use-and-gratifications, U&G)理论,人们使用媒介以满足特定心理需求(
媒介技术对个体的影响可从不同的时间尺度考量。例如,接触媒介内容引发的心理影响既可以是数秒内的生理唤醒,也可能是数周内形成的条件反应,甚至是数月或数年后使用模式或习惯的改变。早期研究倾向于将媒介使用视为经验积累,侧重长期影响。例如,有研究表明玩更多电子游戏与更强的攻击性倾向有关,这一发现支持有关规范信念和行为脚本的一般性学习积累如何改变行为倾向的理论(
特定心理和行为的产生不仅与个体相关,还受到宏观的社会和文化背景因素影响。构成媒介使用情境的线索涵盖人、物体、事件、活动、地点和时间等客观可量化信息,这些线索定义了“who、what、where、when和how”五大要素。数字痕迹中的截屏信息、传感器信息(如GPS)、时间戳、通话记录等都可以成为还原情境的线索。Rauthmann和Sherman对赋予情境心理意义的特征进行了分类,包括责任(是否需要行动)、智力(是否需要深度处理)、逆境(是否存在威胁)、积极性(是否令人愉悦)、消极性(是否令人不悦)、欺骗(是否存在不诚实或表里不一)和社交能力(与他人联系的可能性、可取性或必要性) (
在大数据和智能计算迅猛发展的当下,数字痕迹收集技术与前沿科技深度融合,已逐渐成为媒介心理学研究的重要方法。然而,该技术也有其固有的局限。首先,由于最常用的电子设备主要为智能手机、电脑、平板等几类设备,数字痕迹收集技术绝大程度是围绕着这些硬件设备发展起来的。然而在此之外还有许多专业化的设备,如驾驶舱、操控台等人机交互界面。针对此类专业化领域中媒介体验对个体产生何种影响,有待后续技术拓展来深入研究。其次,虽然数字生活已经占据了现代人生活的大部分时间,但是“离线”的、脱离屏幕的现实生活的细节却无法仅通过数字痕迹技术全面呈现。目前已有研究将数字痕迹与个体生理数据、人口统计学及人格数据等整合起来,为研究基于屏幕和非屏幕的生活方面之间的相互作用提供了崭新的视角。最后,考虑到数字素养方面,使用数字痕迹收集技术开展实验的被试群体通常为伴随着技术发展而成长起来的年轻人,而在其他群体(如学龄前儿童和老年人)开展此类研究可能遇到困难。
数字痕迹收集技术正推动媒介心理研究实现从宏观描述向微观机制的转型。面向学科前沿,未来研究需聚焦以下三个具有可操作性的技术路线。首先,研究人员应积极拥抱AI浪潮,在数据采集和分析技术实现进一步突破,如开发基于计算机视觉算法的动态界面捕捉系统,通过卷积神经网络优化屏幕内容实时识别精度,解决传统截屏软件在移动端多窗口切换时的数据丢失问题,同时保证截屏程序兼容性更强、用户界面更友好;开发基于多模态大模型(如CLIP等)的自动化内容标注工具,以提升数据处理的效率和准确性。其次,数字痕迹收集技术在经验采样、日记法等生态效度较高的研究中已展现出独特价值。未来的研究可进一步构建“行为–生理–情境”多模态数据整合框架,除屏幕数据外,使用分布式传感技术实现多源数据融合,如通过可穿戴设备同步采集皮肤电反应、心率变异性等生理指标;利用环境传感器矩阵记录光照强度、空间位置等情景参数。此外,AI与大健康的结合鼓励研究人员基于数字痕迹收集技术设计个性化的数字健康干预系统,如建立用户数字画像的动态更新机制,结合LSTM网络分析数字痕迹的时间序列特征,并开发监测与风控系统对用户的不良行为及时发送提醒。综上,数字痕迹收集技术正在重塑媒介心理学的理论疆域与方法论体系,其持续发展亟需技术应用与人文反思的深度融合,以实现科学性与人文性的有机结合,推动媒介心理研究迈向新的高度。