1. 引言
根据CNNIC第53次《中国互联网网络发展状况统计报告》,截至2023年12月,我国手机网民已达10.91亿,网民使用手机上网的比例为99.9%。我国网络视频(含短视频)用户规模达10.67亿,占整体网民的97.7%[1]。国内市场上监测到活跃的APP数量为260万款,人均APP安装总量上升至68款[2]。为了推动APP市场持续发展,用户体验作为用户对APP最直观、最主观的反馈,日益受到各方关注。
随着社会生产力的提升,消费者对产品的需求逐渐从数量需求转为可用性需求,当基本需求得到满足之后,用户体验的重要性日益凸显。根据ISO 9241-11:2018的定义,用户体验涵盖了用户在使用或预期使用系统、产品或服务时所产生的感知和反应[3]。产品可用性是用户体验的核心,而用户体验则是产品可用性的扩展和深化[4]。目前,产品可用性的研究已广泛应用于移动设备[5][6]、智能家居系统[7][8]、网络应用程序[9]以及公共服务平台[10][11]等多个领域的产品设计和性能优化。
用户体验的量化评估是对用户体验质量进行具体化的测量过程,包括主观与客观的测量手段。访谈和问卷调查由于成本效益高、实施便利,成为评估用户体验最常用的手段之一。从已有文献可见,陈淑红和程春通过自制问卷调查了网易云音乐APP用户体验对用户忠诚度的影响,并发现感官体验、互动体验和社会体验对用户忠诚度具有显著的正向影响[12];Lee等利用问卷调查和访谈法探究了老年人群使用手机的用户体验,结果表明,老年用户普遍反映手机操作复杂,能够熟练使用的功能也十分有限[13];丁群和卢星运用访谈和问卷法评估了老年家庭康养产品设计的用户体验[14]。
目前,系统可用性量表(System Usability Scale, SUS)是被广泛认可的用研测量工具,可用于各类产品、系统与服务的可用性测评[15]。在我国,该量表已经取得可靠的信效度验证[16](详见方法部分)。但现有多数用户体验评估量表均源自国外,未经过中国本土环境的信效度检验。用户体验的可用性量表(Usability Metric for User Experience, UMUX)[17]作为SUS量表的一个变式,融合了ISO的相关标准,旨在评估用户的感知可用性,且在英语和意大利语的环境中表现出良好的信效度指标[18][19]。除了传统的可用性属性测评,网站分析与测量调查表(Website Analysis and Measurement Inventory, WAMMI)是为评价网站在线服务而设计的量化评估工具[20],有英语、法语、德语等大部分欧洲语言测试版本可用[21]。UMUX量表和WAMMI量表目前还需要中文文化环境下的信效度验证。
哔哩哔哩(简称B站)是一个以视频弹幕功能著称的网站。据B站2022年四季报及全年财报指出,其日均活跃用户数达到9280万,月均活跃用户3.26亿,用户日均使用平台时间长达96分钟[22]。虽然B站在视频领域中以其独特的内容、形式和设计展现出一定的创新性和新颖性,但与抖音、快手等竞争对手相比,其发展仍显不足。面临这样一个庞大的用户基础,B站需要解决的关键问题是如何将新用户培养成为忠实用户,并进一步转化为付费用户,以增强运营商的经济效益。用户转化过程中,用户体验扮演着至关重要的角色——它是推动用户留存和付费转化的关键因素[23]。因此,B站当前的核心追求在于更精准地满足用户的显性和隐性需求,以此提升用户对产品的忠诚度和满意度[23]。
B站的用户体验,根据已有研究,主要得益于其独特的播放机制——弹幕、内容丰富的原创视频以及相对较少的广告。例如,李堂辉基于“使用与满足”理论指出,B站的弹幕功能作为一种新兴的互联网信息交流和传播方式,有效满足了用户的多样化需求[24]。黄炜等的研究发现,用户对信息的选择关注和对视频的满意度会直接影响其对Vlog的使用决策,同时,对视频的整体感受会直接影响用户持续使用的意愿[25]。赵瑜的研究则表明,B站短视频的文本内容和互动体验呈现出两种叙事类型和三种交互动机的模式,这些不同的模式直接影响用户的体验[26]。秦紫函的分析进一步指出,B站注重文化和用户的运营策略,以确保为用户提供更好的体验[27]。然而,尽管前人研究涉及B站的多个方面,但尚未有研究对B站APP的整体满意度进行全面的评估。
B站的用户群体中,18~35岁占比78%[28],大学生是其中重要的活跃人群。鉴于此,本研究旨在评估大学生对B站的整体满意度,并进一步验证及提升中文版UMUX量表和WAMMI量表在中国文化环境应用的有效性。
2. 研究方法
2.1. 研究对象
本次研究以大学生B站用户为调查对象,采取方便取样方法,共进行了三次样本的发放,剔除无效及规律性作答的,最后有效样本依次为:第一次1011份有效问卷,有效回收率98.73%,其中男性432名,女性579名,用于两个量表的有效性检验,我们又在一个月后对其中80名相同被试进行了两个量表的重复测量。第二次有效问卷仍然是1011份,用于两个量表的用户体验现状调查。第三次我们选择41名大学生被试,男性22名,女性19名,目的在于通过定性访谈的方式,深入了解他们对于B站的整体印象以及不满意之处。
本研究采用SPSS 26.0进行描述性统计分析和探索性因素分析,使用Amos 24.0软件对数据做验证性分析。另外,利用NVivo 11.0软件对访谈资料进行整理和分析,提取文本内容中的关键词频。
2.2. 研究工具
2.2.1. 用户体验的可用性量表(Usability Metric for User Experience, UMUX)
UMUX量表被看作是SUS量表的一个变式。最初它包含12个问题,后来经过修订,缩减为一个包含四个问题的单维量表。这个量表包括综合体验(第1题)、满意度(第2题)、有用性(第3题)和高效性(第4题)四个部分,其中后三个方面用来测量ISO可用性定义[17]。在本研究中,我们使用这个四题版的UMUX量表,采用七点计分,分数从1 (非常不同意)到7 (非常同意)。量表中包含正向和反向的描述,转化分值范围在0~6。UMUX总分通过将四个问题的得分相加后除以24,再乘以100,计算得到与SUS量表相同的0到100的分数区间。分数越高,表明用户的可用性体验越佳[17]。
2.2.2. 网站分析和测量调查表(Website Analysis and Measurement Inventory, WAMMI)
爱尔兰科克大学的人因研究组(HFRG)于20世纪90年代早期研发了针对评估软件应用的软件可用性测试调查表(Software Usability Measurement Inventory, SUMI)[29],随后该研究组又与斯德哥尔摩的Nomos management AB合作开发出来WAMMI量表用于网站评估。WAMMI已经被用来对世界范围内的上百个网站进行了评估。当前版本的WAMMI由20个项目构成,采用5点Likert评分,包括肯定与否定陈述,从1 (强烈同意)到5 (强烈不同意),一共包含了五个维度:吸引力(Attractiveness)、可控性(Controllability)、效率(Efficiency)、帮助性(Helpfulness)、易学性(Learnability)[20]。标准化的整体WAMMI分数的平均值是50,标准差是10,100,是最高值。WAMMI量表的总分越低,代表着B站用户体验越好。
2.3. 效标选择
系统可用性量表(System Usability Scale, SUS)由John Brooke创建[15],目的是对系统或产品的感知可用性进行评估。它目前是应用最为广泛的用户体验测量工具之一。2020年,Wang及其同事对中文版SUS量表进行了修订,并验证了其效度的可靠性[16]。在本研究中,我们采用了这个中文版的SUS量表作为效标工具,与另外两个量表一同发放。量表由十个采用李克特5点计分法的问题组成,评分范围从1 (代表“非常不同意”)到5 (代表“非常同意”)。其中,偶数题项是反向描述问题,每题的得分转换范围为0~4。正向描述题目的转换分值为原始分数减1,而反向描述题目的转换分值为5减去原始分数。所有题目的转换分值总和乘以2.5后,即可得到SUS量表的总分,其分数范围在0~100之间[16]。在本项研究中,SUS量表的Cronbach’sα系数为0.870。
2.4. 翻译与回译
为确保翻译质量,我们采取了严格的双重校对流程。首先,我们邀请两位语言学教授和一位具有英语教育背景的心理学教授共同翻译了UMUX量表和WAMMI量表的初稿。随后,一位心理学教授对初稿进行了细致的审阅和归纳,并根据实际应用场景对题项表述进行了调整。为了确保翻译的准确性,我们随后邀请了两位英语专业的教授对这两个量表进行回译。在此过程中,我们还特别邀请了一位心理学专家对回译稿与原稿之间的一致性进行了细致的比较和研究。最后,为了确保量表翻译的适应性和实用性,我们选取了10名B站用户进行调查,并根据用户的反馈对存在问题的题项进行再次修订,从而形成中文版的UMUX量表和WAMMI量表的最终版本。
3. 数据分析及结果
3.1. 中文版UMUX量表和WAMMI量表的适用性检验
3.1.1. UMUX量表研究结果与分析
1) 项目分析
通过对1011名被试UMUX量表得分进行相关分析,结果显示,各题项与总分的相关系数在0.679~0.752之间,均在0.01水平上达到显著。本研究以总分为依据,对研究对象进行了排名,将分数最高的个体(前27%)分为高分组,将分数最低的个体(后27%)分为低分组,并对高分组与低分组样本在4个题项的得分进行独立样本t检验。结果表明,两组样本在每个题项的得分均差异显著(p< 0.001)。这说明UMUX量表所有题项具有较好的区分度。
2) 信度检验
问卷的信度分析主要是对问卷测量的可靠性与稳定性的考量,其主要目的是检验测量所得结果的内部一致性程度。UMUX量表的α系数为0.746,重测信度为0.792,UMUX量表是单维度,合成信度为0.850,说明UMUX量表在中国具有一定的可行性。
3) 效度检验
效度分析用来评判测量结果的正确程度和准确程度。探究UMUX量表的四个因子之间及与总量表的相关分析结果发现,四个因子与总量表之间的相关系数较大(0.679~0.752),说明各因子都围绕一个共同特质;四个因子之间存在较低程度的相关(0.216~0.538),显示每个因素有各自独立的作用。这些说明UMUX量表具有良好的结构效度。
以SUS量表作为效标,本研究测得UMUX量表得分与该效标的得分呈现显著的正相关(r= 0.723,p< 0.01),说明该量表效标效度良好。
3.1.2. WAMMI量表研究结果与分析
1) 项目分析
同理UMUX量表,对WAMMI量表的各题目与总分做相关分析,其中第5题“B站需要更多的介绍性说明”题总相关系数为0.147,未达到0.400的标准,鉴别能力较低,予以删除。其余题目与总分的相关系数都在0.600以上。接着将研究对象按总分高低排序,进行高低分组(前后各27%),对两组在余下的19个题项上的得分进行独立样本t检验,结果显示存在显著差异(p< 0.001)。这说明WAMMI量表的各个题项具有较好的区分度。
2) 探索性因素
本研究将被试随机分成两部分:一部分(n = 504)用于探索性因素分析,另外一部分(n = 507)接受验证性因素分析。
本研究使用KMO和Bartlett球形检验样本的充足度和进行因素分析的适宜度。结果表明,KMO = 0.904,Bartlett球形检验结果达到显著性水平(χ2= 3560.221,df= 190,p< 0.001),这说明样本数据适合进行探索性因素分析。
基于上述结果,本研究使用主成分分析法(Principal Components)提取各因子,并使用最大方差法(Varimax)进行旋转。在因子选择上,删除因子下题项只有一个或两个的因子。探索性因素分析结果显示,有两个因子包含题项在三个以下。因此,再次删除3个题项(第10题、第12题、第16题),保留余下16个题项,并对剩下的16个题项进行第二次探索性因素分析,提取因子方法如前。16个题项的公因子方差值范围为0.451~0.732,最终抽取出四个因子(图1),四个因子之间成分相关矩阵的相关系数范围为0.416~0.831,累积解释总变异的61.58% (表1)。对新因子进行重新命名,依次为:1) 可用性:指B站能否被正常使用,以及使用B站所需要的时间和努力程度。2) 易用性:指B站能够被多数用户在最短的时间内熟练使用的程度。3) 满意度:由用户对B站使用需求与期望所产生,是用户使用产品中的主观感受,包括视觉、时间、流畅度等带来的感受。4) 易学性:用户认为他们掌握B站系统或学会使用B站新功能的速度和容易性。
Table 1.Results of EFA of WAMMI scale (n = 504)
表1.WAMMI量表探索性因素分析结果(n = 504)
项目 |
共同度 |
因素负荷 |
特征值 |
贡献率(%) |
累积贡献率(%) |
因素1 |
可用性 |
|
5.778 |
36.114 |
36.114 |
3 |
0.732 |
0.831 |
在B站上,我能快速找到我想要的东西 |
4 |
0.657 |
0.747 |
在我看来,B站是符合逻辑的 |
9 |
0.624 |
0.744 |
B站可以帮助我找到正在查找的内容 |
13 |
0.577 |
0.698 |
当使用B站时,我感到效率高 |
1 |
0.677 |
0.650 |
B站有许多我感兴趣的内容 |
因素2 |
易用性 |
|
2.390 |
14.937 |
51.050 |
8 |
0.615 |
0.744 |
B站太慢 |
14 |
0.632 |
0.756 |
很难说B站是否有我想要的东西 |
17 |
0.607 |
0.710 |
难以记住自己在B站上的位置 |
18 |
0.612 |
0.691 |
使用B站就是浪费时间 |
2 |
0.572 |
0.651 |
B站浏览起来是困难的 |
因素3 |
满意度 |
|
0.895 |
5.594 |
56.645 |
7 |
0.658 |
0.67 |
当我使用B站时,我感觉可以掌控操作 |
6 |
0.568 |
0.557 |
B站的网页非常吸引人 |
11 |
0.677 |
0.508 |
我不喜欢使用B站 |
因素4 |
易学性 |
|
0.790 |
4.935 |
61.580 |
20 |
0.701 |
0.790 |
B站上的每件事情都容易理解 |
15 |
0.451 |
0.469 |
第一次使用B站是容易的 |
19 |
0.492 |
0.416 |
当点击B站时,能得到我期望的内容 |
3) 验证性因素
根据探索性因素分析的结果,我们对另一部分样本数据(n = 507)进行了验证性因素分析,以检验WAMMI量表的四个因子的拟合程度。如表2所示,四个因子的拟合指数都达到了理想标准,说明模型对数据具有很好的拟合能力。此外,各项拟合指数都符合预期值要求,表明模型具有很高的可靠性。
Figure 1.Analysis scree plot of EFA of WAMMI scale
图1.WAMMI量表探索性因素分析碎石图
Table 2.Main fitness indexes of WAMMI scale
表2.WAMMI量表主要拟合指数
|
模型拟合指数 |
统计检验量 |
χ2/df |
RMSEA值 |
GFI值 |
NFI值 |
TLI (NNFI)值 |
CFI值 |
适配标准值 |
<3 |
<0.08 |
>0.9 |
>0.9 |
>0.9 |
>0.9 |
模型值 |
3.011 |
0.066 |
0.928 |
0.907 |
0.918 |
0.933 |
4) 信度检验
WAMMI量表的内部一致性分析显示,其总体的Cronbach’sα系数为0.882,表明量表具有较高的可靠性。此外,各维度的α系数介于0.650至0.860之间,进一步证实了其良好的内部一致性。重测信度达到0.766,说明该量表在不同时间点测量的一致性也较为理想。
5) 效度检验
分析WAMMI量表的四个因子及其与总量表之间的相关性显示,这四个因子与总量表的相关性较强(相关系数介于0.738至0.800之间),而因子之间的相关性则相对较弱(相关系数介于0.319至0.501之间),这表明WAMMI量表具备良好的结构效度。此外,WAMMI量表与作为效标的SUS量表之间的相关系数达到0.709 (p< 0.01),这一结果说明两量表之间效标效度合乎标准。
3.2. UMUX量表和WAMMI量表用户体验现状调查
3.2.1. 量表人口学变量总体分布情况
由表3可见,本研究中男性432份(42.7%),女性579份(57.3%),男女大致平衡;使用时间小于1年的有54人,1年到3年的有381人,3年以上的有576人,大多数人使用时间较长;大部分人的使用频率都比较频繁,基本上每周都有使用。
Table 3.Distribution of demographic variables
表3.人口学变量分布情况
|
|
频数 |
百分比(%) |
性别 |
男 |
432 |
42.7 |
女 |
579 |
57.3 |
使用时间 |
小于1年 |
54 |
5.3 |
1年到3年 |
381 |
37.7 |
3年以上 |
576 |
57.0 |
使用频率 |
每天都使用 |
455 |
45.0 |
每周都使用 |
429 |
42.4 |
每月都使用 |
127 |
12.6 |
3.2.2. UMUX量表的现状分析
UMUX量表得分越高,代表用户体验越好。对不同性别、使用时间、使用频率的B站用户进行UMUX量表得分的多因素方差分析,结果发现,四个维度和量表总分均不存在交互作用。使用时间在综合体验、有用性以及量表总分上存在着主效应差异(F综合体验(3,1010)= 21.132,p< 0.001;F有用性(3,1010)= 20.687,p< 0.001;F总分(3,1010)= 16.833,p< 0.001),使用时间越长的用户体验感越好。使用频率表现出主效应,频率高的用户有更好的有用性体验(F有用性(3,1010)= 14.420,p< 0.001)。
3.2.3. WAMMI量表的现状分析
总体而言,WAMMI量表的分数越低,意味着用户体验越佳。同样采用性别、使用时间和使用频率三个自变量进行多因素方差分析,结果显示这四个维度与量表总分上没有交互作用。使用时间对于可用性、易用性、用户满意度以及量表总分等方面具有显著的主效应影响(F可用性(3,1010)= 17.550,p< 0.001;F易用性(3,1010)= 13.120,p< 0.01;F满意度(3,1010)= 31.040,p< 0.001;F总分(3,1010)= 27.040,p< 0.001),使用频率在满意度上存在主效应差异(F(3,1010)= 25.116,p< 0.001)。使用时间越长,使用效率越频繁,用户的使用体验感越好,满意度越高。
3.3. 用户体验访谈结果分析
根据访谈结果可知,大学生用户对于B站用户体验的使用体验较好。根据词云图(图2)发现,“使用”被提及的次数最多,其次“符合”、“功能”、“操作”、“容易”、“学习”、“吸引力”、“效率”、“帮助”等也被提及较多。
Figure2.Word cloud map of interview results
图2.访谈结果词云图
4. 讨论
4.1. 关于中文版UMUX量表和WAMMI量表的修订与检验
在中文版UMUX量表上,本研究通过对1011份问卷进行数据分析后发现:1) 项目结果显示,UMUX量表的题总相关系数在0.679~0.752之间,题与题之间的相关系数在0.216~0.655之间,表明量表的每一个题项均指向了一个共同的主题,但题项之间本身的重合度不高,具有较好的区分度,反映了量表可从B站用户体验的不同方面进行评估。2) UMUX量表的α系数为0.746,重测信度为0.792,合成信度为0.850,与SUS量表的效标效度为0.723,说明量表在中文语境下具有一定的可施测性。
在中文版WAMMI量表上:1) 项目分析结果显示,WAMMI量表各题项与总分的相关系数在0.147~0.660之间,均在0.01水平上达到显著;其中第5题与总分间的相关系数为0.147,题目的鉴别能力较低,应当剔除。2) 数据高低分组后,两组样本在题项的得分均差异显著(p< 0.001),说明WAMMI量表的题项具有较好的区分度,可从不同维度对B站用户体验进行多方面的评估。3) 在进行探索性因素分析中发现,其中两个因子下分别只有两个题项,不符合每个因子下至少三个题项的要求,因此将这四个题项(第5题、第10题、第12题、第16题)予以剔除,然后进行验证性因素分析,发现各种拟合指数达到标准,说明剔除题项后的模型对数据拟合较好。4) WAMMI量表总分α系数为0.882,每个维度的α系数在0.650~0.860之间,重测信度达到0.766。四个因子(可用性、易用性、满意度、易学性)与总量表之间的相关系数较大,说明各因子都围绕一个共同特质,四个因子之间存在较低程度的相关,每个因素有各自独立的作用,进而说明WAMMI量表具有良好的结构效度。与作为效标的SUS量表之间的相关系数达到0.709 (p< 0.01),效标效度也较理想。
总之,修订后的中文版UMUX量表和WAMMI量表具有良好的信效度指标,适用于评估大学生对B站的用户体验情况。
4.2. 两个量表的用户体验评价
4.2.1. 总体用户体验评价
整体而言,大学生用户对于B站的用户体验较好,与前期访谈的结果一致,这可能与其用户本身的特殊性有密不可分的联系。B站的用户大多为Z世代用户[28](Z世代用户:指出生于1990年~2009年的用户),这些用户大都是独生子女,在儿童成长时期缺乏兄弟姐妹的陪伴,所以他们希望能够得到认同,找到归属感,B站的出现恰好为Z世代用户提供了他们所需要的认知需求和情感需求。除此之外,B站会赋予用户广泛的自主权,包括发布弹幕、一键三连等,久而久之,用户在这种环境下与B站的连接会更加紧密,使用体验也会更加偏向积极[30]。
4.2.2. 两个量表的现状分析
两个量表的结果均表现出,使用时间长和使用频率高的用户体验感更好,满意度也更高。首先,使用时间长和使用频率高,用户会与B站建立更深层次的联系,对B站分享的信息能进行更深层次的加工,产生强烈的参与感和社会存在感[31]。此外,B站的用户只有通过高门槛的会员答题制度后才能成为B站的正式会员,这个行为本身就需要花费更多的时间与访问频率,而愿意这样做的用户就表明是认同或者喜欢B站的某些内容的,具有极高的忠诚度和归属感[30]。
但B站用户体验在不同性别上的差异不显著,赵阳佳紫的研究中发现性别对于B站跨年晚会的使用动机没有差异[32]。一方面是因为B站的分区十分丰富,包括电影、电视、动漫、资讯、运动、美食、汽车漫画、鬼畜等,不同的性别人群都能在B站里找到符合自己期望的内容,女生可以追星、刷剧、看吃播、学美妆,男生可以看汽车、动漫、运动等;另一方面是B站注重用户体验和用户反馈,通过持续的优化网站界面布局、功能设置、推荐算法等来适应不同性别用户的需求,让用户感到使用起来很舒适和顺畅。
4.3. 用户体验访谈评价
在访谈过程中,我们发现“使用”这一词汇频繁地被提及,这无疑反映出B站用户在体验过程中的极高满意度。那些如“符合”、“功能”、“操作”、“容易”、“学习”、“吸引力”、“效率”、“帮助”等关键词,更是清晰地揭示了大学生用户群体对B站的普遍认可。他们认为B站不仅操作简便,使用起来轻松愉悦,而且能够高效满足他们的需求,提供极具吸引力的内容和功能,帮助他们更方便地获取信息和解决问题。
5. 结论
1) 修订后的UMUX量表的信效度较好,WAMMI量表在删除第5题、第10题、第12题、第16题后,保留剩余的16个题项,具有较高的信效度。两个量表的指标符合测量学标准,在中国文化环境中具有一定的适用性。
2) 中国大学生用户的B站使用体验整体来说较好,在性别上不存在差异,但表现出使用时间越长、使用频率越高的用户体验更好。
基金项目
国家自然科学基金重点项目(No. 61936010);重庆文理学院横向项目(No. WLHX-2020-0033)。
NOTES
*共同第一作者。
#通讯作者。