[目的/意义]:通过分析热门网络微短剧在线评论内容,挖掘用户对该产品的深层次多元需求,有利于改进产品质量与探寻产品未来发展方向,促进处于成长期的产品健康可持续发展。[方法/过程]:通过Python爬取快手小剧场、腾讯“十分剧场”、B站小剧场热门视频评论,结合LDA主题聚类和Kano两种用户需求研究模型,获取用户需求,并对其进行质量类别归类和计算满意度,最终对结果进行讨论分析。[结果/结论]:文章中16项需求,11项是无差异需求,4项魅力需求,一项反向需求,对于魅力需求需要优先重点关注,部分无差异需求值得追踪挖掘,及时摒弃反向需求。 [Objective/Significance]: By analyzing the online comments of popular online mini-dramas, the deep-seated diversified demands of users for this product can be tapped, which is conducive to im-proving the product quality, exploring the future development direction of the product, and pro-moting the healthy and sustainable development of the product in the growing period. [Meth-od/Process]: The popular video reviews of Kwai Theater, Tencent’s “Ten Theater” and bilibili Thea-ter were crawled by Python, combined with LDA topic clustering and Kano’s two user demand re-search models, to obtain the user demand, classify its quality category and calculate its satisfaction, and to discuss and analyze the results. [Result/Conclusion]: There are 16 demands in the article, 11 of which are undifferentiated demands, 4 attractive demands, and 1 reverse demand. Attractive demands need to be given priority attention, and some undifferentiated demands are worth tracing and mining, and the reverse demand should be abandoned in time.
[目的/意义]:通过分析热门网络微短剧在线评论内容,挖掘用户对该产品的深层次多元需求,有利于改进产品质量与探寻产品未来发展方向,促进处于成长期的产品健康可持续发展。[方法/过程]:通过Python爬取快手小剧场、腾讯“十分剧场”、B站小剧场热门视频评论,结合LDA主题聚类和Kano两种用户需求研究模型,获取用户需求,并对其进行质量类别归类和计算满意度,最终对结果进行讨论分析。[结果/结论]:文章中16项需求,11项是无差异需求,4项魅力需求,一项反向需求,对于魅力需求需要优先重点关注,部分无差异需求值得追踪挖掘,及时摒弃反向需求。
Kano模型,网络微短剧,数据挖掘,用户需求分析,LDA模型
—Based on LDA Theme and Kano Model
Jiaxin Li, Shuge Tian*
School of Management, Shanghai University of Engineering Science, Shanghai
Received: Jul. 22nd, 2022; accepted: Aug. 15th, 2022; published: Aug. 25th, 2022
[Objective/Significance]: By analyzing the online comments of popular online mini-dramas, the deep-seated diversified demands of users for this product can be tapped, which is conducive to improving the product quality, exploring the future development direction of the product, and promoting the healthy and sustainable development of the product in the growing period. [Method/Process]: The popular video reviews of Kwai Theater, Tencent’s “Ten Theater” and bilibili Theater were crawled by Python, combined with LDA topic clustering and Kano’s two user demand research models, to obtain the user demand, classify its quality category and calculate its satisfaction, and to discuss and analyze the results. [Result/Conclusion]: There are 16 demands in the article, 11 of which are undifferentiated demands, 4 attractive demands, and 1 reverse demand. Attractive demands need to be given priority attention, and some undifferentiated demands are worth tracing and mining, and the reverse demand should be abandoned in time.
Keywords:Kano Model, Network Short Drama, Data Mining, User Demand Analysis, LDA Model
Copyright © 2022 by author(s) and beplay安卓登录
This work is licensed under the Creative Commons Attribution International License (CC BY 4.0).
http://creativecommons.org/licenses/by/4.0/
随着人们观看视频的方式逐渐由传统电视转向移动端,以及疫情防控常态化下居家办公学习成为一种趋势,网络微短剧从传统长视频、短视频、短剧中脱颖而出,成功锁定受众时间,迎来井喷式发展。根据2021年网络视听发展研究报告,截至2020年12月,微短剧等“微系列”产品成为长短视频平台的重点发展方向 [
根据Netfilx公司在短剧投入成本上的大数据算法结果以及国内网络微短剧上的相关研究、政策,文章将网络微短剧定义为:总集数控制在30集以内 [
综上,目前在微短剧研究领域,缺少用户需求方面的定量研究,而用户评论文本数量大,具有客观性,可获得性也高,适合用来对用户需求进行量化分析,根据用户满意度指数及需求类别提出优化发展的方向,更好地开拓微短剧市场,为该匹内容产品“黑马”持续健康发展服务。
用户需求研究主要包括用户需求信息的获取、计算用户需求权重、用户需求归类以及转化需求生成方案等。KJ法、问卷法等可以均可以获取用户需求信息 [
文章基于前人的研究,对网络微短剧用户需求进行归类,由于Kano模型在产品需求分类上较为广泛运用,文章以Kano问卷的形式从质量要素角度对用户需求进行分析。
在正式确定研究对象前,笔者通过“虚拟民族志法”,深入快手小剧场、腾讯“十分剧场”、B站小剧场,统计各自热门微短剧top 10的题材类型,根据三个平台自带分类标签进行分类统计,标出热度排名前三的题材类型,具体如表1。
题材/平台 | 快手 | 腾讯 | B站 | 剧集统计 | 排名(top 3) |
---|---|---|---|---|---|
古风 | 2 | 2 | 4 | 8 | 2 |
现代甜宠 | 4 | 5 | 0 | 9 | 1 |
家庭 | 3 | 0 | 0 | 3 | 5 |
乡村 | 1 | 0 | 0 | 1 | 6 |
悬疑探案 | 0 | 1 | 3 | 4 | 3 |
喜剧 | 0 | 2 | 1 | 3 | 4 |
万物脑洞 | 0 | 0 | 1 | 1 | 7 |
动作 | 0 | 0 | 1 | 1 | 8 |
合计(部) | 10 | 10 | 10 | 30 | - |
表1. 各平台剧集类型统计
时间截至2022年5月8日。
由表可见现代甜宠、古风和悬疑探案稳居热度题材前三,文章将对这三类题材的相关剧集进行评论文本爬取,作为后文的数据来源之一。
根据前文预调研的结果,文章分别在短视频、传统长视频及弹幕视频三种视频头部平台,对应选取快手小剧场、腾讯“十分剧场”、B站小剧场综合热度排名前三的微短剧题材(现代甜宠、古风和悬疑探案)对应的部分剧集视频评论作为研究对象,基于不同热门题材探究用户对网络微短剧关注的差异,挖掘用户多元深层次需求要素,促进后期发展对产品进行改进。
文章利用LDA模型对文本数据进行主题挖掘。LDA模型是一个用于处理文本数据集的非监督学习模型,服从狄利克雷先验分布,模型中最关键的是Drichlet分布α和β,这两个分布确定,模型即可确定。模型建立了文档–主题–词的三层概率结构,即主题可由词汇分布来表示,而文章可由主题分布表示 [
图1. LDA模型生成过程
文章通过Kano模型探求网络微短剧用户需求。Kano模型是基于心理学建模的用户需求研究方法,通过Kano问卷的方式研究用户对产品的隐性需求,该模型源于日本质量管理专家Noriaki Kano于1984年建立的关于产品质量特性与用户满意度的双维度的认知模型 [
文章主要包含用户需求获取、用户需求分析归类及结果讨论分析。在正式爬取数据前,文章做了预调研,确定爬取数据的具体类别,快手、腾讯评论利用python爬取,B站评论文本直接通过网络爬虫工具“八爪鱼采集器”获得;LDA主题聚类分析和Kano问卷调查是文章的核心;最终将获得的数据整理归类,讨论结果并提出网络微短剧未来的优化、发展方向,具体如图3所示。
图2. Kano模型 [
图3. 研究思路
文章基于预调研结果,通过“八爪鱼采集器”及Python爬虫从腾讯、快手和B站获取2022年2月至2022年四月的原始样本数据共22,848条,经过数据清洗,删除无意义符号表情、占楼语等,最终样本数分别为古风1697条,现代甜宠1872条,悬疑1617条,并对这些内容进行jieba分词,构建停用词表进行分析。
文章利用LDA主题模型识别文本预料中潜藏的用户需求,综合考量困惑度和相关性指标,设置主题数为5。文章以悬疑探案类微短剧为例,进行pyLDAvis可视化主题聚类,具体如图4。参数λ在[0, 1]之间,调节词语与主题的关联度,文章选取λ = 1,即文章出现频数较高的词与主题越相关,反之越特殊的词与主题相关度越高。可视化图中,任意选择一个主题,均会出现与该主题相关度最高的30个关键词。
图4. 悬疑探案类在线评论主题聚类可视化
综合三种类型微短剧评论主题可视化聚类结果,生成表2,即每个类型的五个主题分别对应的top 5关键词综合表。从表中内容总结抽象出对应的用户需求,制作成图5,不同类型微短剧特征词与用户需求映射关系图。从中可得,由表2抽象出了6个用户需求,分别是用户对题材内容、主角选择、服化道、后期视频处理、IP来源和视频呈现形式六类总需求。每类总需求对应着关联度最大的几个特征词,以此为基础,展开Kano问卷设计。
类型 | 支持文档个数 | 主题 | 关键词 | ||||
---|---|---|---|---|---|---|---|
古风 | 1697 | 1 | 男主 | 演员 | 短剧 | 竖屏 | 互动 |
2 | 演技 | 电视剧 | 短剧 | 柱子 | 王怜花 | ||
3 | 短剧 | 剧情 | 原著 | 原创 | 制作 | ||
4 | 历史 | 正剧 | 营养 | 精神 | 价值 | ||
5 | 滤镜 | 妆容 | 得体 | 美男 | 胡歌 | ||
现代甜宠 | 1872 | 1 | 男生 | 表白 | 恋爱 | 分手 | 现实 |
2 | 剧情 | 特别 | 台湾 | 咖啡 | 反转 | ||
3 | 演技 | 漫画 | 小说 | 草莓 | 链接 | ||
4 | 分手 | 异地 | 生活 | 恋爱 | 吵架 | ||
5 | 演技 | 暗恋 | 现实 | 单身 | 漫画 | ||
悬疑探案 | 1617 | 1 | 视频 | 贤哥 | 故事 | 剧情 | 短 |
2 | 视频 | 演技 | 剧情 | 横屏 | 质量 | ||
3 | 娃娃 | 红衣 | 衣架 | 戒指 | 气球 | ||
4 | 更新 | 演员 | 作品 | 镜头 | 质量 | ||
5 | 电影 | 狗血 | 配音 | 主角 | 恐怖 |
表2. 主题与top 5关键词
图5. 特征词–需求映射关系
总问卷有两个部分,第一个部分为网络微短剧用户基本信息调查;第二部分是Kano问卷,为本问卷核心,设问项基于表3的16种特征要素及具体说明,表3是LDA主题分析结果的具体化呈现。Kano问卷的设问形式有正反两个方面,以要素1为例,正向设问为“如果网络微短剧提供泛娱乐化题材的剧集,如甜宠、悬疑类,你感觉如何?”,反向设问为“如果网络微短剧不提供泛娱乐化题材的剧集,如甜宠、悬疑类,你感觉如何”,每一个问题设置不喜欢到喜欢5种情感倾向,基于正反设问及5种情感倾向,针对某一需求要素提问的所有回答的组合如表4所示。问卷主要通过问卷星平台发放,发放周期为5月29号到6月17日,共收回问卷249份,其中有效问卷227份,有效率为91.16%。
分类 | 特征要素 | 要素说明 |
---|---|---|
题材内容 | 泛娱乐化题材 | 甜宠、探险悬疑、情景喜剧等 |
现实主义题材 | 揭示当下社会问题,并进行批判 | |
历史正剧 | 以弘扬社会主义精神价值观为主,呈现党的发展历程 | |
主角选角 | 明星 | 演员为流量明星或者老戏骨 |
民间素人演员 | Up主及其主创团队 | |
服化道 | 服装配饰 | 服装配饰得体精致 |
道具 | 道具丰富逼真 | |
妆效 | 妆效符合人物角色设定、逼真 | |
后期视频处理 | 人物配音 | 演员原声配音 |
人物美颜 | 美颜、磨皮、滤镜 | |
IP来源 | 网络文学 | 剧本源自网络文学 |
漫画 | 剧本源自漫画改编 | |
平台原创自制 | 剧本为平台自制原创 | |
微短剧呈现形式 | 竖屏 | 剧集呈现方式为竖屏剧 |
横屏 | 剧集呈现方式为一般影视横屏模式 | |
沉浸式互动 | 以互动剧的形式展开剧情 |
表3. 网络微短剧主要需求特征分类
正向问题 | 反向问题 | ||||
---|---|---|---|---|---|
喜欢 | 理所当然 | 无所谓 | 可以忍受 | 不喜欢 | |
喜欢 | Q | A | A | A | O |
理所当然 | R | I | I | I | M |
无所谓 | R | I | I | I | M |
可以忍受 | R | I | I | I | M |
不喜欢 | R | R | R | R | Q |
表4. Kano评价表 [
表中M、O、A、I、R、Q分别代表基本质量,期望质量,魅力质量,无差异质量,反向质量以及矛盾、有问题的回答。
文章采用Cronbach’s Alpha系数来检验李克特量表信度,利用SPSS 23.0检验Kano问卷各部分的信度和效度。克隆巴赫α系数在(0.7, 0.9]之间认为是很可信,KMO值大于0.5表示问卷适合做因子分析,以及Bartlett球形度检验中的显著性值小于0.05表示数据之间具有相关性,适合进行因子分析 [
Cronbach’s α | KMO值 | Bartlett球形度检验(sig.) | |
---|---|---|---|
Kano问卷 | 0.871 | 0.813 | 0.000 |
正向问题 | 0.803 | 0.804 | 0.000 |
反向问题 | 0.894 | 0.878 | 0.000 |
表5. 信、效度检验
根据表4评价表,对网络微短剧Kano问卷结果进行汇总,依据“最大频数法”对质量特性进行归类 [
序号 | 要素 | A | O | M | I | R | Q | 合计 | 归属类 |
---|---|---|---|---|---|---|---|---|---|
1 | 泛娱乐化题材 | 12 | 12 | 28 | 120 | 37 | 18 | 227 | I |
2 | 现实主义题材 | 10 | 22 | 46 | 107 | 17 | 25 | 227 | I |
3 | 历史正剧 | 51 | 32 | 7 | 96 | 15 | 26 | 227 | I |
4 | 明星 | 47 | 9 | 9 | 122 | 26 | 14 | 227 | I |
5 | 民间素人演员 | 29 | 3 | 6 | 150 | 27 | 12 | 227 | I |
6 | 服装配饰 | 89 | 48 | 11 | 61 | 7 | 11 | 227 | A |
7 | 道具 | 84 | 52 | 11 | 58 | 11 | 11 | 227 | A |
8 | 妆效 | 74 | 51 | 18 | 66 | 7 | 11 | 227 | A |
9 | 人物配音 | 55 | 18 | 13 | 123 | 8 | 10 | 227 | I |
10 | 人物美颜 | 7 | 3 | 5 | 60 | 143 | 9 | 227 | R |
11 | 网络文学 | 22 | 3 | 3 | 164 | 23 | 12 | 227 | I |
12 | 漫画 | 33 | 4 | 4 | 158 | 19 | 9 | 227 | I |
13 | 平台原创自制 | 44 | 9 | 5 | 152 | 8 | 9 | 227 | I |
14 | 竖屏 | 12 | 6 | 5 | 121 | 70 | 13 | 227 | I |
15 | 横屏 | 35 | 42 | 43 | 89 | 9 | 9 | 227 | I |
16 | 沉浸式互动 | 126 | 11 | 6 | 51 | 23 | 10 | 227 | A |
表6. 网络微短剧特征要素Kano问卷调查结果归类
文章利用better-worse散点图计算用户满意度指数,有利于确定用户需求供给的重点和优先级。用户满意度指数是通过A、M、O、I四个质量类别的频数计算得出,公式为:
Better 系 数 = ( A + O ) / ( A + M + O + I ) (1)
Worse 系 数 = − ( O + M ) / ( A + M + O + I ) (2)
Better系数取值在[0, 1]之间,越是接近1,则该要素具备度越高该需求对用户满意度提升的影响效果越大,Worse系数取值在[−1, 0]之间,表示不提供某功能或不具备某特征要素后,用户满意度会降低,负值越接近−1,用户满意度降低效果越强,满意度下降也越快 [
图6. Better-worse散点图
第二象限 | 第一象限 | ||
---|---|---|---|
序号 | 质量类别 | 序号 | 质量类别 |
1, 2 | 无差异(2) | 6, 7, 8 | 魅力(3) |
3, 15 | 无差异(2) | ||
第三象限 | 第四象限 | ||
序号 | 质量类别 | 序号 | 质量类别 |
4, 5, 11, 12, 13, 14 | 无差异(6) | 9 | 无差异(1) |
10 | 反向(1) | 16 | 魅力(1) |
表7. 满意度指数分类汇总
1) 魅力需求要素应重点关注,优先考虑
魅力质量要素出现在第一和第四象限。第一象限中的Better值与Worse绝对值均在平均水平以上,要素集中在魅力要素上,魅力要素的质量及提供与否显著影响用户满意度;在第四象限Better值高于平均水平,Worse的绝对值低于平均水平,即提升第四象限中的要素质量有利于提升用户满意度但是对降低用户不满影响较小。第一象限和第四象限涉及的魅力要素分别是服装配饰、道具、妆效及沉浸式互动,即魅力要素集中于微短剧呈现的服化道和呈现形式上。这四项魅力要素中,要素16有最大的Better值,要素8有最大的−Worse值:网络微短剧打造平台应积极打造互动型多玩法微短剧,且截至6月25日,在爱优腾三大头部传统长视频平台只有优酷的短剧剧场拥有互动短剧并为其单独分类,短视频头部平台抖音、快手主打竖屏微短剧以及B站互动玩法集中于互动游戏,即积极打造互动型、由用户主导剧情走向的微短剧可以有效提高用户对微短剧的使用满意度,互动型微短剧拥有较大发展空间;此外,平台在未来打造微短剧时要提升演员的化妆效果,使其符合自己的角色身份并与剧本环境适配,可有效降低用户观看的不满意度。比如文章爬取数据来自的三个热门微短剧类型,甜宠、古风和悬疑,在后两者中妆效的重要度更为突出,在非架空朝代中,古风微短剧人物妆效需要和时代相应,尊重最基本的史实及大众对古风妆容美学的需求;悬疑剧中经常有特效妆的需求,特效妆效果如果不到位,会使画面显得廉价违和。因此,打造微短剧的平台、企业需要重点优先关注微短剧的魅力要素,以提升用户的惊喜、满意度。狩野纪昭通过调查证实了质量要素的演变路径是由魅力要素到期望要素再到基本要素 [
2) 追踪挖掘无差异需求
无差异需求对提高或降低用户满意度的效果均较弱,文章中有11项要素为无差异需求,并且遍布四个象限,文章将无差异需求再分为两类,第一类无差异需求即为第三象限中的五个无差异需求,涉及微短剧主角选角和IP来源两部分。由于第三象限的数据特点是Better和Worse绝对值均在平均值以下,文章的调查对象对此关注度也较低,笔者认为平台在主角选角和IP来源上无需投入过多的资金和后续追踪,一方面主角选角上无论是素人还是明星演员,对于一个十分钟以内的视频,演员演技佳、情感表达到位更重要,更能给观众带来感情和表现力上的冲击和记忆点,现阶段,如果大量投资资金在主角上,比如请流量明星,极大可能造成收益远不及成本的结果;另一方面,IP来源上无论是自制还是来源一些现成网络文学的改编,都不及剧本内容为独立创作、无版权纠纷且具有创意重要。无差异需求的第二类除了一、二、四这三个象限中的五个要素,还有第三象限中的14——竖屏剧,前五个要素有共同的特点:在Better和−Worse值中至少有一个值在均值以上,即这五个要素在提升用户满意度或降低用户不满上至少有一方面有显著的效果。产品或者服务的最高目标是创造魅力质量,挖掘用户隐性需求,而质量属性是会随着时间和用户需求的改变而动态变化的,笔者认为当下的无差异需求现实主义等题材、原声配音和以横屏精品剧形式呈现微短剧等将会是未来的魅力要素的源泉,是值得企业追踪和挖掘的用户隐性需求。
3) 摒弃反向需求
根据数据结果,16个要素中有一个反向需求,反向需求在产品需求分析中被认为是多余的功能和服务,提供了会引起用户强烈不满、急剧降低满意度水平,许多用户并没有此需求。将10——人物美颜联系实际分析,近年在传统的长剧集中,平台喜欢在后期制作上给剧集中的人物加美颜滤镜、磨皮等特效,使观众看不清演员的肌肤纹理,演员五官夸张变形,偏离主流审美,长剧集因为时间长一定程度上可以弱化不当美颜功能带来的用户负面情绪,但是微短剧只有短短几分钟,更多的镜头聚焦于主演人物,这种情况下美颜、磨皮、美白等特效的不当使用会极大影响微短剧用户的观感,引起不满、排斥等负面情绪。微短剧内容制作需要匠人精神,“一键美颜”等偷工减料的行为只会产生失败的作品。
文章从不同平台爬取热门网络微短剧在线评论,从中挖掘用户评论主题及关于微短剧的特征词,通过特征与需求的结构映射归纳出16种用户需求要素。基于此,利用Kano调查问卷获得用户对微短剧16种需求特征满意度感知,进行数据处理后,通过需求归类汇总表、四象限散点图对结果进行归纳讨论,确定产品需求供给的重点及优先级。根据讨论结果,可以发现网络微短剧优化方向:第一:网络微短需要不断打磨自己的服化道,力求精致与适宜,摒弃与其他微短剧相近相似的造型布景,寻求差异化发展;第二:充分挖掘潜在用户,多平台发展,加强宣发效果,打造下沉市场,并追踪用户的需求变化趋势;第三:微短剧作为一种成长期的产品,需要加快技术革新的脚步,不断完善微短剧呈现的形式,开发出除竖屏、互动剧之外的其他形式的微短剧,打造能激发用户惊喜的功能,才能满足用户的隐性需求;第四:通过大众口碑引导,增强微短剧用户粘性,增加用户使用的频率和场景,使网络微短剧成为日常生活的一部分。
文章利用多元数据从定量分析的角度研究网络微短剧用户需求,有效克服网络微短剧定性分析中需求来源的可靠性、主观性问题。此外,微短剧作为一种综合体,后续研究可将其从量化的角度与短视频、传统长视频进行需求对比分析,进行改进深化。
李佳欣,田书格. 网络微短剧用户需求挖掘研究——基于LDA主题与Kano模型Research on User Demand Mining of Network Short Drama—Based on LDA Theme and Kano Model[J]. 应用数学进展, 2022, 11(08): 5923-5935. https://doi.org/10.12677/AAM.2022.118624
https://www.cnsa.cn/attach/0/2112271351275360.pdf, 2022-03-15.
https://doi.org/10.1016/j.tourman.2015.12.013
https://doi.org/10.1016/j.aej.2022.04.005
https://doi.org/10.1007/s10845-018-1444-5
https://doi.org/10.20684/quality.14.2_147