1. 引言
人工智能(AI)生成肖像技术为公众提供了便捷的多风格创作途径,其在电子商务中的应用正在催生虚拟试衣、个性化营销等创新场景。现有研究主要聚焦于艺术领域,而对普通消费者尤其是非艺术专业群体的感知尚不明确。值得注意的是,AI生成肖像技术在艺术评论界面临争议,普遍认为算法作品缺乏情感深度[1]。消费者对AI生成图像的认知态度仍需进一步研究,他们更关注技术的易用性和实用性而非艺术价值[2]。但是,现有研究较少关注普通消费者的认知态度,在电子商务领域尤其突出——该领域对技术的关注点更多是实用性而非艺术价值。
为系统探究公众认知,本研究以社交媒体评论数据(如微博、Twitter)作为分析对象。这种数据形式反映了消费者的真实反馈,对电子商务平台的产品开发和营销策略具有重要参考价值[3]。例如,Lian等分析微博平台用户对ChatGPT的讨论发现78.63%的负面评论聚焦于技术可能引发的就业和法律问题[4],为电子商务平台开展AI客服服务提供了风险预警。
随着2023年百度推出文心大模型,中国互联网市场的AI图像生成工具逐步涌现,这些技术创新正在重塑电子商务行业的视觉营销方式。本研究基于年度社交媒体数据,聚焦以下研究问题:
RQ1 中国社交媒体上对AI生成肖像的讨论呈现怎样的演化趋势?
RQ2 中国社交媒体用户对AI生成肖像的核心关注点有哪些?
RQ3 中国社交媒体用户评论的情感倾向分布呈现何种特征?正面评价与负面评价的形成原因对AI生成肖像图片在电子商务中的运用有何启示?
2. 文献综述
2.1. 社交媒体数据与消费者态度分析
社交媒体平台作为数字经济的舆情监测站,其用户生成内容(UGC)为学者洞察消费者技术接受程度提供了重要窗口。在电子商务领域,用户对AI技术的态度直接影响消费决策——正面评价往往预示更高的购买转化率[3],而负面情绪则可能阻碍新技术应用。以微博平台为例,其日均活跃用户超2亿构成了中国电子商务市场的“数字镜像”,Gao等通过分析医疗AI话题发现,公众对技术成熟度的担忧显著影响采纳意愿,这对电子商务平台引入AI客服系统具有警示价值[5]。
2.2. AI内容生成技术的商业认知差异
AI技术已渗透电子商务中全链条:从智能客服到个性化推荐,从虚拟试衣到自动生成商品描述。研究显示,消费者对AI生成文本的接受度较高,因其显著提升信息处理效率[6];但视觉内容领域存在明显认知鸿沟。尽管AI肖像生成技术能降低电子商务内容创作成本,但艺术工作者普遍质疑其情感表达深度[1]。Hong和Curran进行了一项在线调查,以调查AI生成的艺术品是否具有与人类创作的艺术品同等的艺术价值。他们发现,归因于AI的作品获得的评分低于归因于人类作者的作品,而匿名艺术作品的评分没有显着差异[7]。这表明对AI创作的艺术品存在偏见,这一发现在多项研究中得到了回应。艺术家经常争辩说,缺乏人类作者身份的艺术作品无法表达人类情感[8]。
值得注意的是,非专业群体对AI技术的实用性诉求与艺术评价标准存在一定的区别。在电子商务场景下,消费者更关注AI肖像的生成速度、场景适配度等实用维度,而非纯粹的艺术价值[9]。这种特性使得AI肖像技术在虚拟模特展示、个性化广告等电子商务应用中获得快速发展空间,但也面临用户情感认同的挑战。
3. 研究方法
如图1所示,本文概述的研究框架包含四个关键组成部分:趋势分析、语义分析、情感分析和主题聚类。这些组成部分旨在全面调查公众对人工智能生成的肖像图像的态度。
Figure 1. Research framework diagram
图1. 研究框架图
3.1. 数据收集
3.1.1. 社交媒体平台选择
微博作为大型社交平台,拥有庞大用户和丰富内容(如帖子、图片、视频)。
3.1.2. 文本数据获取
研究使用Python网络爬虫从2023年1月1日至2023年12月31日,通过关键词“AI生成”和“AI绘画”在微博上抓取包含图像的帖子。排除无评论帖后下载嵌入图片,并利用YOLOv5s模型进行分类与提取。YOLO是先进的实时目标检测系统[10];Mantau等采用基于YOLOv5的算法,人体目标检测精度达79.8% [11]。最终抓取评论数据,共获得6848篇帖子和71,010条评论。
3.1.3. 文本数据过滤
使用Jieba分词工具将评论文本分割为单词或短语,并去除停用词(如连词、介词),同时剔除表情符号、超链接等非文本内容。
3.2. 文本挖掘
3.2.1. TF-IDF算法
TF-IDF算法,即词频–逆文档频率算法,是信息检索和文本挖掘中广泛使用的算法。它根据词在文档中的出现频率(TF)和在整个语料库中的稀有程度(IDF)为词分配权重。TF-IDF分数反映了词在特定文档中的重要性,同时考虑了它在整个数据集中的整体重要性。具体计算公式如下所示:
(1)
其中,
、T、
和
。分别表示帖子i中的特征词j的权重、词频和逆向文档频率。此外,N表示帖子总数,
。是包含特征词j的帖子数。
3.2.2. 语义网络分析
构建加权无向语义网络,节点为词,边表示共现关系;使用Gephi分析,通过加权度、中介中心性和特征向量中心性找出关键节点[12] [13]。此外进行模块化分析以发现公众关注领域。
3.2.3. 情感分析
百度AI平台是一个人工智能服务平台。其通过构建大规模的中文语料库并利用深度学习算法进行模型训练,百度AI能够有效捕捉中文文本中的情感特征。Hou等通过百度AI平台的情感分析和文本挖掘,了解了公众对COVID-19的情感[14]。本研究使用Python调用百度AI API,返回结果包括负向、中立和正向的情感倾向。
3.2.4. BTM主题模型
Biterm主题模型(BTM, Biterm Topic Model),是一种专注于文本中的双词(词对)的主题模型,与传统的LDA模型不同,它不需要考虑词序[15]。它将文本视为以主题为中心的词对集合,能够有效捕捉简短文本中的潜在主题。
4. 研究结果
4.1. 评论趋势结果
为解答研究问题1 (RQ1):“关于AI生成的肖像图片在中国社交媒体上的讨论趋势是如何演变的?”图2展示了2023年关于AI生成的肖像图片的讨论趋势(图2中,评论数量的回归拟合线以虚线形式呈现)。该趋势呈现出波动状态,但整体有着上升的趋势。此外,本研究还搜集了2023年微博上与AI相关的热搜话题,并发现这些热搜话题与讨论趋势之间存在一定关联。从评论数量和热搜话题数量的曲线来看,2023年关于AI生成的肖像图片的讨论同样呈现出波动状态,这种波动可能与某些特定AI事件的发生有关。
Figure 2. Trend chart of comment quantity and ai-related hot search queries in 2023
图2. 2023年评论数量和AI相关热搜数量趋势图
4.2. 公众对AI生成肖像图片的讨论:文本挖掘结果
为解答研究问题2 (RQ2):“中国社交媒体用户对AI生成肖像的核心关注点有哪些?”本研究采用TF-IDF算法筛选出前1000个高频词,并利用Python构建语义网络,随后使用Gephi软件进行深入分析。在此语义网络中,词汇被视作节点,它们之间的共现关系则以边的形式展现。该语义网络为无向加权网络。本研究运用加权度、介数中心性和特征向量中心性来识别网络中的关键词。加权度指的是一个节点在网络中与其他节点直接连接的数量;介数中心性则衡量了一个节点作为其他节点间最短路径上的桥梁或中介的频率;特征向量中心性则是一个衡量节点重要性的全局指标,它同时考虑了节点的直接连接及其邻居节点的影响力。因此,加权度、介数中心性和特征向量中心性为评估网络中节点重要性提供了不同视角。关于加权度、介数中心性和特征向量中心性的计算结果详见表1。语义网络如图3所示。从语义网络中可以明显看出,如“真实”、“喜欢”、“好看”等节点,表明公众对AI生成的肖像图片持正面态度。而“发展”、“科技”、“手机”、“ChatGPT”、“期待”等节点则显示出公众对技术发展的密切关注。然而,“细节”、“手”、“眼睛”、“手指”等节点则似乎反映出公众认为AI在处理图像细节方面存在不足。
随后,本研究利用Gephi软件进行了模块化分析,该方法以Louvain算法为核心。Louvain是一种无监督方法,通过优化模块化指标来划分网络中的节点。分析结果显示,语义网络中存在四个明显的模块。构建的评论数据语义网络及不同模块以不同颜色标记,如图3所示,不同模块的关键节点详见表2。
根据模块化分析结果,网络中存在四个模块。模块1包括“真实”、“好看”、“照片”等节点,它们反映了公众对AI生成肖像图片的欣赏态度以及对这些图片中肖像美观度和可爱度的看法。模块2包含“不错”、“希望”、“加油”等节点,表明公众关注AI生成图片技术的未来发展,并期待AI能创造
Table 1. Top-10 keywords of the semantic network
表1. 语义网络前10个关键词
关键词 |
加权度 |
特征向量中心度 |
介数中心性 |
真实 |
6351 |
1 |
48817865.05 |
喜欢 |
2412 |
0.45319 |
13352072.79 |
好看 |
2256 |
0.42448 |
12435601.56 |
技术 |
1409 |
0.29295 |
5787949.92 |
脸 |
1243 |
0.25546 |
5460859.14 |
照片 |
1130 |
0.24932 |
4521701.85 |
爱 |
1149 |
0.24321 |
5613246.29 |
不错 |
1020 |
0.24282 |
3705246.8 |
希望 |
1156 |
0.24097 |
4982759.59 |
好像 |
1127 |
0.23066 |
6128468.48 |
Figure 3. Modular analysis diagram of semantic network
图3. 语义网络模块化分析图
Table 2. Top-10 keywords of different modularity in the semantic network
表2. 语义网络中不同模块性的前10个关键词
模块1 |
模块2 |
模块3 |
模块4 |
真实 |
爱 |
技术 |
脸 |
喜欢 |
不错 |
期待 |
好像 |
好看 |
希望 |
人类 |
东西 |
照片 |
世界 |
模型 |
风格 |
美 |
关注 |
科技 |
眼睛 |
特别 |
行 |
发展 |
样子 |
可爱 |
加油 |
未来 |
看着 |
想要 |
心动 |
厉害 |
手 |
漂亮 |
博主 |
生活 |
画风 |
适合 |
网页 |
写 |
帅 |
出更高质量的图片。模块3与模块2类似,包括“科技”、“期待”、“人类”、“未来”、“生活”等词汇,这些词汇反映了公众对AI技术提升生活质量及简化工作的期待。模块4则包含“脸”、“眼睛”、“手”等节点,它们与肖像的细节相关。进一步深入分析发现,模块中存在一些负面词汇,如“不好”、“假”、“奇怪”,这表明虽然AI生成的肖像图片整体上令人满意,但在细节方面仍存在瑕疵。综上所述,公众主要关注图片质量(模块1和4)以及AI技术的未来发展(模块2和3)。
4.3. 情感分析与主题聚类
为回答研究问题3 (RQ3)“中国社交媒体用户评论的情感倾向分布呈现何种特征?正面评价与负面评价的形成原因对AI生成肖像图片在电子商务中的运用有何启示?”本研究按月份统计了正面情感评论和负面情感评论的占比。总体来看,中国公众对AI生成的肖像图片持正面态度,正面评论占比76.84%,负面评论占比19.02%。有趣的是,先前研究显示关于“ChatGPT”的中国社交媒体数据中,78.63%为负面评论,21.37%为正面评论[4]。这一结果与本研究存在显著差异。本研究结果与之存在显著差异。本研究认为,主要原因在于早期关于ChatGPT的评论反映了公众对中美之间AI技术的担忧,且由于法律限制,ChatGPT在中国难以使用,因此负面情绪较多;而在本研究中,评论集中关注AI生成肖像图片,仅有一小部分讨论相关技术。
本研究采用BTM主题模型对正面和负面评论建模,基于熵值最小化原则确定主题数量,最终获得正面评论的5个主题簇和负面评论的4个主题簇。正面评论主题建模结果如表3所示:主题1反映公众对肖像画质量的满意,主题2体现对AI技术未来发展的期待,主题3强调AI技术提升生活和工作效率的潜力,主题4指出AI生成肖像画风格多样,主题5表明免费AI工具也能提供高质量图像。这些正面评论反映了公众对AI生成肖像画的总体满意和对技术发展的乐观态度。
Table 3. Topic clustering results of positive comments
表3. 正面评论的主题建模结果
正面评论的主题建模结果 |
主题一:AI生成的肖像图看起来很好 |
关键词 |
真实 |
好看 |
厉害 |
震惊 |
照片 |
代表观点 |
1、它真好看。这是真的吗?2、我很震惊。你确定这是AI画的吗,不是照片? |
主题二:期待AI技术的后续发展 |
关键词 |
技术 |
科技 |
发展 |
芯片 |
生活 |
代表观点 |
1、随着高科技的到来,其发展的领域广阔且需求依然相当高。2、现在是高科技时代,人工智能也已经到来。让本研究共同期待智能时代的到来吧。 |
主题三:AI技术能够帮助人们更好地生活和工作 |
关键词 |
指令 |
历史 |
记录 |
美好 |
技术 |
代表观点 |
1、这种效果可以辅助生成电影海报。2、已经可以创建简单的动画了。3、人工智能正在改变我们的生活方式。 |
主题四:AI生成地图像风格令人印象深刻 |
关键词 |
关注 |
博主 |
热门 |
赛博 |
效果 |
代表观点 |
1、一种赛博朋克的感觉。2、一种沉浸在网络世界中的感觉3、AI的作品可能是完美的,因为它能够掌握并利用所有知名艺术家的技巧和风格。 |
主题五:免费的模型也能生成优秀的图片 |
关键词 |
模型 |
美好 |
支持 |
生命 |
免费 |
代表观点 |
1、开源免费软件。2、这其实是一个免费程序。3、这张脸明显混合了chilloutmix模型 |
负面评论主题建模结果如表4所示:主题1关注肖像画细节不足(如手和眼睛),主题2涉及对美国AI技术主导的担忧,主题3讨论法律问题(如版权和认证),主题4强调对AI取代艺术行业从业者的担忧。这些评论反映了公众对AI技术细节改进的需求、对AI法律风险的担忧以及对行业就业的影响。
Table 4. Topic clustering results of negative comments
表4. 负面评论的主题建模结果
负面评论的主题建模结果 |
主题1:人工智能生成的肖像图像缺乏足够的细节 |
关键词 |
软件 |
手指 |
不好 |
眼睛 |
衣服 |
代表观点 |
1、最后一张图片里的手不奇怪吗?感觉好诡异。2、只要你忽略那只手和奇怪的部分,其他大部分还是能看的。3、背景细节不够丰富,就像是几块色块堆在后面。 |
主题2:担忧美国在人工智能技术方面相较于中国的领先地位 |
关键词 |
技术 |
美国 |
资本 |
国内 |
全球 |
代表观点 |
1、我们能否自己创造出一些原创的东西呢?每次美国和欧洲发布新的AI产品,我们就只是跟着做。2、如果我们不能掌握AI技术,未来我们就不会有任何竞争力。3、这可能是因为缺乏足够的中文数据库,所以我们不得不寻求使用国外的数据库来进行训练。 |
主题3:人工智能生成的图像涉及版权等法律问题,且难以认证。 |
关键词 |
信息 |
数据 |
训练 |
版权 |
人类 |
代表观点 |
1、版权问题尚未得到解决。2、人工智能是一大趋势,但至少应该允许人们质疑一项侵犯人类艺术家权利的技术。3、人工智能侵犯了许多人的作品,不尊重创作者的版权和劳动成果。 |
主题4:人工智能生成的图像可能会对众多与美术相关的行业产生潜在影响。 |
关键词 |
指令 |
画师 |
工具 |
成本 |
行业 |
代表观点 |
1、作为一名艺术相关行业从业者,我已经麻木了。2、时尚模特可能即将失业,插画师也将面临失业。 |
通过主题建模分析,本研究得出结论:公众对AI生成肖像画的态度呈现两极分化,正面评论源于对技术和未来发展的认可,而负面评论集中在细节不足、技术优势担忧及人力资源问题。这些结果为理解用户态度和企业市场推广提供了参考,具体启示包括:提升图像质量增强用户信任、加强法律伦理合规性、关注细节处理需求、平衡技术宣传的专业性与亲和力。
未来研究可进一步探索AI生成肖像画在电子商务中的应用路径,如优化算法、完善法律支持体系、开发用户友好型工具等,以实现其在中国电子商务领域的可持续发展。本研究不仅揭示了公众情感倾向,还为企业技术开发和市场推广提供了重要参考。
5. 讨论与启示
以ChatGPT为代表的人工智能技术革新正深刻重塑产业格局,其中基于大语言模型的图像生成技术在电子商务领域的应用前景尤为值得关注。本研究通过对公众态度的深入分析,发现中国公众对AI生成肖像技术的关注焦点主要集中于以下三个维度:(1) 生成图像质量;(2) 潜在法律风险;(3) 对相关行业就业市场的影响。表5系统呈现了公众对这三个维度的正负面评价。下文将结合电子商务应用场景进行深入探讨。
Table 5. Public focus and opinions
表5. 公众关注焦点及观点
关注焦点 |
正面观点 |
负面观点 |
1) AI生成肖像图像的质量。 |
精致,如同照片一般。 |
手指、眼睛等细节看起来很奇怪。 |
2) AI生成图像可能涉及的法律问题。 |
AI生成的肖像图像展现了 不同艺术家的多样风格。 |
AI生成的肖像图像侵犯了艺术家的版权。 |
3) AI图像生成技术对相关行业 就业市场的影响。 |
AI图像技术为人们创作多样化 的图像提供了便利。 |
AI图像技术可能导致大量艺术相关行业工作者失业。 |
5.1. 生成图像质量优化与电子商务应用价值
消费者对AI生成肖像的“真实感”与“精致度”表现出双重态度。在电子商务场景中,高品质肖像对商品展示、虚拟客服形象塑造具有重要价值。研究显示,AI生成的面部特征已能满足基础视觉需求,公众评价集中于“美观”与“逼真”。但在细节呈现方面,特别是手部结构和眼部细节仍存在明显缺陷,这与Mori等人提出的“恐怖谷”效应高度契合——当类人形象接近真实却存在细微偏差时,反而引发用户不适[16]。
为提升电子商务场景应用价值,建议采取双重优化策略:技术层面可通过改进模型架构提升细节生成能力;应用层面可引导用户添加“超写实”“专业摄影”等提示词。值得注意的是,不同AI模型在服装纹理、配饰细节等电子商务关键要素上存在显著差异,建议企业根据具体需求选择适配模型[17]。
5.2. 法律风险防范与电子商务合规管理
AI生成内容的知识产权问题已成为制约电子商务应用的主要瓶颈[18]。AI内容源于训练数据,通常来自众多艺术家,使版权归属和侵权问题复杂化。Kalpokiene和Kalpokas指出AI生成图像作品的著作权归属困境在电子商务领域尤为突出——平台商家使用AI生成的模特形象、产品展示图可能涉及多重版权风险[19]。
建议电子商务平台构建三维度防护体系:技术端采用小样本学习降低数据依赖,部署数字水印系统;制度端建立AI内容溯源机制,要求商家披露训练数据来源;生态端与设计机构建立授权联盟。
5.3. 就业市场变革与电子商务人才转型
AI技术对就业市场的影响呈现出明显的行业异质性特征。短期内可能导致结构性失业问题的加剧,但长期来看将推动高附加值岗位的持续增长。这种结构性调整印证了Mirzaei和Soleimani提出的“技术革新–就业重构”二次曲线理论[20]。值得关注的是,Vasiliu和Yavetz的研究显示不同人群对人工智能技术的复杂反应表明,年长员工对人工智能引起的失业表示较少的焦虑,而受教育程度较高的员工更容易接受人工智能的采用[21]。
电子商务企业应采取人才升级策略:一方面通过“AI + 设计”培训项目提升在岗人员技能,另一方面建立人机协作机制,将基础设计工作交给AI,使人类设计师聚焦创意策划等高价值环节。Shen和Zhang强调了人工智能对就业的正面影响,特别是它对女性和劳动密集型部门的好处,从而解决了性别和工业差异[22]。
综上所述,本研究对电子商务实践具有重要启示:在技术应用层面,需要建立质量评估体系;在合规管理层面,应当完善知识产权保护机制;在人力资源层面,亟需构建适应AI时代的人才培养体系。这些发现为电子商务平台智能化转型提供了理论依据和实践路径。
6. 结论
本研究旨在通过分析微博平台上的评论数据,探讨中国公众对人工智能生成肖像图片的态度并对AI技术在电子商务中的运用给予建议。
本研究存在以下局限。首先,本研究仅依赖微博数据,可能引入一定的偏差。未来研究可考虑纳入来自不同平台的数据,以获取更广泛的用户态度和情感信息,从而提升研究的全面性和准确性。其次,本研究仅探讨了公众对人工智能生成肖像图片的评论和态度,未与真实肖像照片进行对比分析。未来研究可加入此类对比,以更深入地探究公众的情感倾向。最后,本研究在因果分析方面存在不足。未来研究可设计实验,操控相关变量,探究其对公众态度和情感趋势的具体影响,从而深化对这一现象的理解。