ChatGPT in the Public View—Analysis of Image Perception Results Based on TikTok Comment Data
In this paper, ROST CM6 software is used to conduct word frequency analysis, semantic network analysis and emotion analysis on the comment text of TikTok platform. It is found that the birth of ChatGPT makes people pay more attention to the connection between ChatGPT and themselves, and they hold a positive attitude toward ChatGPT to help solve problems in work or study. But they are worried about the risks and challenges. As artificial intelligence such as ChatGPT permeates people’s lives, they should improve their ability to deal with the risks, enjoy the benefits, and treat and use ChatGPT in a reasonable way.
ChatGPT
随着ChatGPT技术应用日益成熟,对于这项技术,人们褒贬不一,进而引发了激烈的讨论。目前,关于公众对人工智能的态度的研究大多通过案例研究或问卷调查的方式进行,刁生富和冯桂锋的研究指出,媒体的宣传和报道可以帮助公众更好地理解和接受人工智能,从而影响他们的思维模式和价值观念
“抖音”是一款具有垂直精准定位的“去工具化、去中心化”的音乐创意移动短视频社交平台软件,它专注年轻人音乐短视频社区平台,用户可以通过这款软件选择歌曲,拍摄音乐短视频,形成自己的作品
以ChatGPT为关键词在抖音平台进行检索,共搜索到了上千条视频。为确保数据的真实性和准确性,本文在检索到相关视频后对视频的播放量进行了排序,选取了播放量最多的40条视频。为保证评论的认可度,本文选取了每条视频点赞最多的4条评论,最终收集到200条评论。
文本分析法即用来描述和解释媒介讯息,侧重于描述文本的内容、结构和功能,解释深层的潜在意义。本文采用文本分析法对分析的主体,也就是大众的评论进行分析,利用ROST CM6软件对ChatGPT视频的评论数据进行统计分析处理。该软件可以实现聊天分析、流量分析、聚类分析、微博分析、网站分析、浏览分析、全网分析、分词、词频统计等一系列文本分析。本文研究的是视频下方的评论,运用该软件进行研究可以更加鲜明、明确的体现出评论所反应的信息含义,以此能够获取到大众完整的心里感知
本文运用ROST CM6软件对ChatGPT视频的评论数据进行词频处理,在数据预处理后分别进行了数据清洗工作和文本分词,得到分词结果后再对这些分词进行词频统计,提取出了高频词语及词频数,最终统计出前30的高频词,如
高频词 | 词频 | 高频词 | 词频 | 高频词 | 词频 |
人类 | 16 | 科技 | 5 | 答案 | 4 |
人工智能 | 11 | 恐怖 | 5 | 军事 | 4 |
问题 | 10 | 发展 | 5 | 代码 | 4 |
论文 | 8 | 大量 | 5 | 模型 | 4 |
取代 | 7 | 代替 | 5 | 医学 | 4 |
替代 | 6 | 软件 | 5 | 不出 | 4 |
时代 | 6 | 电脑 | 5 | 应用 | 4 |
学习 | 6 | 语音 | 5 | 对话 | 4 |
医生 | 5 | 训练 | 4 | 告诉 | 4 |
可怕 | 5 | 程序 | 4 | 产生 | 4 |
通过对高频词的分析,“人类”这个词汇的出现次数最多。可见,在ChatGPT出现后,人们更多关注的是其对人所带来的影响,对人而言有何作用,使用ChatGPT这个工具的主体是人,因此与人的联系最密切,所以出现频次最高的词汇是“人类”。“人工智能”“问题”“医生”“军事”等词出现频次较高,可以看出在与人的联系中,人们更为关注的是这项新技术在哪些方面能够为人类提供帮助,作为一项新技术,它能够帮助人类解决哪些人类无法解决的问题,为我们的生活带来了哪些便捷。“语音”“训练”“模型”可以看出ChatGPT的独特之处,是它的语言理解和文本生成能力较强,它训练模型就是通过连接大量的语料库来进行的,因此它具备熟练的互动聊天能力
整理好评论的文本后,笔者将文本导入到ROST CM6软件中,在功能分析中选择语义网络分析,在经过快速分析后,最终得到了网络评论语义网络图,见
语义网络用于表示知识和建立认知模型的一种带标号的有向图,是一种知识表达模式,其中存在相互连接的节点和边,节点表示对象、概念,边表示节点之间的关系。语义网络分析后形成直观的语义网络图,能反应出词语间的关系。
从网络图可知,“人类”“对话”“绝对”“时间”在语义网络中与其它特征词的联系最紧密、共现的频次最高,可推断其为整个语义网络中最核心的四个特征词。这体现了ChatGPT对于人的价值,它的运作方式,它所带来的影响以及在时间的不断流逝之下它出现的问题都是作为主体的人类所深思的,“对话”一词可以看出ChatGPT作为对话聊天工具,是具有一定的使用价值的,随着其语料库的不断发展,他也会变得更加强大,表达了大众对其的基础形象感知。但是由于这四个词所覆盖范围广,囊括了多方面,可见人们对其见解还是在表层,并未抓住一个细节进行深入的研究。除以上四个词外,仍出现了其他重要节点,例如“人工智能”“直播”“发展”“大战”“职业”等核心特征词,这些词汇能够体现出如今大众所关注和重视的核心评论因素,他们的存在能够为各高频词建立联系,使得整个语义网络能够实现互联互通,各词汇之间不再有较大的阻隔。这些核心特征词表现了在ChatGPT发展过程中,尽管部分职业可能会受到冲击,我们的工作会被替代,但是它在一定程度上也能够带动相关职业的发展,所以不能说人工智能只有弊而无利。在网络图中,有一些词处于边缘地位,如“问题”“答案”“知识”“智慧”可以体现出在使用ChatGPT的过程中,需要不断吸收知识,用我们的智慧去解决问题,寻找答案。
使用ROST CM6软件情感分析工具进行情感分析,得到了情感分析结果(
情感类型 | 评论数 | 占比% | 强度 | 评论数 | 占比% |
积极情绪 | 72条 | 35.82 | 一般(0~10) | 44(条) | 21.89 |
中度(10~20) | 21(条) | 10.45 | |||
高度(20以上) | 7(条) | 3.48 | |||
中性情绪 | 86条 | 42.79 | —— | ||
消极情绪 | 43条 | 21.39 | 一般(−10~0) | 31(条) | 15.42 |
中度(−20~−10) | 8(条) | 3.98 | |||
高度(−20以下) | 0(条) | 0.00 |
笔者利用ROST CM6软件对抖音上关于ChatGPT的讨论进行文本挖掘,通过对词频的处理得到了“人类”“人工智能”“问题”等30个高频词,文章通过网络语义分析得到了大众对于ChatGPT的整体认知情况。基于文本通过情感分析得到了大众对于ChatGPT普遍持中立态度但也有不少人持积极情绪,持消极情绪的占比最小。通过以上的分析可知,从大众的视角出发,ChatGPT的出现,能够为我们带来什么是人类最为关注的,无论是学习、工作还是生活,它如何影响这些内容是我们探究的。当然,其中我们也能看出人类是理性的,我们在享受ChatGPT所带来的好处的同时,我们也深知ChatGPT也会带来失业、失控的风险。
模型越强大,实际上泄露出来的数据越多。尽管ChatGPT便利了我们的生活,但背后所隐藏的隐私泄露风险也不能忽视
互联网快速发展,媒介素养逐渐成为提升个人基本素质的关键一步,其通常被认为是使用和解读媒介信息所需要的知识、技巧和能力,它在一定程度上也反映出整个社会的文明程度
随着电子设备的不断普及,以ChatGPT为引领的生成式人工智能有着强烈的扩张性