1. 引言
ChatGPT是AIGC领域的一个典型产品,主要应用于人工智能文字交互模型。它在文本生成方面展现出卓越的能力,相较于之前的人工智能产品,在代码理解和内容生成方面取得了显著的进步,这引起了全球范围内的关注和讨论。然而,目前对于ChatGPT的研究主要关注其本身的概念内涵[1],以及从发展演进[2]、应用场景[3]、政策治理[4]等宏观视角展开讨论,缺乏从微博用户的微观视角来研究对于ChatGPT的看法。在信息爆炸、大众注意力稀缺的当下,微博作为目前中国互联网最高效的信息传播平台,往往是引爆新闻传播的首要社交媒体阵地。因此,从微博用户为切入口,站在大众的视角上,来研究ChatGPT等人工智能技术对社会生活的影响,是极为重要的。本文通过分析微博网页版上关于ChatGPT的博文评论,从微博用户的视角出发,探讨了以ChatGPT为代表的人工智能技术被应用于日常生活中可能存在的潜在风险。
2. 数据来源与研究方法
2.1. 来源地概括
微博是一种中国主流的社交媒体平台,类似于Twitter。微博平台上的内容种类丰富多样,涵盖了新闻、娱乐、体育、时尚、科技等各个领域。微博一直以来都是一个内容形式多元化、包容力很强的平台,形式上聚合了图文和视频,也兼顾短资讯和深度长文;内容上主题广泛,讨论延展度高,因此能渗透各种各样的用户。许多公众人物、名人和机构也在微博上开设了官方账号,与粉丝分享动态和与他们互动。微博在中国社交媒体领域具有广泛的影响力,成为了许多人获取信息、表达观点和社交的重要平台。它也成为了政府、企业和个人进行宣传、推广和舆论引导的工具。在AIGC时代,ChatGPT等人工智能技术一直是人们关注的焦点。一旦相关话题被提及,通常会引发众多微博博主的关注,并在其网络意见领袖的作用下,吸引大批用户参与到该话题的讨论之中。
2.2. 数据来源
在微博网页版对ChatGPT相关的内容进行了一站式搜索,共找到了上百条与其相关的内容。为了确保这些博文能够得到网友的认可,本文在检索到相关博文后,利用微博的高级搜索功能,筛选出了最热门的40篇博文。同时,为保证每条博文之下评论的说服力,本文总共收集了200条评论,这些评论均是选自40篇博文中底下点赞量最高的5条评论。同时本研究借鉴并采用文献计量研究使用的常规方法,对“人工智能”领域有关方面的研究做文本计量和可视化分析。其中,文献的来源为中国知网。采用迭代思想进行检索关键词的确定:① 使用“人工智能”作为关键词,在CNKI跨库选择中选取“期刊”“特色期刊”“博士”“硕士”“国内会议”“国际会议”以及“学术辑刊”,按主题进行搜索,得到200篇中文文献;② 使用Citespace 软件进行关键词词频统计得出使用频次 ≥ 3的关键词词表;③ 根据“人工智能”研究领域部分高被引文献和综述类文献中出现的有关词汇,进行适当增补;④ 进行人工筛选,再结合查准率合并筛选出关键词20项。
2.3. 研究方法
文本分析是一种研究方法,它涉及到对文本数据的收集、处理和分析,以提取有用的信息和洞察力。通过文本分析,可以从大量文本中提取关键信息和主题,也能够识别文本中的情感倾向或观点态度。本文中采用了文本分析方法对作为研究对象的微博用户的评论进行研究。本文利用ROST CM6软件对微博网页版中与ChatGPT相关博文的评论数据进行统计分析处理。同时通过利用Citespace的可视化功能,对200篇中文文献进行统计,再进行适当筛选和清洗,展现当前研究中的热点词汇。
3. 研究热点与发展脉络
3.1. 关键词共现分析
Figure1.Keyword co-occurrence visualization map
图1.关键词共现可视化图谱
利用Citespace软件对样本文献的关键词共现分析,生成关键词共现可视化图谱(见图1)。在这个图谱中,N代表关键词,E代表连线,Density代表关键词密度,即包含了122个关键词、245条连线,以及为0.0332的关键词密度。主要的关键词包括人工智能、生成式人工智能、人工智能生成内容、文本生成、深度学习等。通过关键词共现分析可以帮助研究者更好的理解文献中各个关键词之间的联系和关系,以便在这之后的更深层次的研究。
3.2. 关键词聚类分析
利用Citespace软件对样本文献的关键词聚类分析,生成关键词聚类可视化图谱(见图2)。在这个图谱中,Q值是一个衡量网络模块化的指标,通常取值范围在[0, 1)之间。当Q值大于0.3时,表示划分出来的社团结构是显著的。Q值越高,说明聚类结果越清晰、有意义。而S值是平均轮廓值,用来衡量聚类的同质性和效率。当S值大于0.5时,认为聚类是合理的;而当S值大于0.7时,则表示聚类是高效率且令人信服的。S值越高,说明聚类的同质性越高,每个聚类内的文献或关键词越相似。根据图2数据可见,Q值为0.5239,大于0.3,表明聚类结构显著;而S值为0.836,超过了0.7,说明聚类结果高效且具有较高的说服力。通过关键词聚类分析,可以看出文献被划分为8个聚类单元,分别是#0人工智能、#1生成式人工智能、#2人工智能生成内容、#3文本生成、#4深度学习、#5出版业、#6媒体融合、#7大模型。
Figure 2.Keyword clustering visualization map
图2.关键词聚类可视化图谱
3.3. 关键词时间线分析
利用Citespace软件对样本文献的关键词时间线分析,生成关键词时间线可视化图谱(见图3),时间线图展示了近年来研究重点的演变趋势。从图中可以看出,在2022年之前人们对于人工智能的认识仅仅停留于其数据、内容开发之上。而在2022年呈现爆发式的增长是因为OpenAI公司研发的一款聊天机器人程序——ChatGPT的现世,引发了全世界的广泛关注。在这之后,可以看出人们开始将人工智能应用到各个行业,如出版业、新闻业、传媒业等,并关注其带来的机遇以及潜在风险。
Figure3.Key timeline visualization chart
图3.关键时间线可视化图谱
4. 形象感知结果分析
4.1. 词频分析
将收集到的微博用户评论,通过ROST CM6软件进行分词处理,并对分词结果进行词频统计。在剔除与主题无关的词频后,统计出排名前40的高词频词汇,如表1所示。
Table 1.ChatGPT high-frequency vocabulary list for online comments
表1.ChatGPT网络评论高频词汇表
高频词 |
词频 |
高频词 |
词频 |
高频词 |
词频 |
高频词 |
词频 |
人类 |
18 |
发展 |
5 |
逻辑 |
4 |
电子 |
3 |
人工智能 |
15 |
效率 |
5 |
解放 |
4 |
价值 |
3 |
技术 |
9 |
一年 |
5 |
进步 |
4 |
工业革命 |
3 |
模型 |
8 |
分析 |
4 |
真正 |
3 |
每个 |
3 |
数据 |
8 |
企业 |
4 |
差距 |
3 |
属于 |
3 |
中国 |
7 |
时代 |
4 |
危险 |
3 |
领域 |
3 |
代码 |
7 |
总结 |
4 |
复杂 |
3 |
微软 |
3 |
意识 |
7 |
应用 |
4 |
人工 |
3 |
研究 |
3 |
问题 |
7 |
文献 |
4 |
理性 |
3 |
工具 |
3 |
科技 |
6 |
生成 |
4 |
理解 |
3 |
改变 |
3 |
通过分析这些高频词汇,发现“人类”一词出现频率最高。这表明,在ChatGPT出现后,微博用户最关注的就是ChatGPT对于使用主体—人类的影响,并习惯性的容易将自身与其联系起来,以此来衡量他们二者之间的界限。“人工智能”“技术”“模型”“数据”出现的频次较高,表明微博用户对新技术的关注度较高,在ChatGPT问世后想要去了解ChatGPT的数据模型以及其内在运算逻辑。“文献”“企业”“应用”“总结”体现了当下微博用户逐渐的开始把ChatGPT投入到日常学习中,同时也能帮助许多企业、公司的员工编写年度、工作、项目等总结。据艾瑞发布《AIGC系列报告——中国AIGC产业全景报告》显示,在国外AIGC应用展示出大模型的能量的同时,我国企业也加强了相关产品技术布局,云厂商、AI大厂、创企、各行业公司及技术服务商等产业各领域玩家纷纷发布大模型或基于大模型的应用产品及各类技术服务。“发展”“效率”“进步”“价值”体现了微博用户对ChatGPT的认可度,看到了其积极的一面,肯定其对人类社会带来的价值和正向影响。但与此同时,“问题”“危险”“意识”则微博用户表达了对ChatGPT未来发展的担忧,认为随着ChatGPT等人工智能技术的不断升级,未来其可能会进化成跟电影《复仇者联盟2:奥创纪元》中的人工智能生命奥创一样展出自我意识,想要脱离人类的控制主宰世界,导致全人类的灭绝。
4.2. 语义网络分析
首先利用ROST CM6软件的网络语义分析功能,将微博用户评论的文本数据转化成网络评论的语义网络图(见图4)。随后,对这个语义网络图进行了深入的语义网络分析。通常情况下,如果两个节点之间有直接的连接线,则表明这两个词组或概念之间存在相关性;连接线的数量越多,表示它们之间的联系越紧密。通过这种分析方法,我们可以更加直观地观察到词组之间的关联性。
Figure4.ChatGPT network comment semantic network diagram
图4.ChatGPT网络评论语义网络图
从整体上看,这个语义网络图可以被划分为四个层次:“核心节点–次核心节点–过渡节点–边缘节点”[5]。其中,“技术”、“风险”、“问题”、“意识”、“模型”、“中国”和“人类”位于核心位置,与其他词组的关联性最强。这表明,关于ChatGPT的使用是否可能出现独立意识以及可能遇到的风险等方面的讨论,都不可避免地涉及到大众、中国社会乃至全人类的影响。而“科技”、“时间”、“检索”、“方法”、“研究”和“处理”则处于次核心位置。随着ChatGPT的推出,人们开始深入思考其核心能力,并尝试将其应用于解决具体问题和开展相关研究,这体现了大众对ChatGPT基础应用的认识。通过“微软”、“应用”、“发展”、“全面”和“工具”的关键词,微博用户分享了他们对ChatGPT未来发展方向的观点。显然,作为一种应用工具,ChatGPT在未来有潜力替代某些职业。让部分人面临着失业的担忧,但是其确实大大提高了生产效率,同时也带动了相应职业的发展。例如2022年8月在美国科罗纳多艺术博览展会上一举夺冠的《太空歌剧院》作品就是由AI绘画生成,这让很多人认识到了AI绘画的巨大潜力,但是AI绘画也面临着版权争议和能否称之为“艺术”的伦理争议,这是人们不可忽视的对ChatGPT等人工智能的冷思考。正如本雅明在《机械复制时代的艺术作品》中的描述,照相技术让大量的文本复制变得轻而易举,从而把艺术从一向被人们所崇敬的神圣祭坛上拖了下来。人类艺术家更应该在这种冲击下走出舒适圈,去创造拥有独特的“人”的魅力的艺术作品。在微博平台上,用户对ChatGPT的评价多聚焦于其边缘性特征,如“伟大”、“最好”、“逻辑”、“人员”、“赶上”、“智能”和“开发”。这些词汇反映了用户对ChatGPT作为对话工具的实用性和技术潜力的基本认知。随着技术的进步,ChatGPT预计将进一步增强其功能,这表明了用户对其未来发展的乐观预期。
4.3. 情感分析
本文利用ROST CM6软件对微博用户评论进行了情感分析,并得出了相关的情感分析结果(见表2)。通过这些分析,我们可以观察到微博用户的积极与消极情绪直接反映了他们对ChatGPT的满意度。这对ChatGPT从微博用户的视角出发,改进自身功能具有重要的参考价值。根据表2的数据,我们发现有34.50%的用户对ChatGPT持积极态度,2.00%的用户保持中立,而高达63.50%的用户表达了消极情绪。总体来看,大多数用户对ChatGPT的评价并不乐观。在消极情绪中,轻微、中等和严重的情绪分别占16.00%、45.00%和2.50%。结合词频分析和网络语义分析,我们总结出微博用户普遍的负面情绪主要源于ChatGPT的强大功能导致某些岗位被自动化替代,以及随着技术的发展,人们对未来可能出现的ChatGPT自我意识的恐惧。这就是恐怖谷效应:人类会因机器越来越拟人化、越来越像人类而感到恐惧,至于其背后的原因,一方面是因为在高度仿真环境下,真假难辨所带来的心理不适。另一方面,这种相似性还激发了一种潜在的威胁感。那些与人类极其相似却并非真正的人类存在,会使人们感受到一种潜在的威胁。
Table2.Analysis results of ChatGPT network comment sentiment
表2.ChatGPT网络评论情感分析结果
情感类型 |
占比% |
强度 |
占比% |
积极情感 |
34.50% |
一般(5~15) |
24.50% |
中度(15~25) |
8.50% |
高度(25以上) |
1.50% |
中性情感 |
2.00% |
—— |
2.00% |
消极情感 |
63.50% |
一般(−15~5) |
16.00% |
中度(−25~−15) |
45.00% |
高度(−25以下) |
2.50% |
5. ChatGPT潜在的风险
本文采用ROST CM6软件对微博平台上用户对ChatGPT的评论进行处理,通过词频分析提取了“人类”、“人工智能”、“技术”、“模型”、“数据”等40个高频词汇。分析表明,自ChatGPT首次出现后,便引起了人们的广泛关注,并将其应用于日常生活中。与此同时,人们在接受ChatGPT带来的好处时,也必须考虑到它可能带来的失业风险、替代效应等对人类的潜在威胁。
5.1. 内容风险:内容真实性难保障
从某种意义上来说,AIGC的信息数据来源,是客观世界和主观世界的一种镜像投射[6]。正如喻国明所说,“它现在的问题是不辨真假,对真实度要求很高的新闻只能将它作为参考。”剑桥词典公布的2023年度词汇是Hallucinate。当这个表示“幻听,产生幻觉”被放到当前智能时代背景下时,它指向的正是AI带来的真实性危机:社交机器人散播虚假的政治倾向导致“脱欧”等黑天鹅事件、ChatGPT生产出的“杭州取消限行”等虚假新闻也进一步暴露了深度造假对人们生活最切实的干扰。
5.2. 隐私风险:陷入数据伦理困境
在利用ChatGPT进行内容生成时,需要大量的数据作为算法训练的基础。然而,处理和存储这些数据可能涉及隐私和数据安全的风险。首先,在使用者使用AI技术服务提供商的服务时,可能会默认同意服务提供商可以“学习”使用者提供的信息,可能致使泄露个人信息或违反公司相关的保密制度;其次,ChatGPT生成的内容可能会被滥用用于网络欺诈、网络钓鱼和虚假身份创建,恶意用户可以利用ChatGPT技术生成看似真实的内容来误导和欺骗其他人;最后,ChatGPT的大规模自动生成特征可能会导致恶意攻击者试图篡改或操纵ChatGPT的训练数据,以产生误导性或有害的内容。
5.3. 认知风险:“主仆式”的人机关系
ChatGPT的使用者必须明确的是——人机之前从来不是上下级的关系,而更是应该是一种“互尊、互敬”的关系。“人机协作”的概念,自人类诞生之初,就一直伴随着人类整个文明史的发展。如果说要人类去尊重机器在工业时代是一个天大的笑话,那么在当下AIGC时代下,关于是否尊重并解放人类大脑的AI将无可厚非的成为一个值得深思的问题。理想的人机协同,需要人和机器相互促成,相互制约,相互纠正,相互驯化。但如果人不能在这过程中进行一定的角色转化,就难以适应这种新关系,或者将会被机器单向驯化。
6. 结论
本文综合运用Citespace和ROST CM6软件对微博用户对ChatGPT的评论进行了深入分析。Citespace的关键词共现分析揭示了人工智能领域内关键概念的相互关联,聚类分析则明确了主要研究主题,如人工智能、文本生成等,并指出了研究社区的结构。时间线分析反映了人工智能研究焦点的演变,特别是ChatGPT的兴起。ROST CM6的词频分析突出了用户对ChatGPT影响人类生活的广泛关注,而语义网络分析进一步展现了概念间的深层次联系。情感分析显示,尽管有34.50%的用户持积极态度,但63.50%的用户表达了对技术失业和人工智能自我意识威胁的消极情绪。这些分析结果强调了公众对人工智能技术发展的复杂情感,以及对技术向善发展的期望。
媒介技术既是毒药也是良方的矛盾观念由柏拉图在《斐德罗》篇中最先提出,这样的矛盾性也体现在ChatGPT对人类社会的影响上。ChatGPT潜在着内容、隐私、认知等风险的同时,我们应意识到不应当因为技术产生了问题就否定技术演化本身的存在合理性。但真正有想象力的新闻从业者必须首先面对和解决人类传播属性和运作机制的问题,而不是避开这些空谈悲情与坚守,这种存在于人文社科和科技领域的脱节都需要双方的共同努力才能搭建起桥梁。未来,以ChatGPT为代表的人工智能生成内容会突破以往的理论和实践限制,以技术赋权带来更大的可操作空间。然而新闻传播领域应该在接受这份崭新技术的同时做好风险防范,立足于内容本身的价值,让新闻业奔向更自由的天地。