1. 引言
AIGC是指从内容生产者的角度对内容进行分类的一种内容类型,同时也是一种自动化生成内容的技术[1],它是利用自然语言处理技术的生成式内容,底层逻辑是庞大的大数据结构,它以超大规模数据为驱动力,通过对抗学习生成模型并不断进行迭代优化[2]。自2022年以来,随着国家“东数西算”战略工程的正式启动,在工业和信息化部、国家发展改革委等多部门协同推动下,算力基础设施建设取得显著成效[3]。随着全国一体化算力网建设,人工智能算法训练和优化将会得到进一步革新,推动人工智能技术的应用与创新。学者们围绕AIGC的概念特征、运行要素、应用场景、用户逻辑、内容生产的生态演进、AIGC如何加速推进产业转型升级等多个方面进行的针对性研究,并取得了较为丰硕的成果。虽然现有研究中也存在一些综述性文献,然而这些综述性研究多针对AIGC领域中某一具体研究问题,已有的研究成果缺乏以计量方法为基础的文献归纳和总结。
基于此,本文借助CiteSpace可视化文献分析软件对CNKI数据库中2022~2023年中国AIGC相关文献进行梳理,总结当前AIGC的研究进展,并分析AIGC的知识图谱,从而以更加客观和直观的角度把握该领域的研究热点,为后续的理论深化研究提供坚实的理论基础和可参考依据。
2. AIGC的内涵解析
人工智能最早的概念产生于20世纪50年代的达特茅斯会议。当时,人们开始探索如何利用计算机自动生成文本、图像、音乐和视频等。直到21世纪初,AIGC的发展迎来了真正的突破。2018年,一幅由GAN生成的《埃德蒙·贝拉米画像》肖像画在佳士拍卖除了43万美元的高价。随后,越来越多的人工智能生成内容出现,更多的AI研发者也认识到,人们更需要一个能深入了解用户需求,并与之自然交流的AI。2022年,OpenAI推出了全新的对话式人工智能工具——ChatGPT。ChatGPT改写了AIGC的生产逻辑[4],它能在人们提出的问题中迅速捕捉人们话语中的关键信息,并不断学习,输出内容,实现了与人类的持续交互。
当前,AIGC的应用场景非常广泛,在新闻媒体领域,AOGC可以自动撰写新闻报道;在教育领域,AIGC可以自动生成作文、题目等;在艺术创作领域,AIGC可以自动生成绘画、音乐等作品。总之,AIGC是一种由人工智能驱动的内容生成方式,它可以通过机器学习和深度学习等技术进行自动学习和优化,它的出现改变了传统的内容生产方式,为人们提供了更加高效、智能和多样化的方式。
3. 国内AIGC文献统计分析
3.1. 文献数据收集
本文研究的样本数据基于中国知网学术期刊网络出版总库检索,利用CiteSpace软件进行文献分析。由于2022年11月30日,由OpenAI推出的全新ChatGPT横空出世,多款生成式AI产品发布,引起社会的广泛关注,2022年被认为是AIGC的集中爆发年,现有研究也主要集中于2022年~2023年,因此,本研究将2022年~2023年作为检索时间。时间设置为2022年9月至2023年12月,主题设置为“AIGC”。通过检索以及剔除无关文献,最终得到实际有效文献619篇,构成本研究的文献样本。
3.2. 发文量分析
如图1所示,从文献数量上看,2023年关于AIGC的发文量达586篇,表现出很高的活跃度,很大程度可能是因为有关该领域的组织和技术取得了较大的发展,引起了大范围的研究与讨论。AIGC的研究主题主要是人工智能当前技术形态特征、场景、内容生产方式、工具应用、人机生存等,王诺等人便介绍了AIGC模式下的内容生成的核心目标、发展阶段性特征、体系架构、输出形式等[5];叶妮等人着力于厘清AIGC延展的创新性内容生产的场景、用户与核心要素[6]。AIGC的基础技术与各种大模型得到迅速发展,促使当前有关于以ChatGPT为代表的AIGC的讨论愈发热烈。
Figure 1. Domestic AIGC research papers published in 2022~2023
图1. 国内AIGC研究论文2022~2023年度发文情况
3.3. 研究机构与作者分布分析
从研究机构来看,北京师范大学、武汉大学、中国人民大学、南京大学和清华大学是研究成果较多的机构,各个研究机构之间的合作较少。从发文作者来看,高产作者主要包括喻国明、彭兰、郭全中、高焕堂、李白杨、赵子忠等,部分作者之间存在合作关系,比如叶妮、喻国明、胡正荣、李涵舒等。国内关于AIGC的研究核心作者活跃度较高,但相互之间的合作不多。
4. AIGC研究热点分布
4.1. 基于关键词共现的研究热点分布
运用了共词分析探析AIGC的研究热点,本研究截取频次大于5的关键词,并对其中心度进行计算,如表1所示。结合中心度(≥0.1)排序可以看出高频词共用4个,分别是人工智能、元宇宙、人机协同、智能媒体,并对关键词进行进一步的共现分析。
Table 1. Frequency and centrality of literature keywords from 2022 to 2023
表1. 2022~2023年文献关键词频次和中心度表
序号 |
关键词 |
频次 |
中心度 |
年份 |
1 |
人工智能 |
86 |
1.11 |
2023 |
2 |
内容生产 |
16 |
0.09 |
2023 |
3 |
元宇宙 |
15 |
0.1 |
2023 |
4 |
媒体融合 |
11 |
0.05 |
2023 |
5 |
大模型 |
9 |
0 |
2022 |
6 |
数字出版 |
9 |
0.02 |
2023 |
7 |
人机协同 |
8 |
0.1 |
2023 |
8 |
新闻生产 |
8 |
0.01 |
2023 |
9 |
知识生产 |
8 |
0.05 |
2023 |
10 |
智能出版 |
7 |
0.01 |
2023 |
11 |
深度学习 |
6 |
0.04 |
2022 |
12 |
ai绘画 |
6 |
0.03 |
2023 |
13 |
智能媒体 |
5 |
0.1 |
2023 |
14 |
智能传播 |
5 |
0 |
2023 |
Figure 2. Keyword co-occurrence network map
图2. 关键词共现网络图谱
由图2关键词共现图谱可知,国内的AIGC研究主要聚焦于人工智能、内容生产、元宇宙、生成式ai、人机协同、大模型、媒体融合、智慧图书馆、新闻生产、数字出版等关键主题。其中图谱中节点面积越大,则代表着该关键词出现频次越多,反之则越少。“人工智能”节点的面积最大,也就说明该词出现频次最高,有关人工智能方面特性的研究也最多。“元宇宙”的节点面积次之,则表明元宇宙是现在及未来有关AIGC研究的大热点。
4.2. 基于关键词聚类的研究热点分布
将样本数据进行关键词聚类,获得了AIGC的主题聚类图谱,如图3所示,关键词聚类图谱呈现出8个聚类,依次为“人工智能”“元宇宙”“内容生产”“数字出版”“算法”“内容生成”“大模型”“文本生成”,其聚类模块值Q值 = 0.595 > 0.3,平均轮廓值S值 = 0.9148 > 0.7,因此,该聚类是可以被信服的,其聚类结构效果显著。
Figure 3. Keyword clustering network map
图3. 关键词聚类网络图谱
以上结果表明,基于关键词共现的研究热点与关键词聚类的研究热点基本对应,主要是围绕人工智能、内容生产、元宇宙、人机协同、大模型、智慧图书馆、新闻生产和数字出版等研究问题。
5. AIGC研究主题分析
综合上述分析,将AIGC研究主题划分为“AIGC内容生产的场景、逻辑”、“AIGC技术开发与应用”、“AIGC生成内容的伦理审视”、AIGC下人机关系的思考,如表2所示。
Table 2. Hot topics and corresponding keywords
表2. 热点主题及对应关键词表
研究热点主题 |
关键词 |
AIGC内容生产的场景、逻辑 |
多模态、数字人、深度学习、神经网络、内容生成、价值逻辑、用户逻辑、社交媒介、可供性、媒介融合 |
AIGC技术开发与应用 |
智能媒体、智慧服务、图书馆、艺术设计、人机传播、主流媒体、算法、智能互联、赋能、人机协同、应用场景、数字艺术、ai绘画、包装设计、出版业信息治理、短视频、文本生成、智能出版 |
AIGC生成内容的伦理审视 |
新闻伦理、科技伦理、内容安全、媒介素养、媒介伦理、媒介生态、知识产权、编辑出版伦理、数字伦理、著作权、技术伦理、伦理风险 |
AIGC下人机关系的思考 |
机器学习、人机传播、人机共创、人机交流、价值共创、人机关系、主流媒体、智能互联、深度学习、人机交互、媒体融合、跨界融合、数字人 |
5.1. 热点主题一:AIGC内容生产的场景、逻辑与核心要素解读
AIGC的迅速发展体现了AI赋能内容生成的强大影响力。2023年2月,中共中央国务院印发《数字中国建设整体布局规划》明确,数字中国建设按照“2522”的整体框架进行布局,强化数字技术创新体系和数字安全屏障“两大能力”[7]。借以望AI技术创新持续高效发展,为推动数字产业格局下内容生产方式的不断创新,从而加快实现由数字文明时代向智能文明时代迈出一大步的美好愿景。因而,有关于AIGC内容生产的虚拟场景、用户逻辑与核心要素的研究主题成为当下的研究热点。
5.1.1. AIGC内容生产的应用场景
AIGC 技术渗透到生活中的各个场景中。喻国明等人提到了互联网平台依托移动设备手机来收集用户行为数据、行动轨迹、行动体征等信息,以此构建了一个“基于人类现实空间的主体外部关系‘场景’”,更多的AI技术将推动商业模式与产业转型升级,从而催生更多的应用场景[8]。刘明亮认为,随着大数据训练维度和算法深度学习的不断发展,AIGC由“复制、模仿向创造、创新演进”[9],也就意味着AI辅助设计向智能交互场景的发展转变。最初的AIGC主要用于辅助设计,比如为图文设计提供素材模板,用户可直接使用,但这也就意味着用户不能自主生成创意。喻国明等人则认为AIGC将会凭借自身高效率、多模态、高质的内容生产特点重新构建语义输出世界,而有关“原创作者”的概念将会被重新定义[8]。
解学芳等人认为,AIGC以高效率、高质量与高规模为“三高”标准,塑造了数字文化多重场景,从而冲击力人们的视觉、听见和耦合视听体验[10]。随着ChatGPT、文心一言等语言大模型的出现,AI能跳出原有的预设场景,根据用户需求,进行自主生成内容。而有关神经网络技术、物联网等技术的发展,AI能进入到更高层次的智能交互阶段。即通过AIGC与辅助脑机接口的结合,从而实现大脑与外部设备之间的交互,从而将这项技术应用到医疗、教育、游戏等方面。詹希旎等人也提及基于AIGC技术特征以及内容演进,有关“赋能、优化、拓展、强化、融合”的场景化应用是AIGC的发展方向[11],将AIGC应用场景分为了五种类型,分别为“生活场景”、“服务场景”、“文娱场景”、“科技场景”和“商业场景”。
5.1.2. AIGC内容生产的用户逻辑
AIGC促进算法架构的革新,呈现多种不同用户逻辑。叶妮等人在研究中提到了基于AI的用户画像,从而实现了个体精准定位,从而强化虚拟群体圈层归属[5]。郝雨等人在研究中认为,AI技术的可供性不仅扩展了新闻的应用场景,还参与到了新闻采集、处理、写作、审核、分发各个流程中[12]。也就是说,大数据通过收集受众信息行为,对用户的选择性进行关注,从而为用户进行个人定制。王朋进提到内容服务需要获得受众认可,从而获得社会影响,以此来获得经济利益[13],即当前的传播技术的进步是为了提高内容创作质量于效率,从而服务于用户的。陆小华关于人工智能工具以用户问题为中心的事实,提到了,人工智能工具根据用户问题生产内容,人们并对其内容进行分享、传播与议论,这对于人们在对信息的萃取、认知观点形成和表达中有影响力,从而对人们决策行为起到影响,这也就意味着人工智能工具生成的内容开始影响到了人们的认知、决策和行为,意味着其生成逻辑发生的变化[14]。
除此以外,解学芳等人提到了AIGC在内容、技术、模式这三位主导的创新逻辑下,AIGC所赋能内容的生产水平和人类相当甚至更高,从而出现人机协同现象[10]。王虎等人也提到了人工智能将重塑当前内容生产内机,走向用户与传播者进行内容价值共创,实现人类与机器的价值共创[15]。
5.2. 热点主题二:AIGC技术开发与应用解读
许雪晨等人提到中国AIGC产业与国际先进科技公司相比仍处于起步阶段,但国内依旧有知名企业在AIGC领域进行布局[1]。姜莎等人介绍了国外AIGC应用产品多以美国为主,AIGC产品的演进落地的方向是多模态能力,“我国10亿参数规模以上的大模型已发布79个,几乎进入‘百模大战’”[16]。而严益强介绍了AIGC与AI结合的四种方式(AIGC直接替换AI、AI系统功能扩展、AI系统性能提升、基于AIGC架构的全新系统),同时,介绍了AIGC主要在传统AI中进行数据预处理、特征提取、模型训练、模型评估、超参数优化、模型选择和调整等各种应用[17]。徐继敏等人则介绍了ChatGPT和文心一言为代表的AIGC大模型,认为大语言模型材料只要由人机交流材料、大语言模型本体相关材料和运行环境信息三个主要部分构成,具有直观性强、可识别性弱、可解释性弱等特点[18]。李白杨等人则介绍了AIGC具有数据巨量化、内容创造力、跨模态融合、认知交互力等技术特征,并认为互联网的网络结构、核心技术、内容形式等都在不断革新,AIGC的发展则随着互联网形态的不断变化而变化[19]。
蒋昌磊认为多种多样的AI产品将会促使现阶段所有产业进行变革,推动媒体和影响资讯行业等步入新纪元[20]。卢兆麟等人认为“人工智能正在经历从‘弱人工智能’向“强人工智能”的过渡”[21],当前人工智能已经在人们生活中起到重要作用,展望未来,虚实结合的沉浸式体验将会被加强,基于隐私安全的交互反馈模式设计将会减少隐私泄露等问题。AIGC将会充分推动着人工智能的发展,从而为更多行业带来机遇。
5.3. 热点主题三:AIGC生成内容的伦理审视解读
张林认为在数字化浪潮下,AIGC推动着各行各业进行革新,成为了创新和效率的重要动力,但同时,AIGC的应用存在的潜在风险也要引起注意[22]。技术不断发展与革新必然伴随着人类生存环境的变化。在麦克卢汉看来,一切技术即是媒介,媒介即是人类的外化与延伸[23]。董媛等人认为,AIGC必然会越来越普遍的进入到人类的生活场景中,并可能以技术逻辑来驯化和支配人类,从而形成技术垄断,并蚕食、消解掉人们的自主性以及个体差异性[24]。这也就代表了,进行内容生产的主体在与机器进行交互的方面会加速人们对于高效率和便利性的追求,同时并对AIGC模型产生过度的依赖,意识不到其中蕴含的话语危机和思维危机,从而失去主体性。骆顺婷等人从广告行业角度提到了,当前从以人为主、机器为辅的模式向人机协同模式过渡的革新,其变革背后存在着“广告内容安全风险、广告价值导向偏差风险、广告内容版权归属风险及广告创作主体异化风险”[25]。陈昌凤等人认为AIGC存在的“系统性偏见、价值观对抗、观点霸权、刻板印象、虚假信息”等问题,是由于收集数据时的出现各种纰漏[26]。
陈吉栋等人则提出,对于人工智能风险的治理可以从以下几个方面进行,一是在技术上要提高对技术风险的预警和评测方面的机制,二是要为AIGC综合监管制度设计伦理这个底线,并为具体场景设计具体的规范,三是要完善AIGC技术在合法和违法中所进行的编码体系,四是综合全社会的凝聚力,建立一个能进行沟通风险和协调风险的监管体制[27]。
5.4. 热点主题四:AIGC下人机关系的思考解读
彭兰等人对智能时代,媒体与人之间进行了综述,提出,在人机关系的研究中心,人机关系信任的相关问题正在别解决,人机协同、人机传播等相关研究也逐步发展起来[28]。储节旺等人认为随着AI对信息生成的加深,人类完全占有信息生成主体地位将会变成人与AI共存的画面[29]。薛璐瑶认为,随着AIGC越来越深入到社会中,那么人机关系的一系列危机问题(信任危机、权力纷争)就会出现[30]。喻国明等人认为,人工智能技术已经是人类社会必然的存在,在AI技术普遍出现在社会中的常态化场景下,人机信任的构建是必需的,并且需要构建一个完善和适配的信任传播模式[31]。孙屹言认为,正是因为高效率和智能化的人机交流存在着如同数据污染、身体缺位等伦理风险和技术风险,才更应该开展一种在使用层面促使数据治理的回归工具路径,即是以人为衡量尺度去看待人机关系[32]。
史安斌认为,人类想要保持核心竞争力从而不被AI取代,则要加强自身的思辨内容与思想的深刻性[33],同时要正视AI带来的信息危机,这是所有行业面临的社会问题,随着GPT-4、GPT-5以及未来更具有变革性的AI技术不断出现,人工智能所带来的的冲击只会不断变化,因此,人类需要在技术变革浪潮中不断去思考人工智能带来的新课题。
6. 展望
AIGC技术的应用是全民化的新实践,无论人们是否愿意去接触和理解AIGC,AIGC都在不断改变着人们的生存境遇以及社会生活场景。陈楚仪等人认为,AIGC及技术需要更多的资本与资源,使其形成“研发-应用-研发突破”的正向循环,同时,产业政策需要跟进,从而促进AIGC在互联网领域的深入应用[34]。
互联网的出现为用户内容生产提供了传统平台,AIGC技术则为用户内容生产提供了工具,这促进了各类生产工具的平民化、智能化,这也就意味着,AIGC带来的变革打破;额各个领域的创作壁垒。而原本为不同行业人员制定的规则、法律、法规、伦理等,在这一变革下,是否适用于人机协同生产场景,成为了当前需要思考的问题。元宇宙相关的技术将虚拟世界与现实世界交融在一起,渐渐改变了用户参与者的生活方式。在此情况下,人的媒介化生存将被重新思考与定义,随着媒介化时间的不断深入,一些透明的忧思也渐渐变显,一种媒介依赖逐渐深度演进的行为的本质也在此过程逐渐明晰起来[35],人们需要进一步的解析人与机器,人与自我、他者的关系。
7. 结语
当下,AIGC的版图正在不断的扩张,各个研究方向体现一个共同的特点,就是在AI技术不断扩张与发展的背景下,对于人的存在与价值这个方向重视起来。不难发现,无论是在技术互动的前提下观察人机协同与人机信任,还是从人在AI技术的协助下进行的生活中去观察其人的行为动机,均回到了对人的关注上。对于未来,不同的研究者们会采取不同的角度或视角去审思AIGC技术,但在与机器的相处,我们最终需要认识到自己,回到人本身。