1. 引言
随着生成式人工智能、云计算、边缘计算、区块链等新兴移动互联网技术的发展[1],数据市场呈现蓬勃发展的态势[2],数据成为新型的生产要素[3]和重要的战略资源[4]。数据资产化是在数据资源化的基础之上融入数据的权属和经济属性[5]。数据资产可以看作一种电子数据资源[6],其价值和成本可以可靠计量,具备经济所有权属性,可以创造经济利益[7],包括能给企业带来经济利益流入的所有数据集合[8]。
在数据资产成为新型生产要素的背景下,梳理当前数据资产研究现状及热点趋势对于未来的研究具有重要的指导意义。本文基于WOS数据库和CNKI数据库收录的数据资产中英文文献,分别运用VOS Viewer软件和CiteSpace软件绘制研究热点知识图谱及分析热点主题演化趋势。
2. 文献数据来源及研究方法
2.1. 文献数据获取
英文文献在WOS数据库SCI和SSCI合集中,以“Data assets”作为主题进行检索,共检索到340条文献记录(检索时间截至2024年3月31日),中文文献在CNKI数据库中检索,检索式如下:标题 = “数据资产”OR摘要 = “数据资产”OR关键词 = “数据资产”,期刊来源为CSSCI和北大核心,共得到2938条文献记录(检索时间截至2024年3月31日)。对检索结果进行如下预处理:去重、删除期刊论文类型以外的其他文献、剔除与数据资产主题明显不相关的文献,最终得到323篇英文文献和1480篇中文文献作为后续分析的数据源。
2.2. 研究方法设计
本文采用文献计量分析方法对数据资产相关文献进行分析,文献计量分析法是一种定量研究方法,结合了数学与统计学方法,描述和评价大量文献的外部特征,用以分析某领域研究现状与发展趋势[9]。基本思想是针对数据交易领域研究文献,运用计量模型对该领域文献的结构特征信息进行挖掘,从而把握该领域研究动态[10]。用到的分析工具主要有CitreSpace和VOS Viewer,VOS Viewer主要用于绘制作者和关键词共现图谱,CitreSpace主要用于分析关键词突现。分析流程为:基于检索获取并进行预处理得到的323篇英文和1480篇中文数据资产文献,首先对文献发表时间趋势和学科分布整体情况进行概括性分析,进而借助VOS Viewer软件绘制作者合作与关键词共现知识图谱,最后利用CiteSpace软件分析国内外研究热点演化趋势。
3. 国内外研究现状
3.1. 文献时间分布
分析文献数量时序分布可以从宏观上把控研究主题在一段时间内的发展趋势[11]。图1展示了数据资产英文文献1997年至2024年发表数量趋势。整体来看,数据资产英文文献最早出现于1997年,近20年间文献数量呈波动上涨趋势,从2015年起文献数量增速加快,2021和2023年有所回落,2022年发文量达到峰值。图2反映了数据资产中文文献2001年至2024年发表数量时序分布,可以发现,国内对于数据资产的研究最早出现于2001年,略晚于国际研究,近20年间呈现逐渐上升的趋势,从2012年文献开始增多,2019年开始增速加快。比较国内外数据资产文献时序分布特征可以发现,国内外数据资产研究数量均从2011起开始增长,2011~2024年国际研究数量呈现波动上升的趋势,国内研究数量则逐年稳定上升,国内外研究数量均在2020年左右增速较快,反映了关于数据资产的研究在2020年左右引起了国内外学者的广泛关注。
Figure 1.Trends in the number of publications on WOS database data assets from 1997 to 2024
图1.1997年至2024年WOS数据库数据资产文献发表数量趋势
Figure 2.Trends in the number of publications on CNKI database data assets from 2001 to 2024
图2.2001年至2024年CNKI数据库数据资产文献发表数量趋势
3.2. 文献学科分布
3.2.1. 英文文献学科分布
图3展示了WOS数据库中数据资产文献数量排名前十的学科分布情况。分析可知,近20年国际上对数据资产领域的研究与计算机科学、信息系统、理论方法、工程学、电气与电子、人工智能、软件工程、信息通信、信息科学与图书馆科学等学科密切相关。其中计算机科学占学科分布的42%,这说明国际上数据资产研究多在计算机科学学科中展开。此外,信息系统、工程学分别占学科分布的14%和8%,反映了信息系统、工程学等学科与数据资产研究密切相关。
Figure 3.Top 10 discipline distribution of WOS database data asset literature from 1997 to 2024
图3.1997~2024年WOS数据库数据资产文献Top 10学科分布
3.2.2. 中文文献学科分布
统计国内数据资产文献学科分布情况,取统计结果中排名前10的学科进行可视化处理,其分布情况见图4。其中,信息经济与邮政经济占学科分布的32%,占比第一,这说明国内对于数据资产的研究在信息经济与邮政经济学科中展开最多。计算机软件及计算机应用占学科分布的19%,占比第二,企业经济学科占学科分布的18%,占比第三,此外,热门学科分布中还包括金融、电力工业、会计等,体现了数据资产与计算机科学、经济学、金融的密切关联。
Figure 4.Top 10 discipline distribution of CNKI database data asset literature from 2001 to 2024
图4.2001~2024年CNKI数据库数据资产文献Top 10学科分布
3.3. 文献作者分布特征
3.3.1. 英文文献作者分布
首先利用VOS Viewer对WOS数据库收录的323篇数据资产英文文献的作者绘制共现图谱如图5所示:
Figure 5.Author co-occurrence graph of WOS database data assets literature from 1997 to 2024
图5.1997~2024年WOS数据库数据资产文献作者共现图谱
图5中的节点代表作者,节点之间的连线代表作者之间建立的合作关系。根据普莱斯定律,在同一主题的科学研究领域中半数的论文为一群高生产能力作者所撰,这一作者集合的数量上约等于全部作者总数的平方根,公式为
,其中
为该领域发文量最多的作者的论文数量[12]。WOS收录的数据资产英文文献的作者
值为6,计算得到m= 1.835,因此可以认为文献发表数量大于等于2的作者为该领域的核心作者,共有62位,表1展示了发文量大于2的作者:
Table 1.Core author list of WOS database data asset literature
表1.WOS数据库数据资产文献核心作者列表
序号 |
核心作者名 |
发文数量 |
序号 |
核心作者名 |
发文数量 |
1 |
Lee, JS |
6 |
7 |
Liu, Xin |
3 |
2 |
Wang, Rui |
4 |
8 |
Ma, Lei |
3 |
3 |
Zhang, Hao |
4 |
9 |
Liang, Hui |
3 |
4 |
Martens, David |
4 |
10 |
De Fortuny, Enric Junque |
3 |
5 |
Chang, Yingxian |
3 |
11 |
Provost, Foster |
3 |
6 |
Liu, Donglan |
3 |
12 |
Otto, Boris |
3 |
结合图5和表1可以发现,1997~2024年,WOS收录的数据资产领域英文文献有62位核心作者,Lee教授发文量最高,有6篇,其次是Wang Rui、Zhang Hao、Martens三位教授,分别发表了4篇数据资产相关文献,但是发文量高的这几位作者相互合作研究不多。
3.3.2. 中文文献作者分布
利用VOS Viewer对CNKI数据库收录的1480篇数据资产文献绘制作者共现图谱如图6所示:
Figure 6.Author co-occurrence graph of CNKI database data assets literature from 2001 to 2024
图6.2001~2024年CNKI数据库数据资产文献作者共现图谱
由普莱斯定律可得,CNKI数据库中数据资产领域作者的
值为10,计算得到
,也就是说在数据资产领域发文量大于等于3的作者为该领域的核心作者,统计发文频次大于等于3的作者列表,共有56位核心作者,由于篇幅限制,文中仅展示发文频次大于3的作者,如表2所示:
Table 2.Core author list of CNKI database data asset literature
表2.CNKI数据库数据资产文献核心作者列表
序号 |
核心作者名 |
发文数量 |
序号 |
核心作者名 |
发文数量 |
1 |
朱扬勇 |
10 |
12 |
崔金栋 |
4 |
2 |
陆岷峰 |
9 |
13 |
程永新 |
4 |
3 |
张俊瑞 |
7 |
14 |
胡亚茹 |
4 |
4 |
许宪春 |
7 |
15 |
尤建新 |
4 |
5 |
王磊 |
7 |
16 |
杨栋枢 |
4 |
6 |
叶雅珍 |
6 |
17 |
刘敏 |
4 |
7 |
危雁麟 |
6 |
18 |
周文泓 |
4 |
8 |
张楠 |
6 |
19 |
黄登玺 |
4 |
9 |
欧阳文杰 |
5 |
20 |
王勇 |
4 |
10 |
郭树行 |
5 |
21 |
曾雪云 |
4 |
11 |
武昆峰 |
4 |
22 |
赵国栋 |
4 |
结合图6和表2可以发现,国内数据资产研究发文量最多的是朱扬勇教授,发表了10篇文献,其次是陆岷峰教授发表了9篇文献,除此之外,张俊瑞教授、许宪春教授、王磊教授分别发表了7篇文献,但是几位高产作者相互合作研究不多。
4. 国内外研究热点与前沿趋势
4.1. 研究热点分析
4.1.1. 国际研究热词共现分析
利用VOS Viewer对WOS数据库收录的323篇数据资产英文文献的关键词绘制共现图谱如图7所示:
Figure 7.Co-occurrence graph of keywords in WOS database data assets literature from 1997 to 2024
图7.1997~2024年WOS数据库数据资产文献关键词共现图谱
Figure 8.Co-occurrence graph of CNKI database data asset literature keywords from 2001 to 2024
图8.2001~2024年CNKI数据库数据资产文献关键词共现图谱
由图7可以发现,国际数据资产研究主要以“大数据”、“区块链”、“数据管理”为中心形成三个聚类:以“大数据”为中心的聚类主要聚焦信息系统和成熟度模型,以“区块链”为中心的聚类重点关注了数据市场和数据共享,以“数据管理”为中心的聚类主要与电子政务相关。反映了国际对于数据资产的研究重点关注了大数据在信息系统和成熟度模型中的应用、区块链在数据市场和数据共享中起到的作用及政府对数据资产的管理。
4.1.2. 国内研究热词共现分析
利用VOS Viewer对CNKI数据库收录的1480篇数据资产中文文献的关键词绘制共现图谱如图8所示。
分析图8可以发现,国内数据资产研究主要以“数据资产”为中心形成了四个聚类:正上方的红色聚类数据资产的价值评估方法,左侧的蓝色聚类主要涉及数据资产在企业中的会计核算,下方的黄色聚类强调了数字经济发展和区块链等技术的应用对数据资产发展的助推作用,右侧的绿色聚类反映了对于数据资产的数据治理和服务。
4.2. 研究热词演化趋势
4.2.1. 国际研究热词演化趋势
在一段时间内出现频次快速增长的关键词称为突现词,突现词可以用来分析某研究领域在时间上的演变趋势。为分析国际数据资产领域研究主题趋势演变,借助CiteSpace软件对WOS收录的323篇数据资产文献进行突现词分析,排名前20的突现词如图9所示:
Figure 9.Top 20 literature emergencies of WOS database data assets from 1997 to 2024
图9.1997~2024年WOS数据库数据资产文献突现词Top 20
图9红色部分代表对应关键词突现的时间段,突现度越高,说明在一段时间内该趋势的研究强度越强,图9反映了1997~2024年国际数据资产领域的研究排名前20的突现词。分析图9可知,“信息安全”是突现最早且持续时间最长的关键词,突现于2006年,持续到2014年,反映了国际数据资产的研究重点在很长一段时间内聚焦于信息安全视角。除此之外,“大数据”、“数据质量”、“数据治理”等突现词持续的时间也较长。“深度学习”、“数据定价”突现词集中出现于2021~2022年,且已持续到2024年,说明国际上近两年对数据资产领域的研究趋势集中在深度学习技术与数据资产的融合,以及探讨数据资产的定价问题。
4.2.2. 国内研究热词演化趋势
借助CiteSpace软件对CNKI收录的1480篇数据资产文献进行突现词分析,排名前20的突现词如图10所示:
Figure 10.Top 20 emerging words in CNKI database data asset literature from 2001 to 2024
图10.2001~2024年CNKI 数据库数据资产文献突现词Top 20
分析图10可知,“数据中心”是突现最早的关键词,突现于2012年,持续到2016年,突现时间最长的关键词是“大数据”,反映了国内数据资产的研究重点在很长一段时间内聚焦于大数据。“会计计量”、“计量”、“会计处理”、“数据要素”突现词集中出现于2022~2023年,且已持续到2024年,说明国内上近两年对数据资产领域的研究趋势聚焦于数据资产的会计计量和处理。
5. 研究结论
本文基于WOS数据库和CNKI数据库收录的发表于1997年1月1日至2024年3月31日的数据资产中英文文献,借助CiteSpace和VOS Viewer软件对文献进行可视化计量分析,得到如下结论:
1) 从文献时序分布特征看,国内外数据资产文献整体上都呈现上升的趋势,但国际数据资产研究数量呈现波动上升的趋势,而国内数据资产研究数量呈现逐年稳定上升的趋势。国际研究数量从2015年起增速加快,国内研究数量从2019年起增速加快。未来,数据资产相关研究热度将持续,在数据成为重要战略资源的背景下,各国对数据资产越来越重视,相关研究热度也将随之升温。
2) 从领域研究的学科分布情况来看,国际上对数据资产研究大多在计算机学科下开展,而国内对该领域的研究大多在经济类学科下开展,学科涉及的范围都较为广泛。
3) 从核心作者来看,数据资产领域国内外研究作者之间暂未建立紧密的合作关系,未来应加强跨领域合作研究。
4) 从研究热点上来看,国际对于数据资产的研究重点关注了大数据在信息系统和成熟度模型中的应用、区块链在数据市场和数据共享中起到的作用及政府对数据资产的管理;国内对于数据资产的研究重点聚焦数据资产的价值评估和会计核算。