Research on the Identification of Key Technologies Based on the Patent Co-Occurrence Network
The identification of key technologies can provide certain intelligence support for policy formulation, innovative research and development of countries and enterprises. This study utilizes the IPC classification number of patent literature to construct a patent co-occurrence network, identifies and screens the TOP 10 key technologies through centrality indicators, and conducts technical topic evaluation. Taking the field of e-commerce system technology as an example for research, 10 key technologies and digitalization of business processes (G06Q30), vertical industry solutions (G06Q50), payment systems (G06Q20), and data security (H04L9) were identified as the four main technical directions of e-commerce systems. Through literature review and industry report comparison, the operability and effectiveness of the methods were preliminarily verified.
Patents
关键技术对于提高我国科技实力、保障国家安全具有重要意义。它既可以是基础元件或原材料,也可以是一种系统设计。当前,我国在众多技术领域还需要进一步加强自主创新、加快技术攻关。关键技术的识别不仅能够把握产业发展趋势,还能进一步指导技术发展方向。目前,对于关键技术尚未形成统一的概念共识。在大部分时候,关键技术强调的是技术的重要性,不同学者研究的侧重点也有所不同。时畅
自上世纪90年代起,对于关键技术的识别研究就已经开始了,各国也陆续开展了各种关键技术识别项目,以支撑国家或产业的创新发展。目前,关键技术识别的研究方法主要可以分为主观评价的专家经验法
本研究基于专利IPC分类号构建专利共现网络。IPC分类号是国际通用的专利文献分类号码,它采用功能和应用相结的分类原则,方便使用者检索专利。通常一个专利具有多个IPC分类号。在提取数据时,清洗合并同族专利,提取每项专利的IPC分类号作为技术实体标识。通过Python软件利用自编的代码,对IPC对的联系关系进行统计,即两个IPC分类号同时出现在一个专利中时,视为存在技术关联,并进行计数,构建二元矩阵。为了减少专利网络的稀疏度,在处理完成后,保留IPC分类号的前4位核心分类码(即精准到大组)。通过矩阵转置运算生成技术共现频次矩阵,设置共现频次阈值过滤偶然性关联,保留具有统计显著性的技术关联对。导入数据构建无向加权网络模型,节点代表技术领域,边权值采用对数函数转换处理以平衡高频共现的绝对差异。网络拓扑结构通过Python的NetworkX库实现,使用PyVis工具进行可视化呈现,其中节点尺寸映射技术关联广度,边透明度反映关联强度。
将PyVis生成的交互式网络转换为NetworkX加权图对象,保留原始边权信息。其中节点表征IPC技术分类,边权值通过公式(1)计算,该处理使得边权范围标准化至[1, 10],避免极端值对路径计算的干扰。
(1)
为全面评估技术节点的影响力,本研究构建四维中心性评价体系:度中心性(Degree Centrality)通过计算节点连接边数占总可能边数的比例来表征与该技术的直接关联程度;接近中心性(Closeness Centrality)反映了技术传播效率;介数中心性(Betweenness Centrality)统计了节点出现在所有技术对最短路径中的频次占比,用于衡量技术中介作用;特征向量中心性(Eigenvector Centrality)则评估技术网络地位,基于相邻节点重要性的迭代计算赋予权重。针对无向加权网络特性,采用NetworkX库的加权算法实现,其中边权值参与最短路径计算。为避免量纲差异导致的指标偏差,运用Z-score标准化方法对各指标进行正态化处理,如公式(2)所示,其中 为第k项指标的均值, 为标准差:
(2)
建立等权重综合评价体系,最终依据得分降序排列,筛选前10位作为关键技术节点。如公式(3)所示。
该模型突破单一指标的局限性,从技术扩散能力(度)、控制能力(介数)、传播效率(接近度)和网络地位(特征向量)四个维度实现技术影响力的多角度测度。
本研究数据来源于“壹专利”专利数据库,检索时间为2025年1月17日,采用关键词检索的策略,选取发明专利(包括发明授权和发明申请),合并简单同族专利后对数据进行汇总、去重和清理,最终检索得到1969条电子商务系统相关专利数据。
专利权人(机构树) |
计数 |
占比 |
日本电气集团 |
22 |
1.1% |
湖南易分销电子商务有限公司 |
21 |
1.1% |
日本电信电话集团 |
21 |
1.1% |
IBM |
20 |
1.0% |
长沙海商网络技术有限公司 |
20 |
1.0% |
日立集团 |
17 |
0.9% |
松下电器 |
17 |
0.9% |
佳能 |
15 |
0.8% |
齐心集团 |
15 |
0.8% |
京东 |
13 |
0.7% |
索尼公司 |
12 |
0.6% |
美国亚马逊AMAZONCOM |
11 |
0.6% |
东芝 |
10 |
0.5% |
阿里巴巴 |
9 |
0.5% |
三菱集团 |
9 |
0.5% |
富士通 |
8 |
0.4% |
谷歌 |
8 |
0.4% |
湖南移商动力网络技术有限公司 |
8 |
0.4% |
四川易想电子商务有限公司 |
8 |
0.4% |
腾讯 |
8 |
0.4% |
湖南聚宝盆网络技术有限公司 |
7 |
0.4% |
夏普集团 |
7 |
0.4% |
建设银行 |
6 |
0.3% |
林楠桂 |
6 |
0.3% |
长沙搜博网络科技有限公司 |
6 |
0.3% |
G06Q30、G06Q50、G06Q20、G06Q10、G06Q40均属于G06Q (即专门适用于行政、商业、金融、管理或监督目的的信息和通信技术[ICT]),揭示了电子商务系统的技术重心集中于商业流程数字化、垂直行业解决方案和支付体系三大方向,应用较为广泛。其中,G06Q30这一类技术是电子商务系统中最核心的、最主要的技术,从其发展脉络来看早期的电子商务系统主要是对其基础系统框架的搭建与支付安全,聚焦于电子支付体系、交易安全协议、基础平台架构,如“电子商务系统中的支付和交易”(US6029150A)、“电子商务系统、订单结算方法及记录介质”(JP2000163480A)等,这一技术发展极大推动了互联网商业化浪潮。而后,电子商务系统融合移动化与社交化,并逐渐出现商品推荐,如“使用虚拟现实模拟的电子商务系统及其方法”(KR20010105511A)、“具有可访问的全球信息和可用的特定信息及控制的电子商务系统和方法”(AU2001250885A1)等。随着智能手机的普及,社交媒体用户不断扩大,电子商务系统在AI驱动下,向智能化与生态化扩展。如“一种基于大数据和云计算的电子商务系统”(WO2018195962A1),具有良好的扩展能力并且便于维护,便于商品数据共享,使用方便。基于云计算与AI算法的突破,这一阶段全球化贸易与供应链复杂度提升,新型供应链与电商系统层出不穷。
G06F17、G06F16、G06F21均属于G06F (电数字数据处理)小类。G06F17类技术聚焦于电子商务系统中的数据计算与处理方法,是实现智能化决策与自动化运营的核心支撑。例如,专利“实现双向电子商务的方法和设备”(CN1319818A)可实现买卖方进行双向协商;专利“双向撮合的电子商务系统”(CN1376997A)通过双向检索技术匹配供需方,构建立体式网络沟通平台。信息检索技术(G06F16)是提升用户体验与平台效率的关键。在专利共现网络中,G06F16与G06Q30具有高关联强度,表明其与商业流程数字化深度耦合。典型应用包括商品搜索引擎优化和个性化推荐系统的构建。例如,专利“使用语义分类信息进行动态数据库重定向”(TWI227425B)通过自然语言处理技术解析用户查询意图,显著提高搜索准确率;“一种个性化信息展示的方法”(CN101009009B)通过自定义设计信息展示方案,由网络媒介浏览器进行解析完成信息展示。随着网络风险加剧,G06F21类技术在网络地位中也占据重要地位。该领域专利主要涉及用户隐私保护、交易防欺诈和系统漏洞防护。例如,专利“基于区块链的安全性高的电子商务系统”(CN112507379B)基于区块链根据订单数据占用的内存进行合理化分配提高电子商务系统安全性。
本研究基于专利文献采用专利共现网络识别关键技术,为企业技术研发或相关部门政策制定提供参考,并以电子商务系统技术领域为例,得到G06Q30、G06Q20、G06F17、G06Q40、G06F16、H04L9、G06F21、G07G1关键技术。不足之处在于:① 专利数据具有一定滞后性,仅采用专利数据,缺乏不同类型的数据来源,未来可结合论文或行业报告进行分析。② IPC分类号对于技术主题分析的颗粒度较粗,仅反映技术功能属性,难以捕捉技术间语义关联,后续可引入文本分析增强技术关联识别。
本文系江苏大学第二十二批学生科研课题立项一般项目“基于专利信息挖掘的产业共性技术识别研究”(编号:Y22C054)的研究成果之一。