1. 引言
自2008年国务院发布《国家知识产权战略纲要》,将知识产权工作提升至战略高度以来,我国科研工作者对知识产权的重视程度日益增强[1]。专利,这一集技术、法律、经济和战略信息于一身的综合体,作为知识产权的核心体现,受到了前所未有的关注。在国家创新驱动发展战略的深入推动与实施下,政府、企业及科研机构的产业决策、技术竞争及成果转化,均离不开专利信息服务的支持[2]。随着中国专利申请量的迅猛增长,以及国内高校资源和技术条件的持续提升,专利信息服务需求不断攀升,高校图书馆正逐渐崛起为专利信息服务的重要支柱。近年来,专利信息服务数据的挖掘也引发了学者们的广泛关注。赵龙文认为,专利分析的优化需要拓展至更广泛的专利数据,包括国内政府商业平台数据、服务机构数据、个人科研数据、高校研发数据以及国内外专利局发布的专利信息数据等[3]。洪凡则指出,产业政策数据和市场需求数据作为产业技术情报的关键组成部分,与专利信息相结合,能够形成更为全面的产业技术情报分析数据源[4]。鲍志彦等人亦认为,鉴于专利分析目的的多样性,分析对象不应局限于专利信息本身,而应综合考量政策、市场、技术、法律等多维度信息数据[5]。严哲在深入研究欧洲PATLIB中心项目服务时,发现其基于专利数据与非专利文献资源的增值分析服务,是分析其市场占有率高企的重要原因[6]。由此可见,专利信息服务数据的有效管理与应用,对于提升专利信息服务的整体质量和效率具有重要意义。
在高校图书馆的持续实践与深入探索中,基于专利信息服务相关数据的应用已取得了一系列显著的研究成果。以专利培训、专利查新、专利检索为核心的传统信息服务,仍然是高校图书馆开展专利信息服务工作的基础,这些工作主要依赖于专利库数据、专利课程等丰富的信息素养资源。例如,北京大学、北京科技大学等知名学府纷纷开展系列专利信息素养培训讲座,东北林业大学也成功举办了“高校学生创新创业与知识产权”和“专利文件撰写实务”等培训班[7],这些活动不仅提升了师生的专利意识,也推动了专利信息服务的普及与发展。而图书馆开展的高端情报服务,则成为当前专利信息服务领域的热门话题。这种服务的应用主要集中在竞争情报的分析与挖掘上,通过嵌入科研全过程以及为决策提供支持的专利信息服务,深度挖掘专利文献数据的价值。借助先进的数据挖掘技术,图书馆对专利数据进行采集、筛选、整理、提炼,将其转化为具有总览性和预测性的情报,为学校、企业和机构的科研管理、科技创新、市场竞争、决策制定、成果转化等提供有力的参考和依据[8]-[11]。
专利信息服务是一项紧密围绕数据展开的服务工作,其深入发展离不开数据的多样性、可获取性以及安全性这三大基石。然而,当前高校图书馆在专利信息服务领域对于相关数据的运用与挖掘尚显单一,且缺乏一套科学、高效的管理体系。随着大数据时代的来临,数据呈现出爆发式的增长态势,为专利信息服务提供了前所未有的丰富数据源。同时,数据挖掘技术的不断进步也为专利信息服务数据的管理和应用带来了全新的思路和方法。
因此,本文将在相关研究的基础上,对专利信息服务相关数据进行分类,深入挖掘数据的应用方法,形成科学有效的数据管理体系,为高校图书馆资源的优化配置寻求方法,为专利信息服务内容的拓展提供思路,为专利信息服务质量的提升创造条件,为知识产权中心的快速发展探索方向。因此,本文将在借鉴前人研究的基础上,对专利信息服务相关数据进行细致的分类,深入挖掘其应用方法,旨在构建一套科学、有效的数据管理体系。这一体系的建立,不仅有助于高校图书馆实现资源的优化配置,为专利信息服务内容的拓展提供新的思路,更将有力推动专利信息服务质量的提升,为知识产权中心的快速发展指明方向。
2. 专利信息服务相关数据的分类
2.1. 数据的划分原则
专利信息服务作为一种服务类型,包括服务主体、服务客体、服务内容三方面基本要素。服务主体指实践活动和认识活动的承担者,服务客体指主体实践活动和认识活动的对象,而服务内容作为中介将服务主体和服务客体紧密联系在一起。
文中根据服务主体、服务客体以及服务内容的方式,对专利信息服务数据进行类别划分。目前从事专利信息服务工作的人员主要来自知识产权信息服务团队、查新团队、学科服务团队以及情报分析人员团队[12],这些团队基本上都隶属于图书馆。因此,服务主体数据主要来源于图书馆。伴随着我国专利服务工作的迅速开展,高校专利信息服务的对象也从校内的教师、学生,逐渐向校外企业机构的科研人群拓展,因此,服务客体的数据源较多,统称为专利信息服务用户。同时,专利信息服务的内容也日渐趋于多元化、多样化,从传统的基础信息服务不断向新型的深层次情报服务方向拓展,服务内容相关数据源较多,主要产生于专利信息服务的服务过程中。本文基于专家咨询、调查问卷等方法以及实际工作情况,将专利数据进行分类整理,具体的数据分类见表1。
2.2. 数据的分类界定
(1) 服务主体数据
服务主体数据主要指图书馆中专利服务相关的数据,包括专利文献数据、资源使用数据以及专利服务人员数据等。其中专利文献数据是进行专利检索、专利查新、专利情报分析的基础;资源使用数据的有效利用是开展专利信息服务工作的有力保障;专利服务人员数据是专利信息服务质量的有效保障,是增加用户的信任度、忠诚度的有力途径。
(2) 服务内容数据
服务内容数据主要指专利信息服务过程中产生的相关数据,主要包括专利检索数据、专利成果数据、专利培训数据以及服务沟通数据。专利检索数据可作为专利文献的有效补充,加强专利情报服务的深度和广度;专利成果数据不仅是奖励申报、科研立项、科技评估的支撑和依据,也是专利服务人员、科研人员学习和交流的重要材料;专利培训数据的积累和完善,可以帮助工作人员积累培训经验,同时避免重复搜集培训资源的时间浪费;服务沟通数据能够实时动态地展示科研用户的具体需求,保障其科学研究活动的高效推进。
(3) 服务客体数据
服务客体数据主要指专利信息服务用户相关的数据,具体包括用户行为数据、用户档案数据、用户科研数据、用户反馈数据等。用户行为数据是进行用户综合画像以及专利信息推送的基础;用户档案数据是保持用户联系和推送信息的主要渠道;用户科研数据是主动挖掘用户专利信息服务需求的有利途径;用户反馈数据直接体现用户在信息服务过程中的真实感受,是专利信息服务质量和水平的综合体现。
Table 1. Classification of patent information service data
表1. 专利信息服务数据分类
数据分类 |
数据主体 |
数据类型 |
内容 |
服务主体数据 |
图书馆(包括知识产权中心、查新站) |
专利文献数据 |
包括数据库中专利文献资源的利用情况 |
资源使用数据 |
图书馆空间、图书、文献等资源以及活动记录数据 |
专利服务人员数据 |
工作人员的职称、学历、工作履历等情况 |
服务内容数据 |
专利信息服务过程 |
专利检索数据 |
检索相关的论文、关键词、标准规范、政策等数据 |
专利成果数据 |
专利查新报告、检索报告、分析报告等成果数据 |
专利培训数据 |
专利培训需要的、及培训中产生的相关数据 |
服务沟通数据 |
专利服务中与用户沟通产生的相关数据 |
服务客体数据 |
用户(包括个人、机构、高校、企业等) |
用户行为数据 |
用户社交、阅读、浏览等行为数据 |
用户档案数据 |
用户的单位、个人信息、联系方式等信息 |
用户科研数据 |
用户的科研项目、基金、奖项等科研情况 |
用户反馈数据 |
用户对专利服务工作的建议、评价及满意度等 |
3. 专利信息服务数据的管理策略
3.1. 管理思路
Figure 1. Management ideas for patent information service data
图1. 专利信息服务数据管理思路
专利信息服务日渐成为高校图书馆的一项常规工作,其相关数据的管理对于图书馆具有重要价值。专利信息服务工作中产生的相关数据较多,涉及的职能部门较广,对人员要求较高。因此,高校图书馆在进行专利信息服务数据管理时,需要专业化、集中化的专利信息服务数据管理体系,将专利信息服务中产生的分散的、杂乱的、多方面的数据进行整合、统一,同时需要完善的数据管理机制、灵活的流程监控体系、可靠的质量保证体系以及可控的安全体系来保障管理体系的有效运转。数据管理体系的构建不仅可以节约重复收集数据的成本,促进资源的合理优化利用,还能帮助专利服务人员以及科研人员快速查询、反馈和管理专利服务成果。具体管理思路如图1所示。
3.2. 管理流程
基于数据管理思路,专利信息服务数据的管理流程主要包括采集管理、存储管理、应用管理以及存档管理四个重要环节,每个环节都有不同的核心要素。专利代表着企业和机构的核心技术,具有较高的商业价值和市场利益。和图书馆其他数据比较,专利信息服务数据要求最高级别的保密协议和安全保障。因此,要对专利信息服务数据的整个生命周期进行安全管理。
3.2.1. 数据采集管理
数据的采集需要遵循全面、真实、准确、及时的原则[13]。高校专利信息服务不止面向校内,还面向校外。专利信息服务数据的获取渠道主要有三方面:①校内:图书馆方面的数据主要集中在资源建设部、采访编目部、系统技术部等部门,一些补充数据如读者教务信息数据、校园设施使用数据、部分社交数据等则需要与校内教务处校园卡管理中心、网络中心等学校其他职能部门合作获取。②校外:科研人员身份数据、用户科研数据的获取都需要企业人事处、科技处等部门的协作配合获取,且长期合作的企业机构较容易获取相关数据;③网络:网络可以记录用户的浏览数据、文献检索记录、社交互动信息等,这些数据具有较高的研究和应用价值。因此,职能部门的积极配合,专利动态服务协作网络的建立,是专利数据采集的基础。
专利信息服务数据具有类型众多、格式多样、关联复杂、更新迅速等特征,这也给数据的有效捕捉带来一定困难,但人工智能、大数据、云计算、物联网等高新时代的来临,也给数据的获取提供新的手段。因此,专利信息服务数据的采集需要专业的计算机、网络等人员,利用专业的工具、专业的挖掘方法进行获取,不断整合、及时更新,确保数据的时效性和全面性。在专利信息服务数据在采集过程中,需要和合作单位签署必要的安全协议,确保数据源的安全。
3.2.2. 数据存储管理
数据的存储应遵循有序化、层次化、可检索、可识别的原则。首先,对采集到的原始专利服务数据,必须进行清洗、处理等,剔除重复、多余、错误、不合法的数据,填补缺失数据,数据处理过程中要充分保证数据的正确性、完整性、一致性,如利用人工智能技术提高数据清洗、数据处理的效率和准确性;其次,制定各类专利数据的标准化规则,进行整理和存储,并对每一类、每一层数据信息设置访问权限,高级管理人员和专利分析人员的权限应该有所区别,根据技术领域、申请人、发明人等不同维度对专利数据进行分类存储,同时利用机器学习算法和自然语言处理等方法,进行数据的高效检索和快速查找,例如不同高校的知识产权中心涉及的专业学科方向有所区别,在数据存储的时候,基于学科发展特点,保存规范和访问人员也应该略有所区别。最后,专利信息服务相关数据较多,要创建功能健全的数据标签,对数据存储位置、存储期限、内容质量、格式等进行描述和说明,便于检索和使用。
在数据存储过程中,也要非常注重专利信息服务数据的保密管理。对服务成果等重要数据,需要和用户进行重点沟通,对数据所有权的归属问题和访问权限应该予以相关文件说明,避免不必要的纠纷。同时数据管理者应树立用户隐私保护意识,严格遵守职业道德,同时要确保数据的信息安全,不被不良渠道窃取盗用。
3.2.3. 数据应用管理
专利数据具有非常高的应用价值,运用大数据分析技术,可有效挖掘专利数据中的隐藏信息和价值,为用户提供更深层次的数据分析服务。目前,大多数高校图书馆都配置一定的专利资源和工具,且成本较高,但多数资源没有被很好地利用起来。高校图书馆应充分利用自身的信息资源与人才技术的优势,将网上免费的专利数据库资源和图书馆采购的付费专利资源进行整合,建立开放可取的图书馆资源建设与利用数据库,节省图书馆购置经费,提高资源利用率[14]。
各高校图书馆以及专利培训机构所拥有的培训资源不尽相同,高校图书馆在平时的学习工作中应广泛搜集和积累,包含数字、表格、图像、视频、音频等方式呈现的在实验、调查、访谈、数据分析等各种过程获得的专利信息服务相关数据[15],并统一标注和管理,形成培训资源库。在平时的专利培训、会议交流、论坛学习中,更要加强专利成果报告数据的搜集和积累,形成专利成果数据库,并对这些数据及时汇总、更新、编号和整理。在进行专利检索和分析的时候,对检索过程中出现的关键词、查新点以及学术文献,都需要不断的积累和完善,形成专业词库、查新点库以及专业文献库,并根据学科专业进行分类和完整保存。
对专利用户的注册数据要进行严格的系统审核和保存,避免用户的反复注册。同时,通过将用户注册数据形成对应表单、文档,形成可挖掘使用的数据格式。对主要来源于网络的专利用户阅读、社交、浏览等行为数据,需要工作人员采用标签等方式,进行分期、分段、分类的整理和记录,不断完善用户行为方式和特征,形成用户行为数据库。用户反馈数据需要按照反馈主题、反馈时间、反馈类型等分类、分时进行归纳和分析。对这些专利数据二次应用的加工数据,也需要按照专利数据的管理方式进行管理。
3.2.4. 数据存档管理
对不再经常使用或已经完成的专利信息服务数据,需要按照统一化、标准化的格式进行数据存档,且需要具有索引和搜索功能,便于查询和使用。存储方式也较多样,比如专利查新报告主要以电子版和纸质版两种方式保存,用户信息则以表格、表单为主的电子形式保存。为了防止由于人为失误或系统故障造成的数据损失,一般都要对数据进行备份。尤其对专利成果报告、培训资料等重要数据,都需要稳妥的备份。图书馆可以根据自身空间、经费、技术等情况,选择合适、安全的备份方式,避免存档数据的丢失和篡改,保证数据的有效备份。
数据存档应具有兼容性、持久性和开放性的原则。兼容性可以有效避免在进行专利数据调取过程中,由于系统兼容性差、浏览器和数据格式不匹配等因素造成的影响。专利从申请、授权到转化,专利挖掘从检索、分析到形成报告,都需要较长时间,而数据存档的持久性可以保证数据使用的长期性、重用性,促进科研数据在更长的范围内发挥价值。数据开放共享是时代的潮流和趋势,而数据存档的开放性是促进资源共享的前提。在数据开放环境下,高校图书馆要深化专利存档资源共享的服务理念,在保证数据安全的前提下,提升存档数据共享内容的可信度和多元性,提高数据共享的协同度和连通性,深度融合人工智能、机器学习等现代化技术,形成专利信息服务数据的智能化共享[16]。
4. 专利信息服务数据的应用策略
4.1. 数据的应用思路
专利信息服务数据的应用遵照交互、配合、促进的原则。专利信息服务内容的多样化可以提高专利信息服务数据的丰富性,专利信息服务数据的丰富性又可以支撑专利信息服务工作的多元化。因此,专利信息服务数据的综合合理应用,可以提高资源利用率、专利信息服务质量和用户满意度,其应用思路如图2所示。
Figure 2. Application ideas of relevant data for patent information service
图2. 专利信息服务相关数据的应用思路
4.2. 数据的综合应用策略
4.2.1. 优化资源配置,提高资源利用率
(1) 促进资源共享,优化服务模式
高校图书馆作为前沿科研成果的集散地,丰富的馆藏资源应该以开放、合作、共享的方式去利用[17]。专利信息服务数据的开发利用,可以极大促进图书馆资源的共享和利用,促进专利信息服务模式的优化。对专利文献阅览情况、专利书籍借阅数据、专利文献传递数据、专利文献下载数据、专利库数据使用情况等数据的综合应用,一方面可以帮助图书馆掌握专利资源的精确使用情况,优化数据采购和资源配置;另一方面帮助图书馆了解专利资源的需求热点和关注点,从而为用户推荐更多热门专利资讯。利用图书馆网站资源将网络专利信息、第三方数据库等进行推送,可以促进专利信息知识的推广和知识产权意识的普及,如高校图书馆通过宣传IncoPat新科技检索大赛,吸引大批学生的关注和参与,深入探索专利科技信息的挖掘路径。将专利知识资源、图书资源、空间利用情况等结合,可以开展专利信息培训、专利信息素养教育等服务,如大多数高校图书馆开展的知识产权相关课程、专题讲座培训、知识产权知识竞赛等系列活动。对专利活动记录数据的统计分析,如专利培训参与人数、现场互动情况、活动满意度等,可以进行专利素养教育效果的评估,从而量化图书馆的专利资源利用率。
(2) 优化人员配置,完善工作流程
目前负责专利信息服务的人员较广,学历、职称、工作经历等相差较多,且多数馆员专业背景单一,缺乏多领域相关知识的储备[18],而专利信息服务中的知识协作、协同创新都对工作人员以及工作流程提出更高的要求。服务人员数据的精确掌握可以为专利服务人员的优化配置提供了更多可能性,如开展高精尖的专利决策支持、专利预警等服务,可以让具有科研管理经验、专业背景丰富的博士、研究馆员等情报分析人员主管;一般的专利检索、专利查新工作就可以让具有检索经验娴熟、外语能力较强的硕士、副研究馆员等查新人员负责;专利培训、专利教育等服务就可以让具有教学经验丰富、受学生尊敬的馆员、讲师等学科服务人员主讲;而专利咨询等服务可以让形象良好、沟通能力强的本科生、助理馆员等咨询人员主导。人员的优化配置也促进了专利信息服务工作流程的完善,极大地提高了知识产权中心的资源利用率。
4.2.2. 提供多元化服务,提高服务质量
(1) 加强基础信息服务,拓展专利服务内容
基础专利信息服务是开展高级专利信息服务的基础,且基础专利信息服务数据的加强应用可以拓展专利信息服务的内容。对专利成果报告数据、网络专利资源数据等进行挖掘,可以丰富专利培训资源,从而减少单一培训方式和内容对用户日益增长的知识需求的限制,保障专利培训、专利素养教育的高效开展。如上海交通大学图书馆将专利学堂的讲座内容制作成视频资料放到图书馆网站上,供用户和馆员随时随地观看学习[19]。同时,专利查新中出现的关键词、查新点以及科学技术要点,都可以作为专利检索的有效信息支撑,帮助专利服务人员迅速掌握核心要素和检索要点,保证检索方向的正确性和检索结果的可靠性。专利服务人员在逐渐积累专利查新的基础上,可以通过知识库的积累,逐渐开展课题跟踪、定题服务、专题情报等专利服务,不断拓展专利信息服务的内容[20]。
(2) 深化高级情报服务,提供专利增值服务
当前图书馆对基于专利文献数据的高级情报服务已有一些研究和经验,可以学习和借鉴。如北京大学图书馆将专利信息服务与决策支持服务结合,完成了专利全景分析、学科研究热点预测等工作,并将探索专利纳入科研评价体系的模式[12]。华南理工大学图书馆全程嵌入到科研项目申报、结题、成果转化等过程,为学校科研团队提供一站式专利信息服务,助力该团队获得多项发明授权[21]。中国石油大学(北京)图书馆受教育部科技发展中心委托完成的《全国双一流高校专利分析报告》,为教育部了解全国“一流”高校的“一流”学科建设提供参考依据。专利从申请到公开、授权,具有较长的审查周期,在进行专利分析时,能表征最新技术发展的专利可能还未公开,因此,在进行专利分析时,要尽可能多地搜集与专利相关联的学术、商业、经济、贸易、技术、标准等数据,从而全方面、多角度地增强专利分析的决策性和洞察性。如申请人分析时,可以收集与申请人相关的学术论文、软件著作,及其竞争对手相关信息[22];技术领域分析时,可以搜集该技术领域相关专业基础知识、行业标准以及最新学术文献等数据。
4.2.3. 提供个性化服务,提高用户满意度
(1) 主动匹配用户需求
目前大多数科研人员对专利申请、维护、转移、转化的认识不清、重视度不高,但他们又迫切需要专利授权量、专利转化成果等来提高个人或团队的竞争力,以获得更多科研经费和荣誉奖励。因此,专利服务人员对企业项目、国家基金、高校科研等相关科研数据的分析,可迅速获取用户的科研需求和关注热点,同时通过智能化、多元化等数据挖掘方法的运用,实现用户需求的自动匹配,从而主动为科研人员提供深层次、全方位、精准化的专利信息服务。服务沟通数据记录了专利服务人员在与用户的有效沟通中用户需求的变化,以及课题推进中遇到的困难;用户反馈数据反映了用户对专利信息服务的期望以及服务存在的问题;如嵌入式信息服务团队通过与用户的科研协同交流,结合用户反馈数据,可及时感知用户的长期目标和短期目标,为科研困难提供解决建议,启发用户获得更多科研灵感[23]。
(2) 主动挖掘潜在用户
知识产权服务中心作为一项新兴的服务部门,服务对象的主动发掘是非常重要的。而用户档案数据的分析则是挖掘潜在专利服务对象的有效手段。相比较新用户而言,专利查新用户接受专利情报服务的概率会比较高;大型国企、研究院进行专利培训的机会也会比小型私营企业的概率高;具有长期合作经历的科研机构对该知识产权中心的信任度也会比较高。用户档案数据是构建用户信息平台的基础,档案中的用户身份数据、用户单位数据、用户联系方式等数据都是用户数据的重要来源。同时,用户档案数据中的联系方式,包括电话、地址、电子邮件、微博、微信等数据,都可以作为服务人员进行用户个性化定制服务的推荐渠道,定期将其感兴趣的或涉及其研究领域的专利信息推送给用户[24]。
(3) 主动推送专利信息
大数据环境下的科研用户存在较强的异质性,不同类型用户对专利服务的要求和标准存在显著差异,这些差异性体现在用户的网页浏览行为、社交行为以及阅读行为等数据中。因此,专利服务人员可利用大数据技术,从专利工作数据、网络数据、用户行为数据以及数据库数据中,全方位了解用户的习惯、需求和兴趣,将服务内容、服务方式进行细化,为用户提供精准化、个性化的专利服务。如将图书馆资源、读者阅读行为、读者身份等数据,与读者所学专业课表等教务信息数据结合,为高校学生读者推送相应的专利信息资源;根据数据库点击下载记录、社交网络平台交互、用户移动互联等数据,分析科研人员的专业方向和阅读行为,进行高品质专利信息推送服务[21]。如重庆大学、南京大学等高校图书馆通过将学生阅读信息和专利领域结合,为学生推送相关专业文献和数据库,以此提高学术资源的使用率[13]。
5. 结论
在当前创新驱动发展环境下,开展专利信息服务已成为高校图书馆的一项重要工作,其产生的数据是进行专利信息服务的关键要素,但目前高校图书馆对于专利信息服务数据的管理和应用都比较单一。高校图书馆应做好专利信息服务数据的管理工作,构建集数据采集、存储、应用及存档于一体的数据管理体系,保障专利信息服务工作的高效开展。专利信息服务工作中要重视专利信息服务的主体数据、内容数据以及客体数据的应用,数据的多角度、全方位应用,可以优化图书馆的资源配置,提高图书馆的资源利用率;可以全面深入地挖掘用户的专利需求,拓展专利服务内容及深度;可以帮助图书馆开展多元化、个性化、精准化的专利信息服务工作,提升专利信息服务的质量。未来,需要借助不断飞速发展人工智能的技术和手段,来提高专利信息服务数据管理和应用的成效。
基金项目
本文系2023年北京市高等教育学会面上课题“智慧数字图书馆高等教育服务模式建设研究”(项目编号:MS2023112);中国高等教育学会2023年度高等教育科学研究规划课题“阅读推广视域下高校文明校园建设研究”(项目编号:23XC0403),中国石油大学(北京)研究生院课题“碳中和目标下国内外重点石油高校石油工程学科科研产出分析”,项目编号:yjs2022024的成果之一。
NOTES
*通讯作者。