1. 引言
近年来,高校科研评价的问题愈发得到社会和学界的重视,面对科研评价中出现的诸多弊端,政府陆续出台了多项政策,包括克服“唯学历、唯资历、唯论文”倾向[1]、清理“唯论文、唯职称、唯学历、唯奖项”行动[2]、克服“唯分数、唯升学、唯文凭、唯论文、唯帽子”的痼疾[3]等政策,体现出国家和政府坚持正确的科研评价导向的决心。科研评价是指评价主体根据特定的评价标准,对科研活动中的相关要素进行价值评定,以获得对多数人来说均可以接受的评价结果[4]。科研评价的最终目的不只是科研资源、学术荣誉的分配,评价是交流的一种形式,通过科研评价为学者引领方向、评估得失,进而提供一个公正、有序的环境和管理机制,最终目的是便于人们追求真理[5]。从多个层面回顾、审视我国目前的科研评价体系研究对于提高科研评价的科学性、系统性具有重要意义,为我国进行科研评价体系改革提供更广阔的视角。本文对我国目前不同层面的科研评价体系的研究进行分类和述评,试图为今后进一步研究提供有益的意见。
2. 我国科研评价体系的研究进展
科研评价体系是指评价工作的各个要素互相联系而构成的一个整体,包括评价主体、评价客体、评价目的、评价标准及指标、评价方法、评价制度等。一个合理的评价体系能够正确说明这些要素及其相互关系,避免评价中存在的过分形式化、过分数量化、过分行政化等弊端[6]。对科研评价体系进行理论研究,有利于构建规范的学术科研环境,鼓励学术的良性竞争。本文梳理和总结我国已有的“科研评价体系”的研究成果,指出我国科研评价体系的理论研究成果的详略之处,试图为今后进一步研究提供有益意见。
考虑到文献相关性、代表性及时效性,笔者以“科研评价”为检索主题,以“中文核心期刊”和“CSSCI来源期刊”为文献来源,“科研评价”“高校科研评价”“评价体系”“科研评价体系”为主要主题,自2006~2024年7月,检索到的文献共236篇。根据科研评价体系的评价对象涉及的范围大小,有学者划分出宏观、中观、微观层次,宏观指学术机构(又分学校、学科、专业),中观指学者评价,微观指对单项科研成果的评价[7]。但本文研究对象是我国的科研评价体系的研究成果,上述宏观层面忽略了更广泛的国家科研评价体系,而其所述微观上对于单项科研成果的评价,属于科研评价体系中的因素之一。因此,从宏观到微观,本文将已有的科研评价体系的研究成果分为国家、大学(包括研究所、独立学院等高等教育机构)、学科、高校教师四个层面进行综述。
2.1. 有关国家层面的科研评价体系的相关研究
从国家层面上看,现有的研究成果关注我国科研评价体系存在的普遍问题,如量化评价方法的滥用、评价指标单一的问题,针对存在的普遍问题对未来质性与量化结合、分类评价的发展方向进行展望、提出建议。如苗建军(2020)等提出目前存在的主要问题有SCI至上、缺乏分类评价体系、同行评议活动不完善三个问题[8];高涵、孟照海(2020)指出科研评价体系“中国化”的过程中出现价值取向偏颇、研究方法单一套用国外和其他领域量化方法、研究力量薄弱分散、研究成果时效低的问题,从国情出发提出相应对策[9];王兴山、刘辉(2020)通过对中文核心期刊做可视化分析指出我国科研评价研究集中于体系构建、指标检验、国内外经验借鉴,应逐步重视一般性评价原则的构建、评价体系的检验和质性研究的发展趋势[10];刘梦星、张红霞(2021)发现,目前我国科研评价的主要问题在于科研分类评价不明确、主体多元化不完备、内涵评价不突出、方法整合不到位、管理制度不健全等问题,在针对问题进行未来方向探讨后,进一步提出具体改革行动策略[11]。
在国家层面,除了在理论上对我国科研评价体系的量化泛滥、指标单一问题进行评述,还有学者在实践上从引文索引入手,对量化评价主导的科研评价体系进行本土化适应性改革。在引入SCI、SSCI、A&HCI国际三大引文体系后,我国也在积极进行国内主导的引文索引的构建,如人文社科类CSSCI、RSSCE等中国社会科学引文索引的构建和应用[12],以及田玉琼(2023)在一带一路背景下试图创办能够反映我国及全球学术科技发展状况的“丝路引文索引”,依托其构建中国特色的一带一路国际学术传播话语体系[13]。除了聚焦国内的科研评价体系,我国学者在吸收、学习西方国家的科研评价体系经验上也有丰富的成果,在对单一国家的科研评价体系关注上,澳大利亚RQF到ERA、美国、英国RAE到REF、日本、瑞典FOKUS都是我国学者关注的主要对象,其中对于澳大利亚和英国的研究居多,主要关注点在于各国科研评价的发展历程、总体框架和对我国有价值的启示[14],以及通过不同国家科研评价体系的横向对比和纵向发展揭示科研评价的演进特点[15]。
2.2. 有关大学层面的科研评价体系的相关研究
从大学的层面上,不同类型大学具有其特色的办学理念,如地方高校重视对当地的社会影响、新型研究型大学强调应用型研究、教学研究型大学具有“教学为主、科研为辅”的特点,部分学者认为在不同类型的大学中,应根据其自身办学定位、办学特色调整科研评价体系的侧重点。如对地方高校的科研评价的研究中,盛永红、曹能秀(2022)认为兼顾学术影响与非学术影响将作为地方高校科研评价的新趋势[16],而徐红(2019)等认为地方高校构建科研评价体系重在以“质量”和“创新”为取向[17];对新型研究型大学的科研评价体系而言,新型研究型大学区别于传统研究型大学,聚焦于几个优势学科或学科群、以社会需求为出发点,依托更灵活的制度和形式开展应用型研究[18],针对这类大学本身性质与特色,黄飞燕(2022)认为分类评价体系更为适切,基础研究重点评价原创性和科学价值,应用研究重点评价解决实践技术问题的实际贡献,鼓励标志性成果和代表作制度[19];对教学研究型高校而言,教学研究型大学特点在于教学为主、科研为辅,科研服务于教学的基础上实现教学科研协调发展,针对这类大学林继志、张向前(2010)提出定量与非定量相结合的指标,构建教学研究型高校的科研评价体系[20]。
2.3. 有关学科层面的科研评价体系的相关研究
进一步深入到学科层面上,关于人文社会科学的科研评价体系讨论始终都是研究的热点。本世纪初,从基本框架的初步设计到各评价要素的讨论与完善,人文社会科学的科研评价体系的建构经历了一个成果频发的高峰期:邱均平、谭春辉(2007)首次系统地针对人文社会科学研究评价体系的构建展开研究,初步设计了评价的基本框架[21];朱少强(2007)在其博士论文中为我国人文社会科学研究评价体系建立了一个系统的理论分析框架,包括环境基础分析、理论基础分析、 现实基础分析,并在此基础上结合我国实际情况提出13点改进意见[22];陈志强(2009)等人将国内哲学社会科学科研评价的发展分为分散研究阶段、有组织研究阶段、发展与争论并存阶段三个阶段,聚焦评价原则、评价方法、评价体系构建三方面进行了系统的综述,提出评价的不足之处在于没有将评价作为一个动态系统进行分析、科学共同体内的交流不够、同一学科的小同行专家太少等问题[23],并进一步针对提出的问题,引入软系统方法论(SSM)尝试构建我国哲学社会科研评价体系[24];叶继元(2009)在首届人文社会科学评价学术研讨会中总结了会议概况,围绕评价理论和方法、 同行评价、期刊评价、质量问题等热点难点进行广泛交流[25],并于次年系统论述了人文社会科学评价体系的各个要素与子要素[26],是国内关于人文社会科学评价体系的主要成果[27]。
后期,随着网络技术的蓬勃发展,信息化、数据化的背景日益凸显,人文社会科学的科研评价体系与大数据的关系也变得日益密切,大数据深度参与进人文社会科学评价体系的过程中既带来发展,也伴随着争议,在量化的大趋势下保证人文社会科学科研评价的质量成为研究热点。如马力的博士论文(2016)在信息化、数据化的社会背景下,围绕着大数据与社会科学评价深度契合的相互关系,探索大数据与社会科学评价良性互动发展的路径以提升社会科学评价的科学性、客观性、公正性、有效性[28];季庆庆(2018)通过高频词共词分析,采用聚类分析等方法,发现我国高校人文社会科学科研评价的热点集中在绩效评价、成果评价、学术期刊评价、科研指标评价、考核评价等,“以刊评文”现象和学术共同体评价逐渐引起关注[29];王文军(2020)在响应国家反“五唯”任务时也提出在哲学社会科学界,需要正确处理好四个关系:专业评价和社会评价相适应、量化分析和质性评价相融合、同行评议和精英评价相补充、历史评价和当下评价相统一,才能不断提高哲学社会科学评价的公信力、科学性、公平性和权威性[30]。在关注国内人文社会科学评价现状的同时,我国许多学者也致力于通过介绍、对比分析欧美国家的人文社科评价体系的特点与优势,吸取国际经验,为完善我国人文社科评价体系作出贡献。研究主要集中在澳大利亚、英国、美国、荷兰、德国等欧美国家,一些学者通过对某一国家人文社科的评价体系的特点进行详细研究,如刘兰剑等(2015)通过荷兰的人文科学评价体系分析发现,荷兰是国家主导的评价模式,其科研评价与经费分配不直接关联,人文社科评价工作制度化程度高、国际化水平高、在各个学科的评价上施行统一的评价标准[31];澳大利亚同样是由国家主导的评价模式,杜向民等(2015)总结了澳大利亚的人文社会科学的评价注重同一平台、统一标准,也注重科研成果的效益评价,强调代表作在人文社科评价中的重要性等特点,对于我国不同层面高校、不同地区评价标准不同的现状有重要借鉴意义[32]。除了对单个国家的人文社会科学评价体系进行介绍外,还有学者通过美、英、法、加、德主要欧美国家的对比研究中寻求发达国家人文社会科学评价的共性,为我国科研评价体系建设提出建议[33]。
除了人文社会科学的科研评价体系得到广泛关注,学科层面上具有强烈特色的领域也得到一些学者的专门研究,如应用型的单独学科、跨学科、新兴的交叉学科。应用型学科中,尤其艺术学科和医学,注重构建基于学科特色的科研体系,如庾光蓉(2011)等基于音乐学科应用实践的重要性,从音乐理论研究和音乐创作表演并重的角度构建音乐科研评价体系[34],罗晶(2022)基于艺术学学科鲜明的实践特征,从理论研究、应用对策研究、艺术创作三个方面构建艺术学科科研评价体系[35];在医学学科中,冯丹、冯泽永(2016)指出,目前高校附属医院的科研评价体系中,存在医院和对医生的评定考核中SCI占比过高、研究气息浮躁、与医疗实践相脱离等问题,而医院和医生的核心竞争力在于医疗水平和临床服务,主张在科研评价时区分不同类型医生的职称、降低SCI的占比来改进医院的科研评价体系[36]。除了应用型单独学科的研究外,魏巍的博士论文(2011)对“跨学科”进行定义,探讨了“跨学科”研究所具备的属性,并指出“跨学科”的科研评价存在的问题,针对这些问题形成了跨学科研究评价的原则和改进同行评议的进路以及调整文献计量跨学科研究的方法[37]。此外,我国的交叉学科是新兴的研究方向,2021年国务院学委员会颁布的《博士、硕士学位授予和人才培养学科专业目录(征求意见稿)》引入交叉学科门类,标志着交叉学科在我国正式制度化,杨佳乐(2022)指出交叉学科科研评价面临传统学科科研评价普遍问题、学科交叉科研评价共性问题以及交叉学科科研评价特殊问题,亟须系统变革[38]。
2.4. 有关教师层面的科研评价体系的相关研究
最微观的是高校教师层面的科研评价体系,这与教师的聘任、晋升和成长息息相关,现今对教师的科研评价存在诸多问题,“非升即走”的规定给青年教师带来很大生存压力也不利于学术生态的良性发展,李金春(2008)认为教师评价制度不仅要促进大学组织的发展,还要促进教师个人的发展[39];熊彩纯(2008)提出高校教师应采取分级评价,针对讲师、副教授、教师不同发展阶段的教师制定具体的评价标准[40];徐燕刚、庾光蓉(2011)指出“现行高校教师科研评价体系更多侧重于管理规律中的效率体现,关注科研管理的规范、效率和指标实现”,为克服现有体系的局限性,主张采用“成长导向型科研评价体系”,以教师为本位,发挥个性和特色,更有利于教师成长和科研创新[41];沈红、刘盛(2016)指出大学教师评价被物化逻辑渗透,要明确树立教师知识生产中不可物化的部分,追求“质”的学术产出,强调增强评价的民主性以体现教师的主体性,增强评价的内生性以提高教师的反思性[42];张燕航(2016)从高校教师科研评价存在问题、对评价方法运用、评价体系建立的人性假设基础、发展性评价四方面对高校教师的科研评价研究进行了较全面的综述梳理[43]。
3. 我国不同层面科研评价体系的研究成果的优势
目前,我国关于不同层面的科研评价体系的研究大量涌现出来,研究成果在积极的一面表现出较为全面和具有广泛的国际比较的视野的特点。
第一,我国不同层面的科研评价体系研究成果较为全面。无论是纵向的维度涵盖了宏观的国家层面到微观的教师层面,还是横向的维度,如学科层面上从人文社会科学与自然科学的分类研究,到新型的交叉学科评价研究,以及根据单个学科的特性进行评价的细化,都体现出科研评价体系层面的丰富性。一方面可见科研评价体系的研究在我国呈现出百花齐放的特质,另一方面可见我国学者充分认识到科研评价的研究在提升科研质量水平方面的重要性。
第二,我国进行科研评价研究时具有广泛的国际比较的视野。既关注发达国家总体科研评价体系的介绍与分析,也注重对欧美国家人文社会科学评价体系中的优势学习借鉴。在学习澳、美、英、日、瑞典等发达国家的科研评价体系经验时,既对单个国家的科研评价体系做详尽的发展过程梳理和原因探究,也通过多个国家比较总结出共同经验,最终落脚于对我国科研评价体系理论和实践的启示,如采用国际化的评价标准、分类指标体系、国家委托中介机构、评价结果与科研拨款相联系、强调科研产出、重视质更甚于量等都值得借鉴。在人文社会科学科研评价体系的国际比较中,由于人文社会科学的研究对象——一定社会背景下的人的精神世界和社会现象,其具有多样性,研究周期长、引用周期长的特性[41],发达国家提供了丰富的国际经验,如采取针对性的评价机制,如延长评价周期、以质量为中心、兼顾效益与社会长期影响力、实行代表作制度等,可以为我国的实践提供参考。
4. 我国不同层面科研评价体系的研究成果存在的问题与建议
在取得一定成果的同时,也存在一些问题,我国的科研评价体系研究侧重明显、个性与共性的平衡难以把握、国别比较中缺少纵向领域的深入研究,以下具体说明,并针对性提出改进建议。
我国各个层面的科研评价体系的研究成果侧重明显。学者对国家整体科研评价体系、不同类型大学的科研评价体系、人文社会科学评价体系、高校教师科研评价体系的关注度高,相比而言,对科研机构、研究所、单独学科、新兴学科、交叉学科等科研评价体系的研究成果有限,数量和质量上都有很大的提升空间。与大学兼顾教学与科研的职能对比,科研机构、研究所的研究职能更为突出,教学职能较弱,由于机构的性质不同,科研评价的目的、方法、标准在一定程度上有必要作出区分;新兴学科和交叉学科的科研评价体系研究尚处于起步阶段;单独学科的科研评价体系研究呈现出零散、不成体系的特点。根据以上情况,呼吁更多具有专业背景的学者参与科研机构、研究所的科研评价体系研究,组成研究群体,形成更有影响力的共识。
科研评价体系在共性与个性的平衡难以把握,需要得到学者更多关注。在不同类型的大学层面上,学者关注较多的是依据各大学办学特色的差异,个性化改进现有的科研评价体系。过分强调科研评价体系的共性会忽视差异,忽视各大学类型特点,但个性化考虑过多会导致科研评价体系的冗余,也会损害评价指标的统一性。同样地,在学科层面上也存在类似的问题,学者在依据单独学科、跨学科、交叉学科的学科性质调整评价指标时,也需要考虑在评价指标上一方面要遵循统一的科研评价标准符合规范,另一方面也要符合单独学科、新兴学科或交叉学科的学科特性进行适当的指标调整,例如单独学科的评价如果都依据本学科特性进行细分,容易导致科研评价标准复杂、评价过程成本过高等各行其是的问题,不利于评价的管理。据此,提出两点建议:其一,对不同类型大学更深入研究,把握其核心类属作为科研评价体系的重点。其二,在充分考察各学科的实际特性后,可将单独学科转换为学科群统一管理,如实操性、应用性强的学科可以考虑作为应用性学科群制定统一的评价标准等。
国别比较中侧重横向比较,缺少具体领域的纵向深入研究,在实践上难以落地。科研评价的国别比较中,我国对于欧美国家的科研体系的特色分析、优缺点介绍和可借鉴的创新之处都进行了大量研究,主要包括英、澳、美、法、德等国,但大多数学者研究的都是宏观层面的国家和学科层面的科研评价体系。因此,建议研究者对于具体的某个国家某个学科或学科群进行深入研究,有助于落实具体的评价过程,也有利于在实践中吸收切实可行的经验。
5. 结论
本文梳理和分析目前我国科研评价体系的研究成果,从国家、学科、高校、教师四个层面进行梳理,从积极的一面来看,已有的研究成果涉猎范围广泛,一方面宏观到微观研究纵深发展,同时横向学科差异性探究成果丰富,另一方面,已有研究注重国际视野,通过比较研究学习借鉴别国经验。但也存在不少问题,比如研究侧重明显,对于大学之外的研究机构、新兴学科、交叉学科等研究兴趣不足;个性与共性难以平衡;国别比较缺乏深入应用性探究。对此本文尝试提出相应的建议,呼吁建立科研评价体系的群体性共识、进行学科群统一管理评价、深入具体国家具体学科进行实践性探究等。对于建设我国以质量为导向的科研评价体系具有一定参考意义。