Institutional Guarantees for the Trustworthy Trading of Public Data
In the new era, the utilization of data elements is inseparable from the trading of public data elements. However, the current situation lacks a trustworthy trading environment that can inspire and maintain trust for this new form of trade, which requires dual protection of law and technology. By cross-disciplinary induction of trust and refinement of intrinsic requirements, a credible order governance path from both a static perspective and a dynamic perspective can be formed. Firstly, establish a standardized public data infrastructure system to ensure data quality and security from a static perspective through standard systems; secondly, for the basic process of public data trading, take the in-venue trading as the main approach, and provide full-process protection by data registration, privacy design, and responsibility distribution, to provide institutional guarantees for a trustworthy trading environment of public data.
Trustworthy
在数字化时代,数据被认为是一种新的生产要素1。公共数据作为其中的一部分,涵盖了人口统计、经济指标、环境状况、交通流量、医疗资源、教育水平等各个领域,其重要性在科研、文化、交通运输等方面不言而喻。为更好地释放和实现数据价值,2022年12月,《中共中央国务院关于构建数据基础制度更好发挥数据要素作用的意见》(简称《数据二十条》)发布,指出要“探索有利于数据安全保护、有效利用、合规流通的产权制度和市场体系,完善数据要素市场体制机制”,并在关于建立合规高效、场内外结合的数据要素流通和交易制度中重点指出“加强数据交易场所体系设计,统筹优化数据交易场所的规划布局,严控交易场所数量”与“引导多种类型的数据交易场所共同发展,突出国家级数据交易场所合规监管和基础服务功能,强化其公共属性和公益定位,推进数据交易场所与数据商功能分离”2。可见,公共数据作为我国新时代的重要财富,如何设计规则以促进数据交易与实现数据价值释放已成为一个重要的时代课题。
(一) 公共数据交易的基本结构
1) 一级市场交易与二级市场交易
公共数据的开发程度将决定其在何种程度上能够影响和推动经济和社会的进步。但是,由于政府及相关授权机构在专业分工和技术能力方面的局限性,即使其掌握大量公共数据,仍在公共数据利用的增值性方面表现不佳,使其充分挖掘公共数据巨大潜能的过程受到限制。因此,引入具备数据开发能力的市场主体参与数据要素流通与交易将有利于扩大数据的应用领域,最大化公共数据的潜在价值
“一级市场”的主要职能是促进公共数据要素供给。政府及其授权的组织在实施公共管理和服务过程中收集和形成海量数据,政府部门具备公共数据资源持有权,以公共数据资源的“加工使用权”和“产品经营权”为标的物进行流通配置。经具备特定技术能力与符合特定资质要求的市场主体对公共数据要素的开发利用,以及相应的公共数据资源交易收益合理分享机制,允许并鼓励各类市场主体提供公共数据的相关服务,提高公共数据主管部门、提供方提高公共数据资源的供给数量、规模和积极性。当公共数据要素被处理加工后转化为不同形态的可用、有价值数据后,便成为数据产品,进入“二级市场”流通配置。该环节由获得授权的运营主体为中心,以数据产品、服务供需调节等市场化机制为基本运行逻辑,以公共数据产品和服务的使用权为标的促进交易,为数据产品需求方的各类生产经营活动助力
2) 场内交易与场外交易
基于上述交易结构的垂直分级,数据交易在水平面向上可被分类为“场内交易”与“场外交易”。数据场内交易是指通过特定的数据交易场所完成的交易形式,有助于攻克数据确权难、互信难和监管难等问题
(二) 公共数据交易的信任障碍
《数据二十条》在指出“构建促进使用和流通、场内场外相结合的交易制度体系”之前,将“建立数据可信流通体系,增强数据的可用、可信、可流通、可追溯水平”作为工作原则。因此,对于公共数据要素的交易制度设计,应先以“信任障碍”为着力点进行分析。
1) 公共数据交易缺乏足够的信任激励
信任激励是指在社会交往、经济活动或其他合作过程中,通过各种机制和措施来增强各方之间的信任感,从而降低交易成本、促进合作顺利进行的一系列制度安排和行动。在公共数据交易的背景下,信任激励尤为重要。若缺乏必要的激励措施,则难以激发各参与主体的内在动力,导致规范的效力在实践中大打折扣。
当公共数据被引入交易环境时,其作为生产要素的角色意味着需要在社会生产和再生产领域中重新定义其价值。这一过程中,技术的发展和社会关系的演变导致原有的社会性关联发生变化,形成了新的社会关系。例如,数据在交易过程中基于其“无体性”容易导致使用不透明的问题,“使用不透明”承载的交易关系便是一种新的社会关系。这种变化带来的信任缺口,尤其是在制度设计上,需要填补由此产生的真空。同时,数据的“无体性”仅是其技术特征的一部分。技术的不断进步使得公共数据的潜在利用方式也在不断变化,公共数据交易的不确定性增加。法律和规则的滞后性,以及技术规范与实践之间的差距,都对公共数据交易的规范性调整机制提出了挑战。因此,规范性机制提供的一个可执行的信任环境对于维护社会秩序和促进公共数据交易至关重要。基于公共数据具有公共物品的特性,其供给和分配不应完全依赖于市场机制。这既超出市场自我调节的能力范围,又缺乏自由主体自发形成社会秩序的原因和动力。因此,公权力机关需要介入,通过制定明确的规则和标准,建立一个稳定、透明、可追溯的信任环境,以促进公共数据的有序交易和有效利用。
2) 公共数据交易缺乏对信任的维护机制
与信任激励相对应的是信任产生后对其相关矛盾的治理和维护。尽管数据交易行业仍处于早期发展阶段,但已经出现了一些挑战,需要通过有效的治理机制来解决。首先,交易市场中的信息不对称现象较为普遍,这导致数据需求方在缺乏充分信息的情况下难以做出思考全面的交易决策,进而可能影响到交易的公正性。其次,数据在交付和使用过程中的监管存在难题,由于数据质量、权属和来源的验证过程复杂,加之技术限制和数据的时效性,即便数据在初步审核时符合标准,在后续的交付和使用中仍可能出现问题。此外,数据的易复制性也可能带来滥用风险。为了应对这些挑战,一种应对方式是着重事前预防,通过各式文件、资质、认证构成安全防线,但在技术与法律双重滞后的规范现状下,人们本就难以预料事故发生的完整情形与样态,事前预防的效力势必难以落实;另一种应对方式是法律制度的规范方式,在体系设计完善并明确法律义务的前提下,对公共数据交易的活动建立一套完整的问责制度,以控制交易主体对履行风险的预期始终处于可信赖的幅度内,通过分配合理且严格执行的问责制度进一步维护市场主体已建立的信任。
3) 公共数据交易缺乏可信的技术保障
公共数据交易过程中的技术保障因为现有的治理机制和规范架构尚未完全适应公共数据交易的动态性和复杂性,导致现有的技术要求虽然涵盖了数据登记、流通、授权管理、数据运营以及区块链系统等多个方面,但可能在实际操作中仍存在不足。
例如,在平台间数据传输的互联互通方面,尽管提出了协议互联、接口互通等要求,但不同平台间的兼容性和互操作性可能仍存在问题,影响数据流通的效率。在交易过程中的可追溯性问题上,难以清晰追溯数据的来源、流向和处理历程,使得交易的透明度和信任度降低。公共数据交易的对象主要是社会群体,社会群体对公共数据的交易性利用则是智能技术对数据的深度挖掘,因此在主体和形式上都存在复杂性和不确定性,这使得整个数据流动过程缺乏透明度和可验证性,从而产生对流通过程的不信任
在当前社会学研究的热门话题中,“信任”作为一个跨学科的多维度主题引起了广泛关注。然而,在法学领域,对于信任的研究却相对欠缺
M.Todd Henderson与Salen Churi认为,信任可被分为“政府信任”“商业信任”和“个人信任”
(一) 公共数据可信交易的内在要求
1) 透明性
结合经验信任的构建逻辑,最原始的信任构建方式即依赖于熟人社会的特定结构而产生的信任
在精密而多元的现代社会中,信息的泛滥使得信息不对称成为社会运行的常态,因此人们在面临选择时总是希望能够获取尽量多的有价值的信息以避免自己处于信息不对称的弱势地位,或是陷入信息短缺的内在焦虑、只能依靠短缺的信息和自己的想象进行决策,这会导致决策者对于信息和环境的不信任、不满足,对信任的产生造成阻碍
2) 问责制
代入制度信任的构建逻辑,信任之所以因此产生是因为法定或约定的义务的存在使背信的行为会招致相应的惩罚。而在问责制不健全的环境下,责任主体无法承担其应承担的责任,这便成为数据流通中的一项严重障碍,阻碍了数据供给方与需求方的合作意愿,降低了数据交易的可信度。因此,为构建可信赖的交易模式,必须压实、推动各方主体依法依规承担法律责任。由此引出可信的内涵之一:问责制。
公共数据交易从数据收集到使用呈现出一条绵长的数据链条,在交易事实庞杂、参与主体繁复的交易状态下,在数据从初始持有者流向多个使用者的过程中,发生的数据事故可能涉及多个环节,责任究竟应由哪个环节负起,成为一个问题。数据流通链路的不透明性和复杂性使得数据的追踪和溯源变得异常困难,这使得追溯到责任主体需要付出巨大成本。此时,责任不清风险意味着在数据流通过程中,难以清晰地界定数据事故的责任主体,即使一方的利益受到损害,也难以明确责任主体。在公共数据交易的整体环境下,模糊的责任分配机制容易演变成责任推卸机制,进而容易使得公共数据交易的相关实践范围不清晰,公共数据交易发展的合理空间被挤压
3) 标准化
实现标准化有助于提升公共数据交易的可信度。在法律标准化方面,Merrill发现,越陌生的关系之间用于描述权利内容、变更方式、救济途径等规则的标准化程度越高,反之在信托关系或房东与房客等长期维护的信赖关系之间,相关规则的标准化程度会相对下降,如由沉默的意思表示所延续的不定期租赁合同
(二) 公共数据交易的可信秩序治理
信任激励的机制本质上是制度的建设,这是对标准化的贯彻。标准化建设能够弥补制度差异的空白,为公共数据交易提供一套统一的规范和流程。然而,公共数据交易的复杂性和多变性意味着,标准化建设只能作为治理机制的基础,而非全部。因为公共数据针对不同的业务目的和需求会展现出不同的交易场景,很难制定一套放之四海而皆准的制度标准供各个场景去套用。例如,政府部门的统计数据与医疗健康数据在交易时所面临的风险和需求是不同的。统计数据可能更注重数据的完整性和时效性,而医疗健康数据则更侧重于隐私保护和数据的准确性。因此,公共数据治理必然表现出个案化的特征,这要求治理机制必须具备灵活性和适应性。标准化的制度建设是信任环境形成的起点,真正有效的可信秩序形成框架,需要将视角从静态的公共数据本身转移到动态的数据交易行为中来,将公共数据交易流程作为可信秩序治理的实现对象。在公共数据交易的动态化实践中,建立起相应的风险分配机制。通过动态化治理配合静态式规制,为公共数据交易的秩序提供一个可以信赖的制度环境,是形成公共数据持续稳定有序交易的关键。
在数据标准化的静态治理视角下,数据本身是一种信息的记录,对其信息质量的要求,包括对获取方式、采集途径、储存方式的要求,也包括在进入流通市场后交易主体对公共数据资源的流转过程的可靠性、真实性的信赖。这些要求构成了公共数据交易的基础保障,是建立信任的前提条件。公共数据的标准化治理涉及到数据的采集、处理、存储、传输等多个环节。在数据采集阶段,需要确保数据来源的合法性和数据采集的准确性;在数据处理阶段,需要对数据进行清洗、整合和脱敏,以提高数据的质量和可用性;在数据存储阶段,需要采取适当的安全措施,防止数据泄露或被非法篡改;在数据传输阶段,需要保证数据传输的安全性和稳定性。即使公共数据持有者自觉满足上述安全性的要求,如何验证数据的质量和安全性,如何确保数据交易的合法性和有效性,仍是静态治理视角下需要解决的问题。可通过社会第三方主体提供的信用背书,配合动态的责任界定方式与权益补救方法以获取数据交易过程中接收方的信赖。
在数据流通的动态治理过程中,公共数据交易行为涉及三组信任关系,一是供方对需方在公共数据的使用过程中处理行为的合法性信任;二是需方对供方在数据获取时数据共享行为的规范化信任;三是供需双方对第三方中介主体的非利益性、公允性的信任。这三种信任关系构成公共数据交易的基石,形成一条完整的数据流程链路。为建立和维护流程中三组信任关系的落实,首要的是安全技术方面的全流程控制,也即此时的信任问题首先是管理能力的问题。其次,在建立一套完善的数据交易规则和流程的基础上,明确交易各方的权利和义务,通过公正的数据交易纠纷解决机制,对交易过程中出现的纠纷进行公正、高效的处理,维护交易各方的合法权益,以利益衡平与责任分配为目的的问责式规范结构才能动态展开。公共数据交易的可信秩序治理是一个系统性工程,需要从静态的标准化制度建设和动态的技术监管两个维度进行综合施策。通过强化第三方信用背书、完善责任界定与权益补救、促进技术与制度的融合、建立动态的行为规制与追责机制,可以有效提升公共数据交易的信任度,促进数据的交易与流通,为智慧社会的建设提供坚实的数据支撑。
(一) 公共数据可信交易的基础设施制度
基础设施通常指的是为社会生产和生活提供基础性、公共性服务的设施,为国民经济和社会发展提供全面支撑与保护,以避免遭受大规模的安全风险,是国民经济和社会发展的基石。在数据层面,基础设施则特指那些支撑数据收集、存储、处理、传输和应用的一系列技术和服务系统。具体来说,数据层面的基础设施包括但不限于数据存储设施(如数据中心)、数据传输网络(如互联网、专用网络)、数据处理平台(如大数据分析平台、数据挖掘工具)、数据安全系统(数据加密、访问控制、防火墙等)、数据服务平台(提供数据访问接口、数据查询服务)等。《数据二十条》对数据基础设施的建设提出要求,应建立集约高效的数据流通基础设施,以实现为场内集中交易和场外分散交易提供低成本、高效率、可信赖的流通环境的目的。以集约高效为宗旨,为实现可信任的目的,结合公共数据在交易流程中对基础设施功能面向的依赖,数据基础设施应从体系上获得新的设计。从数据收集到流通使用,在基础设施内部可被分为四个层面以实现功能:互联基础层、资源接入层、计算控制层和流通服务层。
互联基础层首先提供了数据流通所必须的计算、储存及网络功能,同时响应《数据二十条》对标准化建设的号召,运营互信且制衡的数据互联网络,强调为跨节点的数据共享或计算需求提供一套数据流通互联互通协议,以实现不同数据主体之间的过程协同,致力于维护有序控制、高效连接的数据流通环境。在数据规模不断扩大、维度不断丰富的条件下,构建一个全国互通的交易体系才能实现数据价值共享。
资源接入层提供数据资源的接入能力,通过数据登记补充交易主体所需要的资源信息,保证数据来源可信、合法合规。确保数据的来源明确且数据的质量得到保证,是实现数据安全交易和增强各方参与者信任度的关键前提。《数据二十条》曾在企业的数据治理责任中强调,应建立健全数据要素登记及披露机制,增强企业的社会责任。在公共数据交易的过程中,首先不乏企业作为需方参与数据交易,其次在交易关系中,公权力机关以私主体的身份进场,应参照企业所承担的社会责任要求自身,因此,对登记制度的贯彻在公共数据交易的过程中仍是重要环节。
计算控制层提出数据流通过程中的安全性要求,是数据交易的核心诉求。数据投入交易前的脱敏及去标识化、储存和传输过程中的加密处理、对流通过程的全程监控留痕皆是该层面所强调的内容。《数据二十条》鼓励行业等社会力量积极投入数据流通相关的技术研发和服务、鼓励探索数据流通安全保障技术,正是认识到技术路径对于可信流通机制的关键作用。依托去标识化、隐私计算、智能合约、区块链等可信技术手段,实现多场景、多形态的数据安全流通,满足“数据可用不可见”“防止数据超范围使用”等要求。
流通服务层根据各方订立的契约提供数据服务,同时根据数据使用过程中的日志存证对各方的履行及产生的收益进行利益分配。虽然《数据二十条》强调“建立体现效率、促进公平的数据要素收益分配制度”,但从行文逻辑分析,收益分配问题与数据交易制度问题并行,可见逻辑上并不属于数据交易制度的子问题。从问题实质分析,结合数据交易可信秩序的需求,收益分配问题并不能贯穿从公共数据标准化治理的静态规制到数据交易行为的动态治理的整个可信秩序形成过程,因此只是数据交易过程中、可信秩序激励之外的独立问题,并非基础设施制度的重点分析对象。
(二) 公共数据可信交易的技术保障制度
1) 数据登记
数据登记是公共数据持有方申请将合法采集的公共数据在特定平台通过工具采集与人工填报等方式进行登记,经审核后将登记信息上链并领取证书的系统性流程3。
法律视角下,财产权登记的效力从低到高分为三个层级:首先是证明效力,例如著作权登记;更强的是对抗效力,例如机动车、船舶登记或动产抵押登记;最强的是生效效力,例如不动产物权登记中,登记是不动产物权变动的生效要件
技术视角下,法律目的的实现依赖于登记信息的互通查证及不可删改,由此需借助区块链技术对审核信息进行存证,以保证审核过程及证书不可篡改且可追溯。由于区块链综合了加密方法、共识机制、分布式数库等多项技术,数据登记不再是单一实体的职责,而是网络中多个节点共同维护的结果,这种分布式的共识机制增强了数据登记的信任度
2) 隐私设计
为了解决公共数据持有者担心被交易数据因涉及个人隐私或者敏感信息而不可交易的问题,“可用不可见”的集成技术方案应运而生,通过差分隐私、联邦学习、可信执行环境等隐私技术对数据处理、传输环境进行保护。以数据收集的环节为例,差分隐私技术4在数据被发送前先进行加噪处理,使攻击者难以确定特定个体的数据是否包含在数据集中。以数据处理为例,联邦学习技术5可实现在不交换供方和需方各自的原始数据的前提下根据双方的原始数据完成模型训练,以训练完成的模型为需方提供数据服务,由此实现帮助多个参与方共享数据价值、实现数据可用但不可见。可信执行环境(TEE)在计算机硬件上通过安全芯片构建一个安全的硬件区域,这个隔离的执行空间将被用于处理公共数据和执行安全操作。其设计目的是在不安全的操作系统上提供一个安全的区域,确保在其中运行的代码和数据免受外部攻击和未授权访问。此外,还有诸多技术可以实现“数据可用不可见”,如多方安全计算、同态加密等。且此类技术正在《数据二十条》的呼吁下迅速发展,以致力于为数据交易提供安全保障。
(三) 公共数据可信交易的责任承担制度
1) 场内交易的必要性
由政府主导创建的数据交易所在市场实践方面相较于企业主导的数据服务提供商,具有更高的参考价值。一方面,数据交易所在其运营过程中体现出更高的透明度和公开性,其相关的制度和规定也变得更为明确,这有助于对真实市场行为进行深入的分析和总结;另一方面,与企业数据服务提供商相比,数据交易所在数据权益确认、数据定价、交易规则的制定以及运营模式等方面进行了更多的实验和尝试,因此具有更加丰富的实践经验和素材
2) 场内交易的责任分配
基于数据交易所是具有较强可信基础的公共设施的前提基础,可依据交易过程分别梳理数据交易所的相关责任。交易前,针对被交易数据来源不可交易的情况下,数据交易所应尽合理审查义务,并制定明确的交易规则明确数据交易所对需方资格条件、供方作为公共服务机构是否经依法授权或具有管理公共事务职能等的判定标准与所需材料,并进行必要的审核。进场交易无疑会增加当事人的合规成本和交易费用,但当事人正是基于对交易所中立地位和审查能力的信任,才会选择从场外进入场内交易。交易中,应配合进行数据登记,实现交易过程透明可追溯,尽力破除交易双方信息不平等。交易后,在交易所承担合理审查义务的前提下,若存在损害结果与赔偿需要交易所承担,有学者建议此时应引入“避风港”规则避免将平台服务和责任直接挂钩,数据交易所应根据权利人通知采取必要措施,避免法律责任
在数据驱动的新时代背景下,公共数据交易作为释放数据价值、促进社会经济发展的重要途径,其可信建设显得尤为关键。本文深入分析了公共数据交易中的信任难题,并提出了一系列制度保障措施,以期构建一个安全、高效、透明的公共数据交易环境。为应对公共数据交易中的信任激励不足、信任维护机制缺失以及技术保障不充分等挑战,本文提出公共数据交易的可信秩序治理框架,以透明性、问责制和标准化为核心,通过基础设施建设、建立数据登记制度、推动“数据可用不可见”的技术应用,以及明确场内交易的责任分配,为公共数据交易提供了全面的制度保障。通过制度的实施,以期有效地提升公共数据交易的信任度,激发市场活力,推动数据要素的高效利用。随着技术的不断进步和制度的完善,公共数据交易市场有望实现更高层次的透明化、标准化和法制化。这不仅将促进数据要素的市场化配置,也将为智慧社会的建设提供坚实的数据支撑。通过不断的探索和创新,公共数据交易市场将在未来发挥更加重要的作用,为社会经济的全面发展贡献更大的价值。
1《中共中央国务院关于构建更加完善的要素市场化配置体制机制的意见》第六条:“加快培育数据要素市场”。
2《中共中央国务院关于构建数据基础制度更好发挥数据要素作用的意见》第(二)条:“遵循发展规律,创新制度安排。充分认识和把握数据产权、流通、交易、使用、分配、治理、安全等基本规律,探索有利于数据安全保护、有效利用、合规流通的产权制度和市场体系,完善数据要素市场体制机制,在实践中完善,在探索中发展,促进形成与数字生产力相适应的新型生产关系。”
《中共中央国务院关于构建数据基础制度更好发挥数据要素作用的意见》第(九)条:“统筹构建规范高效的数据交易场所。加强数据交易场所体系设计,统筹优化数据交易场所的规划布局,严控交易场所数量。出台数据交易场所管理办法,建立健全数据交易规则,制定全国统一的数据交易、安全等标准体系,降低交易成本。引导多种类型的数据交易场所共同发展,突出国家级数据交易场所合规监管和基础服务功能,强化其公共属性和公益定位,推进数据交易场所与数据商功能分离,鼓励各类数据商进场交易……”。
3《公共数据授权运营平台技术要求》,第6.1.1条:“公共数据持有方申请将合法采集的公共数据在公共数据授权运营平台登记,通过工具采集与人工填报等技术手段生成公共数据登记申请的基本信息。”
《公共数据授权运营平台技术要求》,第6.1.2条:“公共数据授权运营平台对申请登记的公共数据进行审查,确认公共数据主体资质、公共数据内容、 获取方式以及数量等信息,对符合条件的申请颁发登记证书。”。
4差分隐私是一种用于保护个人隐私的技术,当分析敏感数据时使用。它在分析之前向数据添加噪声或随机性,使攻击者难以确定特定个体的数据是否包含在分析中。这种技术有助于防止敏感信息的披露,同时仍然允许从数据中获得有用的见解。
5联邦学习概念最初由Google在2016年提出。目前,应用较为广泛的是横向联邦学习和纵向联邦学习。横向联邦学习是指不同参与方提供不同的样本集,但是样本具有相同的特征;而纵向联邦学习是指不同参与方各自提供相同样本集,但是各自只有部分特征。