查看原文
其他

上政学报 | 陈肇新:要素驱动的数据确权之法理证成

点击蓝字

关注我们


新兴权利法律问题研究:数据权专论


要素驱动的数据确权之法理证成



本文刊登于《上海政法学院学报》2021年第4期

作者:陈肇新,法学博士,华东师范大学法学院讲师。



内容摘要

数据确权是数据要素化和数据产权交易的前提条件。以算法为核心促成数据的要素化和数据要素的价值实现。在一定程度上数据与算法之间形成同构关系。目前,数据确权方式主要有正向和反向两种。通过设置经典权利结构的正向确权模式难以解决个人信息保护与加快数据流转的问题。反向确权方案以算法为基础,建构起数据准入与数据流转交易的负面清单与责任清单。反向确权方案能够获得现代产权理论尤其是不完全契约理论的支持,可以为市场主体自发形成数据确权与数据交易规则提供空间。



关键词

生产要素;数据确权;算法;不完全契约理论


一、问题的提出


以数据作为核心驱动力的数字经济时代,数据资源已成为驱动商业模式创新和发展的核心资源,数据也已成为企业发展、科技进步、社会秩序稳定和国家富强的核心竞争要素之一。在2016年G20杭州峰会发布的《二十国集团数字经济发展与合作倡议》中,数字化的知识和信息就被确认为数字经济的关键生产要素。2019年10月,党的十九届四中全会通过的《中共中央关于坚持和完善中国特色社会主义制度 推进国家治理体系和治理能力现代化若干重大问题的决定》提出,“健全劳动、资本、土地、知识、技术、管理、数据等生产要素由市场评价贡献、按贡献决定报酬的机制”。2020年3月30日,中共中央、国务院公布了《关于构建更加完善的要素市场化配置体制机制的意见》,明确把“数据”与土地、劳动力、资本、技术并列为生产要素,提出加快培育数据要素市场,推进政府数据开放共享,提升社会数据资源价值,加强数据资源整合与安全保护,健全数据交易平台和产权交易规则。数据生产要素化、市场化改革的大幕由此拉开。


数据确权是这一改革的前提条件。数据确权的基本内容早在2016年贵阳大数据交易所试点大数据交易时被提出。《贵阳大数据交易观山湖公约》指出:“数据确权,主要是确定数据的权利人,即谁拥有对数据的所有权、占有权、使用权、受益权。”随后,在深圳、天津、威海等地的试点中也提出了数据确权及与之相关的各类规定。例如,2020年7月公布的《深圳经济特区数据条例(征求意见稿)》通过直接给定个人、公共事业单位以及市场主体等三个数据主体来指出数据权利的归属。2020年8月公布的《天津市数据交易管理暂行办法(征求意见稿)》则在“交易数据”环节提出“数据确权条款”,即“数据供方应确保交易数据获取渠道合法、权利清晰无争议,能够向数据交易服务机构提供拥有交易数据完整相关权益的承诺声明及交易数据采集渠道、个人信息保护政策、用户授权等证明材料。”2020年12月公布的《威海市数据确权交易管理暂行办法》总则部分指出:“数据确权要兼顾数据的创制权、所有权、管理权、使用权、交易权等权益,在法律允许范畴内,积极开展数据交易活动。”


不难发现,贵阳、深圳、天津、威海等地区在界定“数据确权”的逻辑思维和具体行动方案上并不完全一致。《贵阳大数据交易观山湖公约》采取的是对“数据确权”下定义的方法。《深圳经济特区数据条例》则是从定义“数据权”的角度,通过区分公共数据和私人数据来间接地确权数据,但这种刚性的定义方法带来了不少争议。天津和威海的方案较为类似,主要从数据交易的动态维度来表达数据确权的内涵,但从具体的条文来看,有关“数据确权”的内容仍然相对模糊。因此,在数据确权的问题上,尽管深圳、威海、贵州、天津等地针对“公共数据”的界定已经取得较为一致的共识,但各地的实践并未取得较为一致的立场,而且还遗留下大量含糊的地方。


造成数据确权问题的诸多困境,除了来自实践方面的原因外,更为重要的是来自法律方面的难题。有学者认为,数据难以完全依靠物权、合同、知识产权以至个人信息保护等法律法规予以确权,其根源在于现有法律难以完全回应大数据时代数据基本特征,因此,对数据的法律规制提出了现实难题。换言之,从法律规范层面合理判定“数据”的权利属性,继而设计一整套权利保护与救济机制,成为维护个人隐私、保障数据安全、促进数据交易、防止数据滥用的重要内容。


基于促进数据生产要素化、市场化改革的现实追问以及数据的法律规制理论需要,从生产要素驱动的角度来理解和阐述数据确权的价值内涵、具体举措及可能的法律应对,将成为本文所要回答的问题。首先,通过重述数据生产机制,阐明数据作为生产要素的来源、基本样态及特征,表明要素驱动下数据确权所具有的必要性;其次,从人工智能与算法的治理维度,揭示数据确权与算法在产权初始界定问题上的关系;最后,分析数据确权的两种方案,即正向的数据权利建构方案与反向的数据负面清单、责任清单建构方案,尤其结合交易成本理论展示数据确权与数据生产的产业链和供应链的关系,在数据流通领域依据算法解决数据确权、按照边际贡献大小实现数据确权的关系,及各自的利益与权重等问题,重点在数据的非独占性、流动性维度下展现数据确权的动态特征,进而阐述要素驱动下数据确权的法理基础,实现数据确权、数据规制与数据治理。


二、作为生产要素的数据


(一)数据作为生产要素的演进脉络


在经济学上,“生产要素”(Factors of Production)是指用来进行生产经营活动以促进商品和服务产出与流动,继而创造财富和实现经济持续增长的各类必需经济资源,也即进行物质资料生产所必需的各类经济资源,是构成生产力的各种要素之和。


按照政治经济学或更为基础的“劳动价值论”(Labor Theory of Value),生产要素可以进一步区分为作为人的要素的“劳动者”,以及作为物的要素的生产资料,即“劳动资料”与“劳动对象”,继而围绕着劳动者,劳动、土地、资本与技术或管理成为四种经典的生产要素。劳动是生产中最能动的要素;土地既是劳动对象也是劳动资料;资本是人类生产出来并重新投入生产的生产要素;技术或管理则体现为组织土地、资本、劳动以进行生产经营活动。


随着科学技术在经济发展与价值创造中地位的日渐提升,知识逐渐成为影响乃至支配生产要素的重要内容。首先,知识与劳动、资本、管理以及土地等生产要素的结合愈加紧密,由此产生某种复合价值,即体现知识与生产要素相结合而诞生的新型价值,同时在生产要素中又能明显看出知识投入而带来的新的生产增量;其次,“劳动价值论”通过对“知识价值论”(Knowledge Theory ofValue)的批判表明,知识与生产要素的结合反过来也在改造生产要素本身,使生产要素的自我矛盾运动得以实现。在这个过程中,知识逐渐成为人类在劳动生产中的关键性劳动对象以及劳动产品,并开发出知识取得支配生产要素的契机。而在美国社会学家丹尼尔·贝尔的视野中,“知识”是“后工业社会”(Post-industrial Society)的关键词。在著名的“后工业社会”研究中,贝尔指出,技术与知识是后工业时代的两个关键词。由此表明,后工业社会更注重知识在推进社会发展中的驱动作用,知识将成为社会基础设施建设的重要组成部分,与知识生产有关的信息技术投入、科技进步与创新将占据经济发展的核心地位,信息从此具备稀缺性而成为社会资源之一。此时,信息在社会中具有以下特征:第一,信息迭代与更新速度加快,造就信息具有压缩时空维度之功能;第二,围绕着信息生产、加工与再加工,信息产业形成超越空间限制的完整产业链条,信息部门成为国民经济部门的主轴;第三,信息在社会再生产中的贡献加大,信息也因此成了新的权力来源,反对信息垄断将成为社会生活与经济生活的中心议题之一。


在贝尔的论述占据西方经济学与社会发展理论的重要席位后,“信息”逐渐成为国民经济和社会发展领域的关键词之一,“信息社会”的概念也由此诞生。例如,托夫勒(A. Toffley)认为,“信息社会”表明信息已经成为足以影响社会结构的重要变量。“信息”也逐渐成为科学哲学的重要观念。例如,波普尔(K. Popper)通过区分物理世界(“第一世界”)、意识或精神世界(“第二世界”)、思维客观内容世界(“第三世界”)间接反映出信息对象化、客观化、实在化和自主化的现实意义。


针对信息的研究表明,尽管试图以“知识价值论”或“信息价值论”取代“劳动价值论”的立场不能成立,但它无疑揭示了知识与信息对现代经济与现代社会发展所具有的重要意义。“信息”(Information)是知识的主要构成物或等价物,其功能在于消除知识接收者在认知上的不确定性,增强系统的有序性和组织性,也因此成为“熵”的对立概念。反过来,诸多关于信息的理解则建立在其固有的知识意义的基础之上。例如,根据知识急速增长来理解信息的扩充性,根据知识的公约与包容属性来指代信息的可压缩性,根据知识在社会中的扩张与接受来表现信息的可输送、可扩散和可分享特性。因此,在“信息”研究的基础上,数字时代(Digital Era)、后数字时代(Post-digitalEra)和大数据时代(Big Data Era)等概念接踵而至,不仅意味着整个社会迈向工业化、信息化的时间和空间向度被进一步压缩,而且意味着数据(Data)在社会生产领域中具有了愈加重要的地位,并反过来对人们的行为习惯、思想观念、道德伦理规范乃至法律制度等提出了新的挑战,以至于有学者认为,“科技”“信息”“数据”等已然成为某种现代社会拜物教的核心观念。


(二)数据价值二重性的来源


把数据作为现代社会生产的关键词——甚至核心关键词,获得了诸多支持。国际数据公司(International Data Corporation,IDC)2011年的报告《从混沌中提取价值》(Extracting Value fromChaos)将大数据技术定义为,旨在利用新一代技术和架构,高速捕获、发现、分析大量的各种数据,并从中提取出数据的经济价值。随后,大数据的特征被进一步提炼为“4V”,即数据体量大(VolumeBig)、种类多样化(Variable Type)、流动快速化(Velocity Fast)和价值密度低(Value High andLow Density)。国家工业和信息化部将大数据定义为,“以容量大、类型多、存取速度快、应用价值高为主要特征的数据集合”。这些针对大数据的描述均在不同维度指向大数据的本质特征,即基于算法所设置的特定目的而积累起来的海量的动态的运动主体生产、生活的痕迹信息,及与该动态运动相关的相对静止的物质与客观环境等数字记录的结合。随着数据分析工具的快速发展,对数据流的快速、持续、实时分析与结构化画像成为可能,数据挖掘的规模化效应逐渐显现。此时,个人日常生活中所产生的大量冗余性甚至“无用”的非结构化或半结构化数据,很容易透露出信息生产者的行为习惯和偏好。公民个人信息数据、个人健康数据、不具有可识别性的结构化数据、行为痕迹、地理位置信息等都能被用于发掘潜藏的商业机遇和经济利益。同时,针对大数据的统计分析和计算也可以找出为既有科学研究方法所无法发现的新模式、新知识、新规律。


在大数据背景下,数据正在转变自身的属性,从作为传统商流与物流的附随物转变为标记资源稀缺性和促进商品交换的重要因素。数据承担着基础性战略资源和关键性生产要素的双重角色:“一方面,有价值的数据资源是生产力的重要组成部分,是催生和推动众多数字经济、新产业、新业态、新模式发展的基础。另一方面,数据区别于以往生产要素的突出特点是对其他要素资源的乘数作用,可以放大劳动力、资本等要素在社会各行业价值链流转中产生的价值。”可见,数据作为发现隐秘知识和资本拓殖的中介,具备发展出使用价值的可能。在这一方面,算法在数据演进为数据资产并获得商品属性的过程中构成了首要的推动因素,并确认数据所具有的使用价值。一般认为,数据只有应用在具体业务场景中才能体现其使用价值,而该业务场景是由算法来设计和界定的。与此同时,大量的非结构化或半结构化信息是行为人无意识地生产出来的,行为人无须为这些数据的生成支付对价。因此,这些数据的生成无成本可言,也不具备经济属性。换言之,数据产生的边际成本几乎为零。但是,行为人在使用互联网和智能设备的过程中会积累其个人的行为偏好和使用习惯,而大数据技术的运用就是围绕着发掘这些行为偏好和使用习惯背后所隐藏的经济利益而进行的。因此,算法的设计以及大数据技术的运用过程,也正是数据被确认具备使用价值的具体背景。


与之相关,基于特定算法而形成的数据挖掘,以及人工智能基于算法而形成的深度学习等表明,数据的价值一方面与其使用价值即数据挖掘及算法赋值所付出的抽象人类劳动相关,另一方面也与那些无意识、非自主的运动有关。这些运动间接赋予数据以不同程度、不同等级的价值,由此佐证了数据因人类行为而具备的内在价值,并相应地深化“人类劳动”在哲学与经济学层面的内涵。


此外,动态的、持续生成中的数据流正在逐步构成大数据统计分析的核心。一方面,企业在生产流通环节能够借助大数据开发而将数据深度嵌入到供应链、产业链建设,从而降低流通成本和优化资源利用,由此夯实数据作为物联网、工业互联网建设和人工智能、移动通信技术深度发展的质料基础;另一方面,数据在很大程度上改变了产业链的资源与利益分配格局,原本作为优化供求关系和畅通供求链条之中介的互联网平台,因充分掌握了供给侧与需求侧的各类数据而转变为导引生产与销售的枢纽,平台所掌握的数据也可以因孵化新型平台和培育新型算法而获得商品化、资产化的机会。“平台经济”为国民经济注入了新的驱动力。


可见,数据的可流转属性以及商品化、资产化特征,是数据成为维系和优化算法基础质料的前提条件。而数据的商品化与资产化又以确认其权属为前提,因此,数据确权就成为数据作为生产要素首先需要解决的问题。


(三)数据要素化的财产权属性

 

作为生产要素,数据既具有传统生产要素所具备的财产属性及可配置属性,同时又具有传统生产要素所不具备的其他特殊属性。第一,数据具有伴生性,即数据通常不具备实体属性,而是依托于技术、资本、劳动甚至是土地来实现其使用价值。有研究认为,数据要素与技术要素结合可帮助企业实现技术创新,数据要素与资本要素结合可降低企业获取生产和经营所需的成本,数据要素与劳动要素结合可提高生产效率。也正是如此,数据要素在社会生产生活中更具有“催化剂”功能。第二,数据要素的初始成本较高,即数据搜集方需要大量的资本、技术,甚至需要劳动和土地要素投入到导入用户、数据搜集、加工与挖掘过程中,且搜集和加工数据所需要的基础设施与平台在很多情况下属于一次性投入。换言之,数据要素的初始成本主要体现在搭建数据挖掘与分析平台的固定资本投入上。

此外,随着数据量和数据密度的加大,其他生产要素尤其是资本和技术要素的投入将进一步加大,其目的在于确保数据要素的边际收益。第三,数据要素的边际成本几乎为零,即原始数据的初始生产来源于用户的主动行为,数据平台无须为此支付额外成本。第四,数据在要素化过程中具有正外部性和负外部性,即一方面可能为平台和数据应用带来流量和经济收益,另一方面也可能侵害数据主体的个人信息与人格权利甚至数据主权。


此外,数据要素的特殊之处还在于,它与传统生产要素在物理意义上所具有的稀缺性不同。首先,数据要素的稀缺性源于数据要素伴生性与数据非排他性、非独占性之间的内在张力。从政治经济学的角度来看,生产和加工数据的过程属于劳动,而数据服务于社会生产活动并因此获得对价的过程则属于按要素参与分配。因此,数据作为生产要素参与分配,意味着数据要素所有人可以凭借自身对数据要素的合法管领,以及相对应的数据种类及其重要性获得经济收益。其次,数据要素的经济价值在很大程度上来源于特定的使用需求,且通常也只有在具体的使用场景中才能产生相应的经济效益。有学者指出,从银行、网络运营商、互联网企业等主流的数据要素化主体的日常使用情况来看,由于不同经营主体所面对的场景差异,数据要素化的过程在数据源、存储结构和数据分析方法等方面也相应地存在较大差异。因此,对数据要素的经济评估,应着眼于数据要素的形成机制、使用场景以及对应服务等关乎数据运用的实际需要内容。最后,数据要素的稀缺性还体现为数据要素化过程中随机产生的价值增量。由于数据要素化是一个持续推进的动态过程,而且数据在要素化过程中还会因算法优化和需求更改而有所调整,这些新产生的随机变量将为数据要素增加新的价值来源,从而影响数据要素的经济效益。


可见,将作为生产要素的数据进行确权,主要是针对数据所具有的财产权属性。尽管针对数据的权利理论与民法理论研究认为,数据资源兼具人格权与财产权的属性且二者共同构成为数据权利主体的整体性范畴,但从数据要素化的角度来看,它所关注的数据确权主要针对的是数据的财产权属性。换言之,必须通过某种方式,使数据的财产权属性与人格权属性相分离,而这种方式,正是数据确权所必需的技术因素。


三、“技术-算法”:作为生产要素的数据确权之基础


(一)基于技术而形成的大数据


作为生产要素的数据是具有商业价值的“大数据”。目前,有学者将研究“大数据”属性的学说归纳为“大量数据(流)说”“数据集合说”“商业智能说”“动态技术说”“数据财产说/数据资产说”等五种类型。具体而言,第一,“大量数据(流)说”侧重从动态、实时的数据流角度,强调庞大的数据体量(Volume Big)对大数据的重要性,因为大数据的经济利益正是源自对大量数据的分析,大数据的商业价值也因此得以呈现。第二,“动态技术说”将大数据定义为能够实时分析海量数据流的技术设计,突出的是实时数据流的技术分析在大数据利益生成方面所具有的主要影响力。第三,“数据集合说”强调数据集(Datasets)在定义大数据方面的重要意义,但该学说主要从既有数据技术分析的先天短缺维度来突出大数据的意义。例如,在确认大数据属于数据集的同时,强调数据来源的差异性导致无法用现有的分析技术进行应对,或者在合理的时间范围内无法处理相关数据。第四,“商业智能说”主张大数据是基于互联网与物联网进化的商业智能(Business Intelligence,BI),特别突出大数据相对于传统商业智能所具有的更强数据分析工具。第五,“数据财产说/数据资产说”将云技术和数据挖掘等作为数据财产属性的基础。


不难发现,这些学说的共同之处在于,它们从大数据的“4V”特征出发,从作为质料的数据与作为分析工具的技术相结合的角度来界定大数据的概念内涵,并且在不同程度上突出数据分析技术在定义大数据上的功能。可见,大数据兼具资源、技术、应用三个层次。“大数据是具有体量大、结构多样、时效强等特征的数据;处理大数据需采用新型计算架构和智能算法等新技术;大数据的应用强调以新的理念应用于辅助决策、发现新的知识,更强调在线闭环的业务流程优化。因此说,大数据不仅‘大’,而且‘新’,是新资源、新工具和新应用的综合体。”而且,随着大数据应用逐渐深入到全产业链,大数据的数据属性与技术属性逐渐呈现出相互融合的情况。例如,因应大数据数量与种类的迅猛增长而不断更新和产生出新的大数据基础技术;大数据的质量与可用性与数据管理技术的优化紧密相关;数据的潜在价值因数据分析应用技术的迭代而不断被发掘;数据使用与数据共享的合规程度也由于数据安全技术的深入应用而得到相应提高。又比如,中国通信信息研究院将“大数据产业”定义为:“以数据及数据所蕴含的信息价值为核心生产要素,通过数据技术、数据产品、数据服务等形式,使数据与信息价值在各行业经济活动中得到充分释放的赋能型产业。”从中可以看出,应用大数据的前提在于获取数据的信息价值,并将这些信息价值作为社会经济活动的催化剂,同时大数据又在应用的过程中展示其信息价值,从而证实其兼具数据与技术双重身份。这恰好与技术作为要素市场化配置改革中的主导地位不谋而合。


(二)以算法为中心的数据赋值模式


从大数据的定义及其与技术的亲和度来看,基于算法的数据生产机制同时是数据要素化的过程。因此,数据的经济价值和商业价值根植于数据生产机制之中。在数据产生到最终赋能经济生活的过程中,尽管不同的算法出于它们在产业链上的不同地位需要而对数据生产提出了不同需求,但总体而言,数据生产机制都以数据收集、数据脱敏(数据清洗)、数据加工与数据运用为基本模块。因此,它也同时构成数据挖掘或大数据分析(Big Data Analytics)的过程,而对数据的赋值也正是在这一过程中生成的。以目前大数据交易的现状区分,可以以数据脱敏环节为界,将算法赋值数据的过程拆分为“非底层数据的算法赋值”与“算法学习赋值数据”两个维度。


第一,关于非底层数据的算法赋值。首先,目前的大数据交易主要以数据脱敏后的非底层数据为主要标的,而这些数据的价值普遍由数据搜集方即算法掌控一方界定。在大数据挖掘的过程中,不特定的数据生产者因使用智能设备与互联网而生成大量的底层数据,这些底层数据经过技术手段清洗而标准化、匿名化处理后,就会进一步生成衍生数据。在这里,不含个人信息的匿名化数据以及经过数据清洗、算法加工后的衍生数据都可以进一步成为抽象化、结构化的可要素化数据。这些可要素化数据成为数据控制人的数据资产,可以和数据采集方进行交易。其次,在数据加工与数据运用的过程中,伴随着算法的自我迭代和学习过程会产生出大量可供交易的新数据,这些数据尽管与算法的关系紧密,但也可以构成数据交易的对象,并因算法而获得新的估值。


第二,关于算法学习赋值数据。这一维度是目前大数据交易以至数据确权的主要背景。在目前的大数据交易中,不少交易平台都是以此类数据作为交易标的。例如,武汉东湖大数据交易中心的业务范围就涵盖了大数据全产业链,并开展数据以及与数据生产有关的算法交易活动。而且,部分数据交易平台在赋值数据的基础上积极开展数据撮合服务,从而为政府、企业、社会等数据资源引入市场定价机制,实现多种数据的互联、整合和统一定价。例如,西安西咸新区大数据交易所、华东江苏大数据交易平台、哈尔滨数据交易中心、上海数据交易中心等都是具有官方背景的大数据交易平台。此外,互联网平台也在自行培育数据交易平台,形成数据交易同盟,并通过导入做市商制度,在对数据进行加工和运用的过程中实现数据的保值增值。


实践表明,算法学习以赋值数据,主要针对数据挖掘中的数据加工和数据运用过程中通过算法加工后的数据价值密度增加。反过来,高价值密度的数据对优化算法具有重要价值。可见,数据形成价值链条的过程也是为算法定价的过程。具体而言,在数据脱敏后的数据挖掘环节,数据的功能深度嵌入算法的自我学习建模与知识生产建模的过程之中。首先,在数据脱敏之后,数据挖掘包括建立数据库、算法学习模型、模型评估与优化、模型实施等多个步骤,有学者也进一步将这些步骤整合为汇集性数据处理(数据集的生产)以及数据分析处理(数据挖掘)两个模块。其中,数据库的建立是以实现既有的目的,即对算法的需求及具体问题的定义为基础,通过提炼、归纳和描述算法设计目的的具体特征来导入相关关键词的方式构建元数据(Meta-data),进而确定采取何种分析方法,从何种角度、何种“频域”(Frequency-domain Feature)和“时域”(Time-domainFeature)出发,对多大范围内的数据进行分析,使得原本非结构化或半结构化的数据转变为结构化数据,以便为算法建模提供基础。其次,数据结构化的目的在于发现问题域与关键词之间存在的相关性,且这种相关性判断是算法建模和最终层面的知识模型建构的基础。在这个过程中,算法的自我学习和迭代以及最终的知识输出过程,一方面是算法利用数据进行研究、试错和优化,并依赖于给定自变量、创建新变量和转换变量等数据建模过程,另一方面是算法高度依赖自行搜集或交易得来的非结构化数据,随机寻找自变量的学习过程。再次,算法建模后的评价、应用与优化过程旨在取得具体应用场景下的测试数据,重点在于持续检验算法建立的各类假设,在实践中不断吸收相当领域的新数据,从而局部以至全局地重复数据脱敏、数据加工、数据运用的数据挖掘。


对于数据的赋值而言,算法自我学习与迭代的过程既表现为数据因算法加工而不断提升其结构化程度的过程,也表现为数据的结构化状态因算法学习的需要和适用场景的差异而随时进入消解、重构、再解构、再重构的过程。但同时,算法在知识模型建构与预测问题上的精确度,通常能够直观地体现在算法所输出的与需求相匹配、具有高价值密度的深度加工的数据之中。而且在很大程度上,算法针对假定及其变量所进行的随机检验以及针对变量间因果关系的随机性分析,都是拓展算法运用空间,充分发挥数据创造价值和服务于自动化决策的重要内容,大数据所具有的经济和商业价值也往往由此呈现。


四、数据确权的法理证成:正向与反向思路之辨


数据作为生产要素参与市场分配的首要前提在于,明确作用于经济活动的数据应当如何判断其权利归属,即数据确权问题。根据目前的研究,主要有正向与反向确权两种思路。


(一)基于法律权利理论的正向确权之迷思


有研究指出,数据确权主要包括以下三个方面的内容:一是判定数据的权利属性,明确应当给予数据以何种权利保护;二是判定数据的权利主体,明确数据利益的享有者;三是判定数据的权利内容,明确数据主体可以享有的权能类型。这恰好也是开展数据权利理论研究的初始思路,也即从规范意义上的权利确认和权利类型化、要件化路径来界定作为权利的数据内涵。有学者认为,法学界描述和建构数据生产理论的首要任务在于,通过给定数据生产机制来寻找数据的生产者,继而以数据生产者作为权利主体,展开对数据的权利配置,包括数据权利的内容、效力、限制等内容。不难发现,这种对数据进行确权的思路,其核心在于沿着数据生产链条,分别赋予数据价值增值者相应的权利以作为相应的对价。同时,这种思路主张是根据经典的权利理论来描述的数据权利体系,因此属于“正向确权”的范畴。《深圳经济特区数据条例(征求意见稿)》就是属于正向确权的典型,其第4条首先通过明确“数据”的定义延伸出“数据权”的概念,即“数据权是权利人依法对特定数据的自主决定、控制、处理、收益、利益损害受偿的权利”。在具体的立法理由中,立法者进一步认为,“数据权是一种与传统民法中物权、知识产权等权利存在不同的新型权利,其具有财产权、人格权和国家主权属性”,继而从数据主体角度说明个人数据、公共数据与企业数据的所有权归属,明确指出“数据要素市场主体对其合法收集的数据和自身生成的数据享有数据权”。


从数据要素化的角度来看,正向确权尽管能够清晰地给出数据的权利、利益主体及数据的利益分配规则,但这种立法方式也存在刚性有余而激励不足的困境。


首先,数据作为生产要素,其功能并不在于直接赋能于生产活动,而是间接地或者说主要以间接方式赋能于其他生产要素以参与社会经济活动。因此,数据的价值在很大程度上体现在快速变动甚至是实时的数据流之中。与之相应,算法应用的价值也在很大程度上取决于数据流的实时变动。例如,2020年10月发生在成都青城山都江堰景区的高德地图“迷航”事件,正是道路线路未能及时更新所致。针对诸如实时路况和具体的地理信息、地理环境等作为直接体现算法运用实效的要素,数据流通渠道的畅通在一定程度上要优先于数据权利的保护,否则就容易陷入不正当竞争甚至是垄断的陷阱之中。


其次,数据的“催化剂”特色表明,数据在作为生产要素参与市场分配的过程中,应当以尽可能提高流转效率为目的,这也正是产、学、政、研各界积极采取措施打破“数据孤岛”的题中应有之义。进言之,在数据要素化和数据交易过程中,应当采取各种方式降低数据复制和流通的成本,并因此注重数据所具有的非独占特征。有研究指出,《深圳经济特区数据条例(征求意见稿)》的立法方式除了可能导致提高地区间数据流通成本、制造以地域边界为基础的新型“数据孤岛”、混同隐私权与财产性数据权属等不足之外,更为重要、也更为棘手的问题是,对数据权利的财产属性肯认与经济利益维护可能会影响数据要素化进程。具体而言,某数据主体所搜集、生产并因此占有的数据,通常得益于其他复数甚至是不特定数据主体的作业。同时,数据主体在数据生产的过程中,也往往需要实时或在极为狭窄的时间维度内与其他数据主体进行数据交易或数据交换,以便完成数据生产。这表明,数据生产是一个在时间或空间维度内可以无限延伸或无限压缩的过程,这个过程追求在极短的时间维度内朝向极为广阔的空间范围,最终实现现代社会所强调的“万物互联”。因此,在保护数据价值链条上的生产者、赋值者的财产利益的同时,也要注重数据要素化所要求的数据非独占性特征,尤其是防止出现因数据权利保护而造成权利冲突和提高数据流通成本、妨碍数据资源配置效率的问题。


围绕深圳数据立法所展开的学术争论表明,正向确权思路的首要问题在于,难以平衡数据主体经济利益与降低数据交易成本和加快数据资源流转以促进数据要素化之间的关系。从数据的非独占性角度而言,即使认为数据权利是“使用控制权”,它也只是在“权能”(Power)而非“权利”(Right)的维度来给定数据权利的规范意义,因为针对某特定物的“使用”和“控制”,都只是权利行使的部分能力,此时权利的不完全特征将公开化。同时,出于建构新型权利的需要,应从动态的数据生产链条中提取出“数据主体”“数据控制者”“数据处理者”等与数据权利配置直接相关的主体性要素,“通过对每个角色配置相应的权利来构筑产业或经济秩序”,并以此建构起数据权利的应然姿态,但此举却可能会导致数据权利的动态判断与静态判断之间发生冲突,陷入难以自圆其说的境地。在静态层面,由于严格按照数据的生产主体、数据的生产和增殖来确定个人、公共单位以及社会商业主体等数据主体,可能使针对数据权利的保护与救济停留在权利的初始界定层面,还可能会在规范层面混淆“数据主体”与“数据控制者”“数据处理者”的概念,从而无法应对数据流转后的权利保护追问;在动态层面,由于强调保护数据权利的财产利益与人格权益,这种价值判断将相对弱化数据要素化所重视的数据流转效率与非排他性占有特征,从而削弱数据要素化的产权激励效应。


总之,正向确权思路的意义在于,它能够非常清晰地给定“数据”与“数据权利”的定义和构成要件。深圳数据立法的重要价值在于,明确作为权利的数据是有别于物权和知识产权的新型权利,它兼具人格权益、经济利益和主权意志三重权利内涵,从而为推进数据立法以至反思传统物债二分的财产法律制度提供了镜鉴。但受限于传统权利理论,正向确权的思路普遍存在权利保护逻辑前后不一的弊端,以至于在强化数据权利保护与推进数据治理之间进退失据。例如,有学者根据正向确权的思路提出,处于底层数据的个人数据或原始数据实施全部归用户所有,而经过脱敏处理的商业数据“有限度”为企业所有,这里的“有限度”恰好反映出正向确权思路潜藏着的理论困境。


由于正向确权思路难以克服上述问题,对数据确权甚至是数据权利保护议题的相关争论,在很大程度上不得不退缩到法律教义学的城堡之内,并逐渐地将讨论的议题退回到与数据生产初始端密切相关的个人信息保护或隐私保护,继而寄希望于利用市场的自发调节来形成初始数据与衍生数据在数据生产链条上的利益分配和权利保障机制,又或者在更广泛的维度上运用规制理论来推进数据运用风险与数据平台反垄断等问题的讨论,从而在理论上悬置了数据确权的问题。


(二)算法规制实现反向数据确权的思路

 

考虑到上述原因,从算法的维度出发反向实现数据确权成了新的思路。在数据生产机制中,数据的形态及其价值在某种程度上直观地取决于算法的需要。这不仅重申了代码作为法律的网络空间特征,揭示了算法作为数字经济核心驱动力的地位,而且还表明了数据时代法律应当予以规制的重点内容,从而为导出数据权利诉求的关键要素奠定基础。因此,有学者主张把“算法促成数据合规”作为建构数据确权范式的基础,并主张以算法为主轴建立起限制和禁止数据交易的数据交易管制规则和违法数据禁止交易规则,打破“数据壁垒”“数据孤岛”并维护数据公共利益的责任规则。


不难发现,反向确权的思路遵循的是“法不禁止即自由”的权利理念。该理论认为,“数据合法与否,并不以是否获得授权为判断标准,应以是否违反相关规定判定”,通过设置算法的责任清单或负面清单并借助规制算法给定数据合法的空间来描述数据权利的运作边界。此时,那些未曾落入规则范畴的数据流转和交易行为,即被推定为合法而自动获得法律保护,并因此受到市场自发的利益调整机制的约束。有论者认为,这种通过算法反向实现数据确权的思路,不仅可以确保数据合法、合规,而且还可以突破传统权利理论拘泥于静态的权利主体的困境,将数据权利保护建立在数据动态流转和数据生产机制之上,兼顾数据权利客体可能存在的泛化空间,平衡数据的多元利益主体,并使得数据确权服务于算法和数据治理的事业。


(三)反向实现数据确权的法律经济学分析


反向实现数据确权的思路,可以在法律经济学上获得更为充分的说明。法律经济学特别是现代产权理论对数据确权问题的洞见在于,将不完全契约理论(Incomplete Contract Theory)引入数据确权领域,明确数据确权的关键议题不在于数据权利主体的判定与相应的权利划分,而在于从数据生产链条中所形成的数据剩余权利(Residual Rights)或数据剩余控制权(Residual Rights of Control)的初始分配。


具体来说,契约之所以具有不完全的特征,是基于以下两个假定:一是信息具有不完全和不对称的特征;二是“对称信息下出现无效投资”的强命题。契约的不完全特征能够得到复杂的缔约环境、供给物的未定特性,以及从缔约、履约以及修订契约的时间不确定性等多重因素的证实。在数据确权场合,不完全契约理论将缔约方之间的信息不完全即“不可预见的不确定性”和数据搜集者的数据运用场景不确定性嫁接起来,也就是将“双方在事先所拥有的信息在‘不可描述的不确定性’的意义下是对称的,即没有哪一方对于这种不可描述性所掌握的信息超过另一方”的假定转化为数据生产者与数据控制者之间的双重不确定性:一方面是数据控制者的数据服务预期的不确定,另一方面是数据控制者在信息不对称的情况下存在机会主义倾向而导致帕累托无效率。用社会学的术语,就是缔约双方存在着针对缔约行为的双重偶在性,并因此存在失望的风险。


需要注意的是,在从底层数据到可要素化数据的数据生产机制中,数据生产者与数据控制者之间的缔约行为并不是简单地勾选数据或搜集使用和隐私保护协议,而是一个持续的服务型投资过程。在这个过程中,任意的数据搜集、加工与控制者(通常为互联网数据运用平台)以及数据生产者(通常为智能程序用户)都无法完全做到事前穷尽所有数据使用场景。正如十年前的人们无法想象十年之后智能手机会广泛普及并深度嵌入日常生活的方方面面,极大地改变了人们的思维习惯、行为方式、消费模式和生产组织形态。而且在现实中,无论是数据搜集、加工与控制一方抑或是数据生产一方,都会对逐渐优化和改进算法与运用程序抱有极大的期待,尤其对数据运用平台而言,这种期待更是具有经济利益。例如,智能程序高度注重培养用户黏性,其目的在于不仅可以多次获得重新订立数据搜集使用和隐私保护协议的机会,而且还意味着数据运用平台降低了机会成本并获取更为广阔的机会套利空间,而用户也会因为智能程序所带来的生活便利在无意识间让渡出更多的个人信息,以至于出现了“中国人不重视隐私权”的言论。因此,为了使数据要素产出价值的最优值,就需要依据所投入的边际效益最大化方案来明确数据的产权归属,也就是将数据的产权或者数据的剩余控制权交给数据控制者,从而对数据要素化过程产生决定性影响。


在数据确权问题上,不完全契约理论的挑战主要来自法律经济学上的法律干预(LegalIntervention)学说,也就是国家通过立法和司法程序来弥补契约不完全所导致的效率低下或无效率,包括以下三种类型:第一,通过司法解释或判例来调整缔约双方的权利义务规则,从而降低过高的缔约成本;第二,通过强制执行经由庭审证实的契约权利义务条款来降低因证实成本导致契约的不完全;第三,通过认可或否定契约的方式迫使信息优势一方公布关键信息以降低因信息预见成本导致契约的不完全。


然而问题在于,只有在以下两种情形下,法律干预才会被认为是充分有效的:要么立法具有必要性和经济性,即立法的一次性成本小于私人解决问题的总成本之和;要么司法的应对能够尽量逼近立法所能达到的效果,即大量出现同类型的案件且法庭对系争焦点的信息掌控至少不劣于当事人。从我国加快数据要素化进度和培育全国统一的数据要素市场的产业导向,以及目前数据立法的谨慎态度来看,立法未必能够真正带来规模经济的优势。此外,从“共享经济”与数据产业政策导向的现况中可以看出,国家更希望充分发挥产权激励效应。故而,主张由市场主体解决数据剩余权利的划分问题的思路更具合理性。这一点与欧洲的立场相左,但在很大程度上与美国的立法思路一致。


也正因为如此,有学者指出,从加强数据要素化能力集聚和增强数据要素化的规模效应出发,并考虑到数据生产属性即用户一方对数据要素化的边际贡献较小的情况,对数据的要素化具备决定性作用的互联网平台,应取得数据要素的产权或者取得用户协议之外的数据剩余控制权。此时,避免出现负外部性将成为法律规制数据要素化过程的重点,也就是防止个人信息和隐私受侵犯,避免数据运用平台利用数据规模效应实施垄断和不正当竞争。如此,个人信息保护、规制数据运用风险以及强化平台反垄断、反不正当竞争等的研究将得到更为坚实的合理性说明。可见,区分“个人信息”“隐私”与“数据”,以规制理论回应数据治理,建构以空间为基础的数据权利束即“代码空间权”,主张在数据权利认定问题上以“服务”之债取代物权,甚至主张部分适用“占有即所有”的规则等来应对数据确权问题的研究,都可以落入负外部性之规避议题上。


五、结论


数据确权或者说对数据要素产权的确认,事关数据要素交易和权益流转的确定性问题,是数据要素交易机制得以畅通运行的前提条件。在数据被确定为属于新型的生产要素后,数据确权所要关注的问题可以分为两个方面:一是所建构的数据确权规则需要服务于加快培育数据要素交易市场,优化数据要素化体制机制,推进数据要素化进程的公共政策;二是数据确权规则应当避免出现负外部性,因此需要在个人信息保护与加快数据流转之间取得平衡。从目前的研究与实践来看,针对个人信息保护与依法数据治理等议题的研究已经非常深入,但在数据确权方面并未如意,这也许与数据权利属性不清、实践经验不足、法律规制手段薄弱等问题存在着或多或少的关联,但并不妨碍我们对作为要素的数据及其确权规则提出一些描述性的建构方案:第一,以需求为导向、以算法为主轴、以用户为中心的数据生产机制使得数据的要素化成为可能,数据尤其是大数据的价值来源于无差别的人类劳动,而其使用价值则根源于“需求-算法”的结构,简单而言,算法赋予数据以价值,而数据反过来为优化算法提供了条件;第二,利用算法描述数据权利的负面清单和责任清单的反向确权是相较于正向确权的更好方案,但仍然需要更多的理论支撑,而法律经济学有关不完全契约理论的分析,可以成为一个重要的理论支点。




 往期推荐



上政学报 | 温世扬:肖像权的特质与规则表

上政学报 | 孙山:财产法的体制演进

上政学报 | 邹海林:论出卖人在破产程序中的取回权

上政学报 | 丁 燕 :现代个人破产法的基础、价值与选择

上政学报 | 陈景善:上市公司破产重整中出资人权益调整机制之完善

上政学报 | 徐阳光:营商环境中办理破产指标的“回收率”研究

上政学报 网络首发 | 程  啸:论个人信息处理者的告知义务

上政学报 网络首发 | 石佳友:隐私权与个人信息关系的再思考——兼论私密信息的法律适用

上政学报 网络首发 | 包晓丽:数据共享的风险与应对——以网络借贷平台为例

上政学报 网络首发 | 刘忠炫:个人信息处理的合理限度——基于必要性原则的场景化分析

上政学报 网络首发 | 郑  飞:大数据时代的权利演进与竞合:从隐私权、个人信息权到个人数据权

上政学报 网络首发 | 沈伟伟:个人信息匿名化的迷思 ——以《个人信息保护法(草案)》匿名化除外条款为例

《上海政法学院学报》2021年第4期要目

《上海政法学院学报》2021年第3期要目

《上海政法学院学报》2021年第2期要目

《上海政法学院学报》2021年第1期要目





关于本刊


  《上海政法学院学报》创刊于1986 年,原名《法治论丛》(2003年改名为《上海政法学院学报》),至今已走过35年的发展历程。《上海政法学院学报》是我国最早以“法治”命名的法学专业学术期刊之一,立足于弘扬法治精神与当代中国法治实践,坚持理论与实践相结合的特色办刊方向。本刊践行“以法为基,寻社会治理之策;以文为器,求兴国安邦之道”的办刊理念,体现学术性、专业性、知识性的办刊宗旨。坚持正确的政治方向,坚持以高水平、高层次、高质量的学术研究成果,推动社会法治进步。欢迎确立学术命题,实现学术创新,达到学术标准,有理论深度,有历史重感,有广阔视野的作品。

  《上海政法学院学报》积极倡导学术民主,坚持特色化、专业化发展道路,在法学研究领域大胆探索,不断总结办刊经验,逐步成长壮大,在学界享有较高的知名度和影响力。2006年底,《上海政法学院学报》被南开大学科研评价系统认定为政治、法律类核心期刊;在2008年3月15日《光明日报》公布的中国人民大学书报资料中心“复印报刊资料”全文转载量的统计排名中,《上海政法学院学报》在所属的政治法律类1269种报刊中排名第25名;根据2011年北京大学“中文核心期刊目录”的分析统计,《上海政法学院学报》在全部法学期刊中位居第31位。本刊已连续六届成为上海市优秀学报、连续四届成为全国高校优秀社科期刊,2018年11月入选中国人文社会科学期刊AMI综合评价报告核心期刊(扩展版)。本刊为国家哲学社会科学学术期刊数据库,CNKI中国期刊全文数据库、北大法律信息网、万方数据-数字化期刊群、超星数据库、龙源期刊网和中国学术期刊(光盘版)全文收录期刊,上网即可查阅到本刊创刊以来的全部稿件。

  近些年,以创建一流法学学术期刊为目标,在学校领导及学界、学术期刊界等各方的大力支持下,经过编辑部全体人员的共同努力,《上海政法学院学报》的学术质量及学术影响力都有了明显的提高。影响因子从2016年的0.237上升到2020年的1.97;刊文被《新华文摘》《中国社会科学文摘》《人大复印报刊资料》《高等学校文科学术文摘》等权威二次文献转载和摘编的篇次也明显提高;法学期刊学科排名从2016年的57名上升到第36名。

  本刊以“问题意识”为导向,聚焦社会、学术前沿和热点问题,并以此为支撑进行选题策划和栏目、专题设置。2021年第1期在中国人民大学王利明教授、杨立新教授、郭锋副主任等学界大咖及实务界专家和中青年才俊的大力支持下,成功地出版了《民法典》专刊。现已(拟)开设主要特色栏目及专题有“学术关注”“上合组织法治”“新兴权利法律问题研究”“党内法规研究”“域外借鉴”及“<民法典>的解释和适用"“<民法典>背景下的公司法修改”“生物安全法治”“刑事合规研究”“刑法修正案十一专论”“网络法治”“大数据法治”“人工智能法治化”“区块链法治化”“电子商务法治”,等等。

  35年来 , 我刊虽然取得了一些进步,但同全国许多优质兄弟期刊相比还存在着很大差距和不足。我们诚挚地欢迎广大海内外科研工作者关注和支持上政学报并惠赐大作,也欢迎各界朋友积极建言献策、批评指正,以期共同办好《上海政法学院学报(法治论丛)》。来稿请通过《上海政法学院学报》编辑部网站(http://www.shupl.edu.cn/xbbjb/)投审稿系统进行投稿。本刊对来稿严格遵守三审(二审外审)定稿制度,以确保稿件选用公开公平公正。  

  本刊刊稿版权包括纸质版与网络版版权,属于《上海政法学院学报》编辑部, 任何形式 、媒介的转载、摘登译或结集出版均须标明来源于本刊。刊稿仅反映作者个人的观点并不必然代表编辑部或主办单位的立场, 本刊不以任何形式收取版面费。


以法为基,寻社会治理之策

以文为器,求兴国安邦之道


投稿邮箱:xuebao@shupl.edu.cn

微信公众号:law-review1986

网址:http://www.shupl.edu.cn/html/xbbjb

电话:021-39227617  39227619



更多内容请点击下方“原文链接”进入学报官网查看

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存