数据产权:互联网下半场不容回避的竞争焦点

发表于 讨论求助 2021-06-14 20:40:59

图片识别步入互联网下半场,数据已经代替流量,成为新的竞争焦点。数据归谁所有,这一问题牵涉多方利益。究竟是鼓励效率,还是支持公平性优先?是否能找出一条平衡效率与公平的解决路径? 图片来自“东方IC”

当下,数字经济在国家层面被摆到了前所未有的高度,而产业互联网的进程恰恰就是产业数字化的进程,在此过程中产生的海量数据是真正的宝藏。大数据意味着大生意,随着数据的资产化,其所带来的价值将超越我们的想象,堪称21世纪的石油。如果说,互联网上半场的竞争本质上是对流量的争夺,那么,互联网下半场的博弈从某种程度上也可以理解成是对数据的竞争。

“数据产权”缘何重要?

进入互联网时代,由于摩尔定律(处理器的性能每隔18个月就会翻番)的作用,产生了海量的数据。但为什么近年来大家才普遍关注数据以及数据产权?

经济学家哈罗德·德姆塞茨(Harold Demsetz)在其发表的论文《论产权理论》(Towarda Theory of Property Rights)中提到:产权的产生,本质上还是一个成本收益权衡的过程,只有当通过界定产权,将外部性内部化的收益大于从事这一行为的成本时,产权才会产生。简言之,当确定数据产权的收益大于确定数据产权的成本时,数据就有了确权的经济基础。

再往深层看,之所以确定数据产权的收益会变大,主要原因是数据的价值日益凸显,其稀缺性渐显,并因而具有了财产属性,甚至成为了生产要素。

当下,数据既可以成为产业互联网的助力器,也可以成为产业互联网的拦路虎。现在有不少企业已经不乐意将自己的数据共享给其他企业,或者选择自建数据体系,其原因在于权属不清容易产生纠纷,或者权益被侵犯、想维权却担心无法可依。不确定的数据产权给各方在数据的开发利用环节带来了不可控的风险成本。

由此,亟需通过立法确定数据产权以促进各方合作。正如雷布斯定理所昭示的,应通过构建法律,使私人之间由于协调失败所造成的损失达到最小。当下种种现实,均指向确定数据产权的条件已经成熟或趋于成熟,数据的收集、挖掘、开发、利用、共享与交易等环节都绕不开对数据产权的认定。

此外,对于立法、司法机关来说,当新生事物在现有法律体系下难以找到合适制度来保护时,不妨尝试用数据产权来解决。比如在菲林律所与百度AI“作品”著作权一案中,AI生成物能否成为著作权法意义上的作品引起了极大争议,如果认为不能,则一些高品质的AI生成物将面临无法可保的状态,这将极大挫伤人工智能产业的发展。对此,不妨将AI生成物归为数据,并以数据产权保护之,这样就避免了AI生成物是“思考”的产物,还是“运转”的结果的争论,因为AI生成物本质上就是一种数据。

数据产权的配比之争

近年来,企业间数据纠纷呈井喷之势,菜鸟与顺丰分歧、淘宝与美景案、微博与脉脉案、Facebook与Power公司案、HiQ与LinkedIn案、大众点评与百度案等,本质上无不是数据之争,这也代表了企业间的数据竞争已经公开化。

与之相对的是在整个数据周期中,“数据的权属到底是属于个人的,还是企业的,亦或是其他单位的”,每个主体对于数据天然地都会有自己的权利主张,但该类问题却往往被大家所忽视,而实际上,数据产权才是打开大数据时代的开门钥匙。

如果以数据为原点,那企业间的数据争夺就可以看作是数据的横向竞争,而对于数据产权在不同数据主体之间的分配诉求则可以看成是数据的纵向竞争。当下,横向竞争无疑已经白热化,并且吸引了足够的关注度,但数据产权作为数据应用的底层基石,理应更值得被深入了解。

数据产权作为权利束(A Bundle of Rights),包含使用权、收益权、占有权与处分权,甚至还包含可携带权与被遗忘权等。数据产权主体既可能包含个人用户、数据收集企业、平台企业,也可能包含政府机构与数据中介等组织。

在这里,用产权来分析数据权属更具有现实意义,必须指出,如果用现有的物权所有权制度或知识产权制度去套用数据产权归属,恐怕不可行,因为数据与实体物具有完全不同的属性,与知识产权也不尽相同。相比之下,数据具有如下特性:

1. 混合性:很多数据无法明确分割开来,可能是由上亿个不同主体产生;

2. 复杂性:数据的形成可能需要经过好几轮不同主体的产生与处理;

3. 不确定性:如何使用数据在形成数据的时候往往并不明确,后期通常还会进行层层挖掘,因此数据的价值也很难被标准量化;

4. 多栖性:因为数据方便复制携带,所以数据可以同时存在不同的介质中;

5.特殊的稀缺性:数据存在无形性,且理论上可无限复制,并且复制品与“原物”的价值等同,所以数据的稀缺性与通常所讲的资源稀缺性存在明显区别,数据的稀缺性往往体现在获取及控制使用上,而不是数据本身具有很高的直接价值,单个数据往往不具有直接的经济价值。

6. 低智力性:数据往往是反应某种客观现象,因此通常不具有独创性或创造性;

7. 隐私性:有些能够识别特定个人的数据往往具有隐私性,这也是大家觉得数据很敏感的根本原因。

基于以上特性,数据产权的认定比之前任何权利的认定显得更加复杂与棘手,我们应当允许数据产权可以分别在多个主体之间共存,径直套用“一物一权”或“登记公示”制度显然是不负责任的行为。

数据产权的终极形式虽然是由法律以明文规定下来,但如果仅从法理分析不仅过于片面,并且容易脱离实际,所以,本文将从经济角度、公平角度与现实角度三个维度探索数据产权的配比之争。

1.经济角度:效率优先

从经济角度看,数据产权在个人、企业、平台、政府及其他组织等不同主体之间的初始配比将影响数据资源的最终配置效率。

科斯定理(Coase theorem)指出:

定理I:在交易费用为零的情况下,不管产权如何进行初始配比,通过当事人之间的市场交易,都会导致资源配置达到最优状况(帕雷托最优)。

定理II:在交易费用不为零的情况下,不同的产权初始配比会带来不同的资源配置效率。

我们都知道,现实中的交易费用不可能为零,所以科斯定理I更多起理论指导作用。但可以从科斯定理II得出,产权的配比最终将会影响资源配置的效率。

假设一个人的数据仅由他自己掌握并使用,那这些数据的价值几乎可以忽略不计,效率也极低;而如果把大量个体的数据都集中到某些数据企业,最后汇总到平台企业,当数量达到千亿及以上级别,那这些数据所具备的价值将不可估量,并且可以综合运用大数据、人工智能等科技手段,使得效率、价值极大提升。

因此,我们可以得出,数据产权越向大体量级别的主体集中,所产生的价值越大,效率也越高。

但是,科斯定理即使作为经济产权领域的经典理论,其本身也具有明显的局限性。片面追求资源配置效率以及较强的理论性,导致不同人据此得出的结论可能截然相反,比如判断是否真的达到最优状态(帕雷托最优)本身就具有极大争议。

发表
26906人 签到看排名