数据确权

Web3.0 是去中心化的互联网,一个根本特征是个人持有自己的数据,或者说是个人享有自己数据的产权。数据私有化为何是一个必然趋势呢?难道让公司去持有数据不是效率更高吗?用户如何才能持有自己的数据呢?

虚拟的我

我们每天都在网上生成大量的数据,这些数据描述了跟谁聊过,去过那里,买过什么,爱好什么,这些数据就是一个虚拟的我。

持有数据是目前互联网公司的盈利方式。跟传统 PC 时代的公司不同,当代互联网公司的软件都是免费给我们用的,例如微信,Facebook ,谷歌搜索。代价是我们要把数据交给他们。这些公司于是可以通过售卖数据,精准广告等方式来盈利。所以说,数据就是21世纪的石油,是重要的生产资料,也很值钱。

Web2.0 的普遍方式是数据归持有这些数据的公司所有。目前,我们的“虚拟的我”是割裂到各个大互联网公司的数据库中的,把微信,Twitter ,Facebook 等等我们常用的应用的数据拼接到一起,才是完整的“虚拟的我”。

Web3.0 要做的一件核心的事情,就是上用户完整的持有“虚拟的我”。

为何是趋势?

个人持有自己的数据,有哪些优势,为何成为一个必然趋势呢?

首先一点是数据会越来越值钱。目前来讲,每个普通人的数据不是不是特别值钱,即使类似 Facebook 这样的大的互联网公司基于各种专业优势去通过数据获利,每年从每个用户身上也只能赚到几美元。这些数据如果现在分发到用户手中,让用户自己去赚钱,恐怕连这几美元也赚不到了。但是世界数字化的趋势是有目共睹的,未来数据会变得越来越值钱。所以用户也会越来越希望真正把握自己的数据。应该说,用户的贪婪也是 Web3.0 前进的一个真实的动力。

其次,一刀切的隐私保护策略行不通。有些用户对于年收入和家庭住址这些信息根本不在意,但是对于另外一些人,如果泄露了可能就会有麻烦。所以,如果要售卖数据,也不能由互联网公司一刀切的决定哪些可以售卖,哪些需要保护。而是需要用户自己去按照自己的情况去售卖隐私相关的数据。

第三,避免垄断,解决数据孤岛。互联网公司可以通过占用大量的数据来形成垄断地位,但是各个互联网公司之间的竞争关系,导致数据不能有效互通,形成数据孤岛。而如果数据由个人用户持有,互联网公司就需要通过拼服务来占据市场了,创业公司也会有更多的机会,数据孤岛也就不存在了。

第四,互联网公司由于法律压力,也不能充分利用数据了,导致数据自由市场受阻。以 Facebook 为例,因为剑桥分析的数据泄露丑闻,Facebook 承担了喝多社会压力。所以2019年初的大会上,扎克伯克宣布 Facebook 的聊天软件都将会采用端到端加密,这意味着只有聊天的人可以看到信息,而 Facebook 只能看到这些数据的密文。这种条件下,数据生成后是发挥不了价值的,会被删除。就跟房子确权会造成房地产市场繁荣一样,数据确权到个人,也会让自由的数据交易市场变得繁荣。欧盟的 GDPR 和美国的 CCPA 都明确注明,数据属于数据的提供者。大部分时候,提供者肯定是用户。

这些,就是未来数据产权归个人的主要原因了。

如何才能持有数据?

但是最关键的问题是,用户自己持有数据,是跟当前几乎所有的大互联网应用的运行模式背道而驰的,用户怎样才能持有自己的数据呢?

首先,当前的互联网应用的架构要做大的调整。自己持有数据意味着互联网应用本身是没有自己的数据库的。想象我们打开 Facebook ,如果 Facebook 没有自己的数据库,那么去哪里读取呢?所以对应用的架构要有大的调整,这个后续我们会用一章的内容去展开。

第二,用户要能拿到符合开放标准的数据,保存到本地。Web2.0 的互联网应用都是按照自己的逻辑结构,把数据存储到数据库中的。Web3.0 的应用要按照互联网开放标准中规定的数据结构,为用户保存数据到用户的私人存储区。例如,Facebook 目前保存好友关系会按照自己的逻辑来组织数据的表和字段结构,而 Web3.0 条件下 Facebook 必须按照某种互联网的开放标准去存储此类社交型数据。这样的好处是,如果用户不满意,可以携带数据任意的切换到一个跟 Facebook 竞争的应用中。

第三,通过立法推进。当大家意识到了持有自己数据的重要性,有可能立法规定互联网公司无偿持有用户的数据的行为为非法,那个时候,进行 Web3.0 的思路的去中心化,就成了各个互联网公司的唯一的选择。目前相关的数据保护法案还没有这么严苛,但是在美国2020年总统候选人杨安泽的政策提案中,已经有了专门关于数据产权的内容[1]。其中有一条就是:用户有权利下载到符合标准格式的完整数据以便切换到其它平台。这个和我们第二点所述内容一致。

最后,还有很多技术上的挑战要克服。例如,我发一条淘宝评论,是因为保存到淘宝数据库中才可以证明我的确是发了这条评论。基于人们对淘宝的信任,于是才相信我是谁,发评论的时候是什么时间,评论的确发到淘宝的一个商品下面了。而去中心化条件下思路就变了,通过淘宝签发的数字签名,也可以证明这些。另外,证明我的数据是属于我的,就需要去中心化的身份。售卖数据之前,会涉及到零知识证明和脱敏过程,来保护我的隐私。这些技术细节后续也都会展开。

总结

总结一下。数据产权属于个人是 Web3.0 追求的目标,也是一个必然的趋势。数据会变得越来越值钱,隐私问题日益严峻,每个人都会有意愿去掌握住自己”虚拟的我“。个人持有数据会避免数据垄断和数据孤岛,促进自由的数据市场的形成,互联网带来新的活力。真正实现用户持有自己的数据,还要很长的路,需要在应用架构,立法,去中心化技术方面同时推进。

参考: