罗汉堂

陈龙:如何理解数字时代的数据与隐私

在会议中,罗汉堂秘书长陈龙代表所有报告作者,简单介绍了报告内容。通过回顾数据分享对于人类社会协同的意义,以及历史上经济学家们对有限信息和信息不对称的研究,陈龙指出,数据经济学就是大数据时代的信息经济学,其核心是要理清数据价值,以及数据应用所带来的三个方面的问题:包括隐私保护、数据权属和价值分配,和大数据相关行业的市场竞争。

陈龙教授分别从六个角度出发介绍了报告对大数据时代的数据隐私问题的理解:

1.理解个人对隐私的态度和行为

随着经济数字化,全球范围内都出现了一种“隐私悖论”的现象,即用户一边表达对隐私的强烈担忧,一边却愿意分享更多的数据。对于这种用户对待隐私“言行不一”的现象,通常的猜测是用户分享数据的行为是有悖于他们的意愿的,要么他们是“被迫”的,比如用户不得不使用脸书,不然就被排除在社交圈之外,要么他们选择分享的时候不理智,没有考虑到隐私问题。

为了理解“隐私悖论”背后,用户到底是如何看待隐私,又是如何做出隐私相关的数据分享决策的,罗汉堂做了一个大型的用户隐私行为研究,分析了5万个支付宝小程序中,用户的授权(opt-in)和取消(opt-out)行为。在这个实验中的5万个小程序所需要的信息不一,且提供的服务不同;而且这5万个小程序都不是像脸书那样提供“必需”的服务,因此,用户也是有选择的。

根据罗汉堂的研究,大部分的用户(平均75%)都选择授权信息分享。一旦选择授权之后,很少有人(平均0.12%)会后悔,这个取消率与其他地区的比率相似(美国0.23%,加拿大0.16%,欧盟0.26%)。然而这并不意味着他们不关心隐私,恰恰相反,一旦发生隐私泄露的事件,取消率会迅速上升。虽然用户对于新的小程序的接纳度很高,但是也会更倾向于取消对那些不受欢迎的小程序的授权。另外,个人信息的敏感程度对用户的决策也有影响:他们对更敏感的信息授权率更低。并且随着年龄的增长,和数字经验的增长,用户会更谨慎,但长期来看,最终他们会选择拥抱数据分享。

陈龙教授指出,罗汉堂的发现与全球其他地方的证据是一致的,即大部分用户是愿意分享个人信息,以换取更便利的服务的。并且,罗汉堂发现,正是那些使用数字服务更多的人,反而表现出更高的隐私担忧。小程序的隐私行为分析表明,“隐私悖论”的根源,可能恰恰在于,人们需要数据分享,但同时也需要更好的隐私保护。这就引出了下一个问题,人们需要数据分享的原因是什么?数据的价值在哪里?

2.数据的价值在哪里?

通过数据分享来交换信息,是经济活动不可缺少的一部分。总体而言,包括连接、智慧和信任三个部分:

第一:连接的数字化:实时数据分享连接供需双方,让原本不可能的经济活动变得可能。例如:传统的贸易主要集中在方圆10公里之内,出了这个范围,信息沟通和信任成为很难逾越的成本。但是,阿里巴巴在线购物平台上的商品,买卖双方的平均距离接近1000公里,传统对经济交互的时空束缚已经被打破。

第二:信任的数字化,网络平台上的每一个商家、每一个商品、每一个服务环节,都通过用户自发评分的数据构建信任体系,让上亿人和上千万商家可以在不用见面的情况下交易。

第三: 决策的数字化,例如网商银行的“310”服务2000多万小微企业,这引发了诺奖者Holmstrom(霍尔姆斯通)的评论:“信息是新的抵押品。”还有阿里巴巴生意参谋,给小微企业提供市场信息,帮助他们提高销售。

另外,陈龙教授介绍了南加州大学孙天澍教授对个性化推荐功能的实验研究,该研究发现如果不使用个人数据,页面的平均点击率会下降77%,而产品的平均浏览量会下降33%。

数据分享可以实现人和人的连接,让生产者知道如何更好的服务消费者,可以建立信任,可以帮助做更聪明的决策。因此,如罗汉堂和普林斯顿大学的熊伟教授的联合研究提到的:“应对个人数据更好的方法不是将数据锁起来,或者提高数据分享的成本,而是提高隐私保护和数据安全的效果和效率。”

3.如何在推进信息分享的过程中保护隐私?

有效的隐私保护需要隐私工程化(privacy engineering)和隐私保护技术(privacy-enhancing-technologies,PET)的结合。

一方面,正在全球兴起的隐私保护工程(Privacy Engineering),就是以用户隐私保护为核心原则,把隐私保护工程化。通过把隐私保护的目标前置,从产品设计开始,就把隐私保护放在与用户体验同等重要的位置,并贯穿整个产品优化的始终,让“用户第一”的理念延伸至隐私保护的领域。

另一方面,新兴的隐私保护和数据安全技术(PET),包括密码学隐私、人工智能隐私、可信硬件隐私、差分隐私等,可通过算法或者硬件设计,提取和分享有效信息的同时,从源头上降低个人信息风险。

将隐私保护工程和技术结合得好,将会成为企业重要的市场竞争力。保护隐私应该从“懂你却不知道你是谁”的设计思路出发,大力发展新兴的隐私保护技术和产品,最终实现普惠的、小企业可负担的、可规模化、低成本的隐私保护。

因此,随着隐私保护工程化和技术能力的发展完善,隐私风险并不一定随着数据体量的增长而失控。就像食品行业和航空业的发展一样,随着技术的进步和管理的规范,食品安全问题和空难发生的概率并不会随着行业的增长而增加。

4.理解数据和隐私问题的整体框架

基于前面的分析,陈龙教授介绍了一个理解数据和隐私问题的整体框架。首先,对于这些问题的思考必须基于一个整体性原则性的共识,即:数据分享是经济活动、创新和各种机会的根本驱动,因此我们需要在保护数据主体权益的同时推动数据流动。

要达到这个目标,我们需要从数据和信息的本质出发。数据有两个特征,一是非竞争性,数据并不是石油,而是像火一样可以被传递。这意味着数据可以被无数的“所有权”和使用,而并不会损耗。这也引出另一个有趣的问题,谁生产了数据?陈龙教授指出,数据主体往往不是数据生产者。比如今天陈龙教授的发言,他是数据主体,他说的话被参会的所有人看到、听到,就在生产数据,所有人用自己的耳朵、眼睛、大脑生产了数据。同时相关的还有数据应用场景,数据在真实的经济活动中才能持续的产生。

数据的第二个特征是不可分离性。数据主体和数据生产者很难被分开,这意味着数据很难被赋予单一的所有权,而是多方共有。因此,保护隐私应该强调在数据使用中的保护。

最后,我们还需要在市场机制下实现数据价值的分配,通过参与市场经济活动,让参与数据分享的各方都从数据分享中受益。

5.数据治理的逻辑

事实上,隐私保护立法原则的演变,与上面提到的数据整体分析框架是一致的。20世纪70年代初期的公平信息原则(Fair Information Practices,FIPs),是现代隐私保护立法的基础,例如FTC, 1980年OECD指南,GDPR,CCPA等。公平信息原则的目标,并不是把数据锁起来,或者规定所有权,而是推动有效隐私保护下的数据流动。

例如:1980年的OECD指南提到“统一各国隐私保护立法,在维护隐私这种基本人权的同时,防止国际数据流动不被打断。”2016年FTC的立法提到“大数据的价值最大化的同时降低风险。”2019年美国司法部隐私和公民自由办公室主任,首席隐私官,彼得·韦恩说过“不论是对一个公司,还是一个国家,或是司法部,任何机构的有效运转,信任是根本要求。大众总是误以为网络隐私管理必须在利维坦式的绝对的集权式社会控制,和完全基于私有产权的自由市场式制度之间做选择。”

6.大数据和市场竞争

关于大数据和市场竞争的关系,一个根本的问题是:在多大程度上大数据的使用带来了市场竞争的各种问题?这包括三个方面,即大数据的使用是不是导致了赢家通吃?是不是伤害了消费者?是不是阻碍了竞争?

首先,大数据是不是会导致赢家通吃?从事实证据和趋势看,在中国与大数据高度相关的一些主要行业,表现出以下几个趋势,和高竞争行业的特征相符。第一,行业头部集中度逐步降低。例如电商行业,在阿里和京东的先发优势下,拼多多短短几年内就在用户数和GMV上达到相当规模,目前市值达到2400亿美元。作为移动支付的先行者,蚂蚁集团在2014年的移动支付市场份额接近80%,而到2019年,该份额已下降至43%。在数字广告行业,2019年, 随着字节跳动和美团的崛起, BAT的互联网广告份额由2018年的69%削减至63%。搜索类平台广告的比重已由2018年的21%下降至14.9%。第二,企业崛起快,衰落也快。例如,网络社交行业,产品从投放到积累10亿用户的时间越来越短,脸书用了15年,Twitter用了14年,WhatsApp用了9年,微信、照片墙仅用了7年,TikTok仅仅用了2年多。2000年美国前50的科技类公司中,至今24家已不复存在,剩下的一半中,5家已经退出前50,另有8家排名在倒退。

从逻辑上看,数据是商业模式中的一个重要因素,但无法保证“赢家通吃”。第一,商业竞争的核心是商业模式,数据是商业模式的一部分,必然受制于商业模式。例如虾米和天天动听不能保证成功,真正受益的是版权方,而充分竞争的平台方反而亏钱。第二,数据与有商业价值的信息之间存在巨大的距离,需要数据能力和商业判断力才能发挥数据的价值。第三,现存数据的价值衰减很快,数据量的优势本身没有可持续性:新的数据随着经济活动不断出现,其时效性则逐渐降低。第四,网络效应并不能维持数据的“先发优势”。它是双刃剑,既加速好产品被市场接受,也加速坏产品被市场淘汰。

第二个问题,大数据的使用是不是伤害了消费者?首先,大数据带来的主流趋势不是杀熟和歧视,而是普惠,即让更多的人获得可承担的优质服务。亚当·斯密在国富论中提到“[路、运河、可行船的河道等]通过降低本地的垄断而有益于村镇……尽管他们在旧市场上引入了新的竞争性商品,但他们也给生产者提供了新的市场。”和亚当·斯密提到的打破垄断的逻辑相似,电商的发展也打破了本地垄断,让线上线下的价格差别更小,更低。其次,数字时代,消费者和企业之间存在长期、高频互动的伴随关系。“大数据杀熟” 不符合企业的长期利益。传统经济中,企业不知道消费者是谁,必须在每一个环节获利。在数字时代,商业逻辑从B2C改变为C2B,长期满足消费者需求、而非每单获利,成为商业的核心逻辑。杀熟的短期行为不符合商业逻辑,虽然有个别案例,与大部分证据不符。

第三个问题,大数据使用是不是阻碍创新?事实上,大数据的发展,本质上需要创新驱动,也带来创新,而非阻碍创新。第一,在数字技术改变比较充分的几乎所有行业,最显著的特点是用户驱动和商业模式创新。第二,从线上到线下,从打破地域边界到同城服务,因为有了数据,最显著的特点是新品牌、新品牌的崛起,对用户需求的快速响应和创新迭代。第三,在大数据时代,创业者可以低成本地使用最先进的数字化基础设施(移动互联、云计算、人工智能等),创业和创新更加容易。例如阿里巴巴平台上,涌现出了各种各样的品牌;在苹果的应用商店,也涌现出大量创新性的、有价值的产品和服务。

0 条评论

评论请

加载中...

00:00:0000:00:00