谁拥有数据,谁得到利益
(梁淑怡/图)
(本文首发于2019年3月14日《南方周末》)
行业研究者说,企业利用搜集到的个人信息开发产品反馈用户,符合互联网“免费”“开放”的特点。
数据行业从业者说,各大企业间的数据壁垒,让用户数据的价值难以兑现。
应用程序开发者说,服务器里的个人信息、痕迹掌握在用户手中,会对企业网络安全和关键竞争力造成威胁。
公益基金会说,用户在数据交易的产业中,“权”不清晰,也少有“利”。
这是中国第一家大数据交易所一直以来向各地参观者展示着的场景:
一块等人高的显示屏下方,“贡献中国数据智慧,释放全球数据价值”的标语醒目存在,屏幕里显示的是24小时不间断的数据交易系统,买卖双方不用来到现场,在电脑两端就能提出要求,买方寻求可交易的数据,交易所为买卖两端从中撮合,待交易所将数据产品制作完成、交给买方,并得到交付钱款后,一笔数据交易就完成了。
2015年4月,贵阳大数据交易所甫一成立,就作为大数据这一新兴产业的一面旗帜,备受国内外关注。
据报告统计,2018年中国大数据市场产值将达6200亿元,目前已经拥有了包括大数据核心产业、关联产业、融合产业等近20个产业。
这一产业中,数据能够在不同主体间流动,并创造出新的价值。这些价值,取之于用户,用之于用户,但是用户想要从利润中分一杯羹,却是困难的。
据报告统计,2018年中国大数据市场产值将达6200亿元,目前已经拥有了包括大数据核心产业、关联产业、融合产业等近20个产业。(视觉中国/图)
可流通、可交易、可获利
推动贵阳大数据交易所成立,并参与起草了多份大数据产业规划标准的王叁寿告诉南方周末记者,他担任交易所执行总裁近四年来,已有两千多家公司在交易所注册、进行数据的交易买卖,在交易所能够提供的33个数据交易品种当中,还有社会大数据、社交大数据、消费大数据、征信大数据等包含着个人信息的大数据。
自2015年来,还有北京、上海、武汉等十几个城市相继建立了大数据交易中心,数据和它背后搭载的信息,被当成一种商品,在公司机构的服务器间,以每年近千PB(一种计算机信息存储单位,1PB=1024TB=1048576GB)的规模流通、买卖。“但我们这里交易1个亿,黑市交易99个亿。”王叁寿曾经这样估算。
业内人士向南方周末记者介绍,完整的数据交易过程主要包括数据收集、数据处理、交易撮合并完成、身份确认、数据流通、交易服务与安全保障等若干环节。
这一过程的主要参与者,包括数据产生者和运营者在内的数据提供方、数据使用者和消费者在内的数据需求方和包括评审机构、认证机构等在内的数据服务方。
“买方定制需求后,交易所会联系相关的数据提供方,他们在交易所得到的数据产品会融合众多数据卖方的数据源,这些数据已经在数据提供方经过了清洗、脱敏,去除了个人信息的可识别性,交易所做的工作,就是将这些无法识别到特定个人的数据格式进行规整、实现统一。”王叁寿这样介绍。
交易所依据的是网络安全法中的相关规定:“网络运营者……未经被收集者同意,不得向他人提供个人信息。但是,经过处理无法识别特定个人且不能复原的除外。”
由海量去除可识别性的个人信息汇集而成的大数据,能为商家的决策提供巨大帮助。“比如打车软件上的行程记录、购物软件上的浏览记录和购买记录,都能为公司决策和产品定位产生很大价值。公司层面,尤其是金融企业,对数据的需求很大。”王叁寿说道。
“这是企业运营的核心”
除了王叁寿,看到个人信息拥有直接或潜在巨大价值的,还有更多掌握海量数据、深耕数据行业的公司。一位金融公司项目负责人在接受南方周末记者采访时介绍,“京东建立了京东万象平台,华为设立了云数据中心,联通成立了联通大数据有限公司,阿里推出了生意参谋等。”而他所在的机构,也尝试将数据做成了金融服务产品。
上海玛娜数据科技发展基金会与湖南科技大学共同开展了一项研究,希望分析探索发现个人数据的确权、定价及未来数据交易的商业模式。他们发现,数据的收集、分析与利用在大数据时代,逐渐构成了企业运营的核心。
“拥有数据的企业会或多或少利用自身收集的收据,一部分企业将数据变成了面向客户的数据衍生品,另一部分企业则建立了数据平台来满足客户对数据的需求。”玛娜基金会大数据研究员胡晓萌说。
“这就导致企业间的信息壁垒严重。”在谈论数据交易的隐患时,王叁寿这样说道,“大的平台公司,因为本身就有海量的数据,里边蕴含着丰富的个人信息,这对他们而言,是一笔潜在的巨额财富。”
王叁寿用了看病的例子,向南方周末记者解释这笔财富的价值,不同医院病历不互认,除了医院经营层面的原因,更重要的是它们之间的信息不共享。如果用户能意识到,他们可以把自己20年来的体检记录卖给医院和研究者,这对于买卖双方,都是一笔很宝贵的财富。”
为此,王叁寿一直在推动一款叫“数来宝”的产品上线,他对产品的设想,是个人能够直接通过产品对接需求企业,在向企业提供数据信息的同时,得到经济回报。
“个人在网络平台和APP上的使用痕迹属于个人,也属于平台,企业不愿意将这些数据以开放接口的形式提供给个人,导致个人拿不到在平台上的数据,这也是这款产品目前的难点所在。”王叁寿这样说。
但一位应用程序开发者向南方周末记者解释,企业并非完全对信息不开放。以微信开放平台为例,它会向部分开发者开放如用户头像、昵称等数据,但是更多数据储存在微信数据库中,尚未开放。
难确的权
事实上有关个人数据能不能被交易的争论,从未停止过。法律允许消除了可识别性的个人信息流动,但这样的个人信息还是个人信息吗?它所产生的利润又属于谁?
个人数据从被收集,到处理,到归纳,到人工智能,再到返回用户,这就是互联网公司最简单的数据处理模式。
简单地说,一款音乐类软件中,你的听歌记录就是原始数据,而年末针对个人的年终总结就是经过处理的个人数据,而一共有10万人听了类似的歌,就是衍生数据,该软件之后给这10万人推送了同类型的歌,就属于人工智能。
业内拥有多年信息领域政策法规研究经验的李鑫城说,“企业收集的数据,到底属于商家,还是属于用户,其实依然有争议。”
实际上,如欧盟、日本已经承认企业在一定程度上对于脱敏数据享有所有权,中国关于“个人数据权益”保护的法律则体现在网络安全法、消费者权益保护法、侵权责任法、《信息技术个人信息安全规范》等法律条文和部门规章当中。
胡晓萌发现,在实际操作层面,商家在某种意义上混淆了数据的所有权与使用权。“它们认为数据在谁手里,谁就有所有权,正是由于对数据的应用,才产生了价值。而应用用户在其中的弱势地位,让商家在他们并不知情的状况下,使用甚至交易用户的数据。”
“企业对用户数据的脱敏处理,切断了用户对数据的法律联系,在数据去身份化后,它就与用户没有了法律关系。但必须强调的是,企业对脱敏数据享有的所有权应该是有限制的。只有明晰的数据产权,数据才能合理、合法地流通,进而实现利益共享。”阿里巴巴集团博士后、湖南科技大学商学院讲师叶俊杰这样分析。
但李鑫城对企业处理个人数据的态度,则持有不同观点。
“比如企业分析用户的数据,进行精准广告的投放,都是写在用户协议中,合法合规、经过用户授权的。互联网的商业模式,最大的特点就是‘免费’,那用户忍受广告就应成为一个基本共识。不然企业还怎么维持运营?”
难获的益
2018年5月,欧盟通用信息保护条例(General Data Protection Regulation,简称GDPR)正式施行。这部法律能够在世界范围内产生影响,就在于其拥有被形容为“长臂管辖权”的“域外适用性”,即数据处理公司即便不处于欧盟境内,但只要持有了来自欧盟成员国居民的数据,它管理和处理数据的行为就都受GDPR的管辖。
除此之外,GDPR还赋予用户对个人数据的“被遗忘权”“转移权”“使用限制权”“泄露告示”等权利。
GDPR生效以来,Facebook、谷歌等大型跨国互联网平台公司接连在欧盟因“滥用用户数据”遭到涉及巨额资金的起诉,另一方面,各大公司也开始聘请专业律师团队,对本公司所涉业务与GDPR的合规性进行审查。
李鑫城多次代表他所在的企业,参加了在欧洲、美国等地举办的数字经济圆桌会议。他向南方周末记者回忆,即便是欧盟地区的专家,对于如何行使GDPR赋予的权力,也感到困惑,而当地信息从业人员也更多抱着观望的态度。他认为,评估这部法律的意义,包括它是否真正保护了消费者权益,都还为时尚早,“可能甚至需要二十年”。
“GDPR本身就有两百多页条款,再附加上六百多页的指南,在政治正确方面做到了极致,但这又能对欧洲的信息产业、数字经济产生多少正面影响?事实情况是,世界十大互联网公司,没有一家在欧盟。”
但国际上已经有声音抗议数据垄断可能带来新一轮的利益分配不均。
“各大企业就像在‘跑马圈地’,将用户变为他们喂养的‘数据奶牛’。”胡晓萌对南方周末记者直言。
2019年2月,美国加利福尼亚州州长加文·纽瑟姆公开提出,将推动立法,让像Facebook和谷歌这样的平台科技公司,甚至包括收集和货币化个人数据的非平台公司——只要它们使用了消费者的任何个人信息,就应该向消费者支付“数据红利”。
“如果说数据是新的石油,那么拥有它的人(在这种情况下是互联网用户自己)应该分享从其获取的巨额利润。”
英国《金融时报》为此发表社评,呼吁从资产角度看待数据价值。报道称,数据是一种资产,消费者自身也是一种产品,只有面向消费者做广告的企业,才是平台技术公司真正的客户。
“如果它们(指该立法以及美国欧盟发生的关于数据纠纷的裁决)生效,那么大型科技公司的商业模式和估值就会相应发生巨大变化。”
关注互联网数据权益的浙江垦丁律师事务所创始人张延来对南方周末记者分析,当下对个人信息权利更多是关注其人格属性,重视它与个人隐私权的密切联系。但大数据时代数据市场的兴起繁荣,甚至是非法数据交易链的形成,个人信息的财产属性应逐渐受到重视。
“这不单强调个人信息保护,而是主张通过信息交换让信息主体和企业实现双赢,我个人很支持这样的观点。”他说。
但李鑫城强调,“首先是,这样的立法建议能够通过并施行。”
(应受访者要求,李鑫城为化名)