12月11日,由山东产权交易中心、齐鲁交通信息集团有限公司、中国联通山东分公司、上海数据交易中心、山东乾云等5家机构发起成立了山东数据交易有限公司。这家国企打头阵的地方性大数据交易平台恰恰诞生在号称最严监管时代到来的2019年,一场大数据行业诞生以来最大规模“地震”正在发生。那么,到底哪些数据可以买卖?
“你怎么知道我开车习惯不好?谁告诉你的?!”
汽车厂商说,为保障车主更好地使用汽车,延长汽车寿命,他们在车上装了传感器。车主开车时,行车数据通过网络回传汽车厂商。数据显示,驾驶员有不良开车习惯,汽车厂商把这些数据卖给保险公司,保险公司据此给车主增加保费。
“你怎么知道我开车习惯不好?谁告诉你的?!”车主一句反问,就把这个听起来很酷的大数据商业模式“呛死”了。
车主授权汽车厂商收集自己的行车数据,为的是更好地使用汽车,一旦超出这个范围,不经车主二次授权,汽车厂商凭什么把行车数据卖给保险公司?
就是因为大数据商业价值太大!
全球最著名的投资银行高盛,每年大概要花4亿美元从第三方购买数据,这其中包括全球各地电视台的字幕提要等。
那么,全国300个重要城市过去三年气象数据身价多高?
曾有家电厂商出价一千多万,想购买包括温度、湿度在内的全国300个重点城市过去3年气象数据,来辅助产品设计,提高家电产品使用寿命,但这个买卖其实有价无市。气象部门每天会公布天气数据,但过去三年300个城市整体天气变化数据,属于国家战略资源,是不对外公开的。
上海数据交易中心承建大数据流通与交易技术国家工程实验室,其《数据流通禁止清单》画出的“边界线”是——
不能流通的个人数据有:未经个人授权,可直接识别到特定个人的身份数据、个人敏感数据、特定个人财产数据严禁流通,包括公民身份号码、社保号、驾驶证、护照/台胞证等有效证件号码;电话、微信、QQ等即时通信账号、E-mail地址;个人姓名、民族、出生日期或年龄、本人相片;婚姻状况、工作单位、学历、履历等个人数据;常住户口所在地住址或家庭地址;指纹、健康疾病等生物数据;收入和支付记录、银行卡账号、证券账户数据、房屋登记数据、保险单。
不能流通的企业数据有:未经企业授权的和涉及企业商业秘密的不得流通,包括财务数据、产销数据、货源数据、工艺配方、技术方法、计算机程序等。
贵阳大数据交易所的交易规则第一条就是:用于交易的数据不是底层数据,而是数据清洗、建模、分析的数据结果。
“目前,这个行业的法律法规很模糊,很多公司都是撞线式经营。”曾任华为大数据业务总监,现为国内大数据公益组织中国首席数据官联盟创始人刘冬冬对齐鲁晚报·齐鲁壹点记者说。
今年以来多家P2P平台和催收公司被查,这些P2P公司给个人贷款时的风控数据从哪儿来?催收公司手中掌握的欠债人社会关系图谱又从何而来?在多个省份展开全部取缔P2P网贷的行动时,公信宝、天翼征信等多家爬虫公司、征信公司和大数据公司被查或被列入警方调查名单。
来自警方的行动已经给公众勾画出一条大数据交易的灰色产业链,这个市场上的正规玩家却生意寥寥。
“正规军”成立4年交易额4亿,地下黑市撞线经营
贵阳大数据交易所是中国首家大数据交易所,成立于2015年4月,挂牌之初预计未来3到5年日交易额突破100亿元,其第一笔交易卖方为腾讯及广东省数字广东研究院,买方为京东云平台,中金数据系统有限公司。

贵阳大数据交易所官网信息显示,这家交易所目前可交易数据产品数量突破4000个,涵盖数据源、模型算法、数据安全等八大类,涉及金融、电信、卫星、农业等30多个领域,成交量前三的是金融数据、行为数据、企业数据。
公开报道显示,贵阳大数据交易所2015年交易额不到1000万元;截至2016年9月1日交易额累积突破1亿元;2018年3月交易额突破1.2亿元;2019年5月交易额累计超过4亿元,这与挂牌时预期的“日交易额突破100亿元,形成一个万亿市场”相差太大。
记者从天眼查查询到,截至2019年6月,全国工商注册了28家大数据交易中心。此次山东数据交易有限公司成立,与之结盟的上海、青岛、江苏、安徽四大数据交易中心都是“国字头”。贵阳大数据交易所、上海数据交易中心、数据宝,武汉东湖、钱塘数据等几个市场知名的大数据交易公司均为国有控股,采用会员制模式交易买卖,贵阳大数据交易所会员就有泰康人寿、宝武集团、中信银行、中国联通、天弘基金、华为、阿里等3000多家。
由于交易中心挂牌必须金融办审批,且接受严格监管,很多业务不能从事,这就形成了一个反差——“国字头”交易不活跃,而地下黑市交易正在形成一个隐形的万亿市场。
你如何勾选“同意”?谷歌被罚5000万欧元,都是这两个字惹的祸!
“大数据交易是否合法,判断标准有两条,来源是否合规,使用是否合规。”浪潮云总裁肖雪对齐鲁晚报·齐鲁壹点记者说,现在最大问题就是在未授权情况下超越权限使用数据。
2018年5月,欧洲实施号称史上最严网络数据管理法规《通用数据保护条例》(简称GDPR),对个人信息保护覆盖了收集、记录、存储、修改、使用、传播等与个人数据有关的几乎所有环节。被保护的个人数据,除了姓名、年龄、住址、身份证号码、IP地址等常规信息外,还包括指纹、虹膜这些生物识别数据,违者最高处以2000万欧元罚金。
GDPR尤其强调个人用户“知情权”,个人信息如何处理、用在哪、存在哪、谁来保管,用户都有知情权,使用时必须事先征得数据主体同意,这个“同意”必须是具体的、清晰的。今年1月,谷歌被法国数据保护监管机构罚款5000万欧元,因其在注册页面将用户“同意”选项设定为“全局默认设置”,其中包括“个性化广告”选项,用户只有勾选所有协议后才能注册,监管机构认为谷歌有“强制同意”嫌疑;另外,用户无法充分了解谷歌在对个人数据处理过程中是否可能将其用到谷歌搜索、Youtube、谷歌地图上。
在中国,类似事情司空见惯。
“像个人手机里的通讯录,搞旅游的APP,搞餐饮的,打车软件,都要求获取你的通讯录权限,只要勾选了,社交关系就被掌握了;不勾选,基本上没法用这个APP,相当于一个强绑定关系。”一位业内人士告诉齐鲁晚报·齐鲁壹点记者。
2017年12月, 齐鲁晚报·齐鲁壹点记者在参加2017中国(济南)新金融高峰论坛时,论坛嘉宾、时任小米金融首席风控官、小米信贷业务负责人陈曦说,“现在,MUI、小米网等平台上日均搜索量超过万亿次,日活上亿万次,还有应用商店,客户下载的APP、小米音乐等来自软件的系列服务,小米的数据量非常大非常全非常广。所有数据都集中在小米云平台上,比如个人基本信息,偏好、金融基本属性、社会关系挖掘等,利用这些平台收集起来的信息,能够对客户做一个清晰画像。”
陈曦表示,小米金融的特征库一共六层1400个类别,第一层分成客户身份特征、财务状况、生活方式等六大类,在此基础上逐渐细化,一直到第六层1400个类别。
陈曦在现场一直强调,对于数据和隐私的保护是小米最核心的一点。小米大数据平台所用数据都是经过用户授权,全部隐含掉所有个人信息,分析模型在此基础上再拷贝,经过用户授权回到原来的数据库里。

坐拥“数据金矿”的互联网巨头,其实如履薄冰,科技就是一把双刃剑。2018年4月,Facebook陷入隐私泄露丑闻,扎克伯格在美国国会接受长达10小时质询,最终道歉。
“数据铁笼”里关的是什么?
天眼查数据显示,目前山东省内从事数据交易的公司有一百多家,大数据交易中心有5家,包括青岛大数据交易中心、山东省先行大数据交易中心、山东省新动能大数据交易中心等。
青岛大数据交易中心官网显示,政府数据、企业数据、运营商数据、互联网数据等都在交易之列,其特色产品船舶基本信息及最新船位查询,定价为一次0.62元。运营商数据交易涉及基站查询、手机号码归属地查询、IP查询等,价格在0.01元/次;根据手机号码查询用户年龄区间、近三个月平均通话时长、平均上网流量等。
国内领先的大数据交易平台天元数据网,数据供应商有1000多家,汇集用户2万多,重点聚焦产业创新。
目前,浪潮还承建大数据流通与交易技术国家工程实验室。浪潮集团大数据公司副总经理姚民伟说,在探索商品标准化、数据交易定价、交易规则,数据交易保障等方面,浪潮进行了不少探索,通过“数据铁笼”技术,让数据可用不可见,以保障数据安全和隐私。
以浪潮的“一贷通”业务为例,王先生要贷款,授权浪潮使用其个人数据做风险评估,王先生的社保数据属于政务大数据,由政府监管,浪潮还需再次获取政府授权方能使用。银行要给王先生放贷,付费使用浪潮提供的针对王先生的大数据风控服务。
这个过程中,王先生的个人数据会不会被错用滥用?会不会被不当盈利?浪潮采用“数据铁笼”技术,让王先生的个人数据“可用,不可见”。
浪潮正在挖掘的健康医疗大数据,更是一座“钻石矿”,但相关政策制定落后于产业发展。比如说,中国北方健康医疗大数据中心落地济南,按照规划,未来中国北方6亿人口健康医疗大数据要汇集到济南,这些数据汇集过来后怎么用?
目前,国家在健康医疗大数据的流通方面采取了极为慎重的态度。浪潮云总裁肖雪对 齐鲁晚报·齐鲁壹点记者说,一个人的健康医疗大数据是隐私问题,一个区域的汇集就涉及到战略安全,种群问题。

长沙马王堆汉墓出土千年不腐尸身后,日本曾多次向中国提出要求赠送或重金购买一根辛追夫人的头发,以研究古人DNA,被中国政府拒绝。
健康医疗大数据应用在医保控费上效果显著。如果没有个人健康医疗数据,保险公司在产品设计上只能一刀切。在美国,健康管理公司的服务对象是大众,直接客户是健康保险公司。保险公司通过和健康管理公司的合作,大大降低了医疗险赔付成本。据美国霍普金斯医学会统计,由于健康管理公司的出现,健康保险公司直接医疗开支降低了30%。
齐鲁晚报·齐鲁壹点记者了解到,在健康医疗大数据方面,目前,浪潮和德华安固、太平洋等保险公司签订了战略协议。浪潮从事这项业务经过了层层授权:第一,政府授权,同意浪潮从事和健康医疗大数据有关的运营;第二,涉及个人隐私的必须有个人授权。在买保险时,投保人会签协议,授权保险公司查询其个人医疗信息。
最终,浪潮提交给保险公司的,是根据个人健康医疗大数据分析后得出的可否成保的核保服务而非个人原始数据,这还是体现了保护用户“个人识别信息”的重要逻辑——“可用,但不可见”。
物联网、工业大数据如何定价交易?新技术挑战监管者智慧
业内人士对 齐鲁晚报·齐鲁壹点记者说,大数据交易还面临很多政策、产业问题。在大数据交易上有些基本问题没有解决,做得越大,政策风险和业务风险都会越大。
比如说,在下载一些电商交易APP时,你在用户协议勾选“同意”,平台会收集用户的消费大数据,分析用户的购物倾向,向用户推荐“猜你喜欢”,那么,平台通过推送获取广告收益,是不是该分给用户一点?
人工智能公司银河水滴的核心产品“步态识别”,科大讯飞的声纹识别都在进行商业化探索。每一个人的声纹和步态都是独一无二的,这些个人信息如何保护?
物联网数据、工业大数据如何定价交易?按照GDPR规定,通过传感器从物联网设备中收集数据,同样不能免除约束。界面新闻的报道称,海尔、华为等在欧洲有较大市场份额、并有意进军物联网的制造业领军者,已雇请专门团队应对GDPR。
从2015年到2018年,中国监控摄像头用户从2.1亿增长到3.49亿,平均每人每天要被不同摄像头捕捉300次,这些摄像头或许就来自于你路过的一家路边店。去年10月,一家奥地利企业因安装的摄像头拍到了公共场所被罚4800欧元。中国如何规范摄像头的使用?2017年,艺术家徐冰通过下载网上流传的监控视频作为素材,剪出了一部长达81分钟的电影《蜻蜓之眼》。

《蜻蜓之眼》素材横跨17年,监控摄像头也能拍“大片”。
如何用好大数据这把双刃剑?随着最严监管时代到来,大数据交易领域出现的新问题,正考验监管者的智慧。“大数据交易,一收就死,一放就泛滥。如何用好大数据,这可能是一个漫长的过程。”浪潮云总裁肖雪说。
齐鲁晚报·齐鲁壹点记者 蔡宇丹