每次过马路,我们都会听到汽车鸣笛的声音,提醒我们注意安全。这次鸣笛事件,似乎隐约提醒了我们一些事情。
据国家网信办发布的消息,滴滴出行App因严重违法收集使用个人信息被下架。由于滴滴是《国家安全法》实施以来第一家以此名义宣布接受调查的公司,舆论纷纷猜测滴滴为了在美国上市,将中国道路信息和用户数据泄露到美国。滴滴事件的前因后果尚未尘埃落定,但已引起我们的一些联想和思考。
滴滴出行是网约车市场的领头羊,国内市场占有率达90%,全球年活跃用户数达4.93亿。滴滴出行收集大量用户个人信息和实时移动数据,依靠强大的数据计算能力,把每个区域划分成一个个小六边形。滴滴出行可以提前15分钟掌握这些小区域的流量,准确率超过85%。滴滴出行可以对每一位出行者进行画像,用户的活动范围、出行习惯等都能被精准掌握。依靠这项技术,滴滴出行的调度机制无疑会更加灵活、更加精准。依靠此,滴滴出行不仅服务于自己,还能向政府交通管理部门提供精准的出行数据和道路动态,这就是滴滴的强项。
滴滴的大数据无疑为出行提供了极大的便利。然而,人们越是享受数字化带来的便利,就越是担心自己的隐私问题。并不是每个人都打车,但几乎每个成年人,甚至未成年人都在使用手机。在中国,不可能对手机用户做出绝对准确的统计,但可以肯定的是,三大运营商掌握的用户信息比滴滴掌握的要广泛、全面和深入得多。对于任何以数据为核心的公司来说,数据一定是它最核心的资产。互联网公司收集着海量的用户数据,为了实现商业价值的最大化,它们或多或少会将数据分享给第三方。最常见的情况就是用来做广告,这几乎是不可避免的行业惯例。也许你昨天刚在某视频软件上看了一段关于夏装的视频,第二天就在购物APP的“猜你喜欢”里看到了同款。
同样的数据,在不同的场景下可以发挥完全不同的作用。用户的购物信息如果掌握在自己手里,是毫无价值的,但企业可以将其作为各种判断的依据。比如,如果某个产品在某个地区的销量特别高,企业可以利用这些信息提前在仓库多备货,缩短物流时间。但这也涉及到数据流通的问题。
通过分析这些出行大数据,我们还可以看到不同城市的教育、医疗资源的分布情况,长期的观察可以揭示城市经济、社会资源的发展变化……
同时滴滴出行在中国进行了五年的高精度地图测绘,包括山、路、水等大量精准的数据信息,滴滴掌握着最核心的地理数据,如果再叠加卫星高清图,整个中国的地理数据/场景就完整地呈现出来了。
人们的行动数据和信息已被系统性、大规模地掌控。一旦这些数据落入“敌人”之手,后果将不堪设想!在个人层面,仅凭一手数据就能轻易暴露每个人的住址、习惯、职业、单位,甚至隐私;在国家层面,一手或二手数据完全可以确定中国的交通节点、人口和产业集聚区,甚至进一步研究中国的大政策、大举措。
现在是万物互联的时代,万物皆数据——万物皆有数据:比如国外某品牌的汽车和一些手机厂商,我们并不知道这些产品底层是否隐藏着数据收集功能。我们在智能手机上下载应用时,有些手机会弹出权限询问权限,一旦我们勾选“允许”,这些应用不仅会获取我们的基本身份信息,还会获取我们手机里的其他信息,甚至知道我们还安装了哪些其他应用。这些数据不仅是企业做精准营销的手段,一旦被不法分子利用,后果不堪设想。
即使是看似微不足道的静态数据,也蕴藏着巨大的潜在价值。1964年,《中国画报》封面刊登了“钢铁侠”王进喜在大庆油田的照片。日本情报专家根据照片中“钢铁侠”的衣着判断,这样的衣服只有在北纬46至48度之间地区冬季才能穿,从而判断大庆油田位于齐齐哈尔和哈尔滨之间;又根据“钢铁侠”握着钻杆的姿势,推断出油井的直径;根据“钢铁侠”所站钻井与后面油田的距离、井架的密度,推断出油田的大致产量和储量;日本人趁来华之机,测量了运输原油的列车上灰尘的厚度,大致确认了这个油田与北京的距离。随后,日方根据这一情报,迅速设计出了适合开采大庆油田的设备。 当年中国政府向世界各国征集大庆油田开发设计方案时,日本一举中标。
日本人从一张照片、几篇报道就能挖掘出有价值的信息,在现代社会,互联网公司掌握的海量数据的价值是不可估量的。
抗日战争时期,八路军缴获了日本人绘制的中国地图,发现这张地图比八路军自己测绘的还要精确,甚至比国民政府绘制的地图还要准确。地图上清楚地记载了各个城市的军事装备和军事部署,以及各个城市的地形地貌。从每一条道路到每一条山脉河流,都记录得十分详细,甚至把一个村庄里的房屋、村庄旁边的河流、村庄附近的道路、村庄里有多少口水井都标注得十分详细,堪比现在的航空摄影技术。经过询问,得知这张地图是十几年前制作的,他们对每个城市都已经做过十分细致的研究和规划,对每个城市的气候、地形、变化都了如指掌,甚至比中国土著还要熟悉中国每个城市。
抗战时期的科技水平远不如今天,日本人几十年前画的地图,几十年后在战争时期还能用。现在我们的经济发展日新月异,我们掌握的数据是实时的、瞬时的,精确到厘米。如果爆发战争,我们完全可以进行外科手术式的精确打击,不需要现代武器,不需要原子弹,只要攻破一个城市的电网数据、金融系统、工业互联网系统,这个城市就瘫痪了。
上述联想确实让我们十分担忧。日益严重的隐私危机亟待解决。如何从根本上解决数据垄断,真正保护用户隐私是当下最重要的问题。理论上,我们不仅需要严格界定重要数据的所有权和使用权,还需要出台相应的法律规则,确保这些规则的落实。
国家网信办表示,滴滴“在收集使用个人信息方面严重违法违规”。但是,如果滴滴不收集信息,就无法保证高效出行。就像我们去医院验血,不采集血样,就无法判断病情。但是,如果医院把所有患者血样中的DNA数据向外界出售,这种行为一定是违法的。那么如何界定这种“违法”行为,非常重要。无论是互联网用户数据,还是医院血样数据,这些数据都是在企业自身业务范围内产生的。从运营产品的角度看,企业对数据应该拥有产权,因此有权处置和交易。但是正如上文所说,这些数据一旦泄露,必然会造成危险。因此,我们的《数据安全法》应该配套相应的实施细则。企业即使对数据拥有“产权”,也不能不管场景如何,任意使用数据。因此,有效数据监管的一个重要环节,就是界定数据的使用场景。 这些法律法规不会阻碍数据的连接和流通,反而会让数据流通更加安全有保障。所以数据的分类很重要,哪些数据一旦授权就可以采集,哪些数据在特定场景下可以采集,哪些数据是绝对不能采集的。分类的标准应该参考数据的重要性,一旦泄露危害的程度。分类的细节,要分多少类,怎么分,各个行业之间有哪些相同点和不同点,都需要运用严格的统计学理论,是一个长期、持续完善的过程。
深度分类是统计学在数据科学中的强项,依据《数据安全法》进行数据分类,不只是数据本身的分类,还涉及到行业背后的知识背景以及分类之后的效果验证。
滴滴赴美上市确实有试图规避国内监管的嫌疑,但归根结底,其直接目的是为了尽可能多地盈利51吃瓜中心-吃最新最真的瓜,而非所谓的“泄密”。在国外上市必然要接受国外的法律和审查,但同时,外资进入,我国是否也需要制定相应的审查规则和法律,对投资人的资质和意图进行审查,而不是一味的接受?事关国家安全、国际民生、公共利益的信息和数据,绝不能被资本劫持。国家安全不容资本插手。
到目前为止,政府监管和市场监管是当今两种主要的监管手段。国有资本受到政府监管,非国有企业受到市场监管。在大数据信息时代,国家应该寻求建立一种新的经济治理机制,而不是非此即彼。我们应该做的是科学地界定市场监管和政府监管的结合边界,做好结合。三大运营商、大型公立医院是国有企业,受到政府监管。滴滴出行、字节跳动等民营企业受到资本的约束,市场起决定作用。如果政府对这类企业过度监管,不仅会浪费政府资源,也在一定程度上延缓信息技术的发展;但如果政府完全不管,就会造成这些企业的无序发展,从而造成市场混乱。因此,我们应该科学地界定:哪些领域需要开放,哪些领域需要政府监管,哪些领域需要政府和市场协同监管。至于怎么监管?谁来监管? 统计学和数据科学是监管的工具和底层技术,应充分发挥统计学的学科优势,让相关行业协会引领行业自律,发挥政府与市场的纽带作用,配合监管部门科学制定政策,才能共同建设有效的政府和高效的市场。
北京大数据协会
吉思良
2021 年 7 月 11 日
暂无评论内容