查看原文
其他

传染病疫情防控与个人信息保护初探之三:数据技术的应用路径

何延哲 宋杰 网安寻路人 2020-02-26

前言


在数字时代,将ICT技术运用于传染病疫情的监测和防控是题中之义。在此次2019-nCoV病毒疫情中,我们也在公开媒体中初步见到了大数据技术在这方面的威力。


比如百度推出了【百度迁徙升级版上线,人口迁徙大数据向公众开放】。第一财经等媒体也利用百度迁徙地图,就武汉人流进行了专门的报道:【500万人离开了武汉,他们都去了哪儿?


如果说上述实践中主要展示了集合性数据(aggregated data),基本上不存在个人信息保护风险的话,部分新闻媒体报道中披露出的直接披露、共享武汉人民个人信息的做法(例如【武汉人是否还应该有隐私?】),就存在违法违规的风险。


本系列短文,旨在初步探讨传染病疫情与个人信息保护之间的复杂关系。在文章中,很多时候是提出问题,但确切的答案,我自己也没有。请大家见谅。此前已经发出的该系列文章:





本系列第二篇文章已经对特殊时期收集个人敏感信息的合法性进行了分析,本文将着重探讨利用大数据追踪传染源理论上可行的思路以供参考——即此次疫情防控过程中,如何进一步高效扫除疫情“盲区”,占据疫情防控的“主动权”,又切实保障好个人权益,“个人信息”和相关大数据能否扮演更加“有益”的角色,助力打赢这场疫情防控阻击战呢?


一、获取有效个人信息的思路



据统计,我国网民规模达8.54亿,其中使用手机上网的比例达99.1%,手机和App已成为生活必备品,在疫情时期网民更是依赖于使用手机与外界沟通。以手机及App相关的个人信息为出发点,行踪轨迹最有助于精准锁定“潜在传染源”,其中相关性高的有效信息包括:

 

1、交易/支付信息

 

根据《非银行支付机构网络支付业务管理办法》等要求,以及机构对账、生成账单的必要,所有的支付机构必然留存用户的支付信息,支付信息会同时保存在用户终端、支付终端(包括专用收款终端和收款的个人手机)。同时,完整的交易/支付信息中还包含准确的时间,以及支付风控机制、专用收款终端定点部署、摊主实名登记等原因,交易/支付信息可与位置信息产生关联。

 

2、火车票/机票/汽车票等行程信息

 

根据《公共航空运输企业航空安全保卫规则》、《铁路旅客车票实名制管理办法》、《道路旅客运输及客运站管理规定》、《中华人民共和国反恐怖主义法》等要求,以及实名购买、实名查验环节的“票、人、证”一致性核对必要,需要记录有关旅客身份信息及出行信息,交通管理、公安等部门均会保留实名乘机、乘车等记录。同时,随着网络购票的普及,购票所需的实名信息、购票记录、退改签信息以及联系方式都会被相关App、网站留存。

 

3、住宿信息

 

根据《旅馆业治安管理条例》要求,旅馆接待住宿应当查验住宿人员身份证件,逐人如实登记住宿人员的姓名、性别、民族、住址、有效身份证件种类和号码以及入住、退房房号及时间等信息,登记的信息也应当通过旅馆业治安管理信息系统实时传输报送公安机关。同时,随着网络预订的普及,预订住宿的记录以及联系方式都会被相关App、网站留存。

 

4、行车/导航记录信息

 

不管是乘坐网约车还是开车自驾开启导航成为常态,而开启导航服务所必要的信息是精准地理位置。以网约车为例,其计费模式依赖导航路线,其结算模式依赖于行车记录(时间、起止地点等),其纠纷处理依赖于乘客信息(联系方式、姓名等),行车记录中包含足够的可用信息。以私家车为例,导航记录可能包括了注册手机号码、设备识别码(硬件或软件自定义)、导航路线、时间等。以收费站为例,因缴费所需,收集了车牌信息、所经路线及时间,车牌信息可与车辆登记人信息进行关联。

 

5、收货地址信息

 

网购、外卖已经成为大众的日常习惯,提供准确的收货地址也成为上门配送的必要条件。通常,配送记录、配送地址、联系方式信息等通常会被相关App、网站留存。


二、大数据关联分析的思路



(一)基于传染源地点、感染时间(段)、感染人员等信息进行直接分析


如果已知传染源地点、感染时间(段)、感染人员等信息,可以直接基于交易/支付信息、行程信息、住宿信息、行车/导航记录信息、收货地址信息,查找相关可能存在感染风险的人员,并进一步对其行踪轨迹进行关联分析,进行分析的方式包括:


1)基于手机号码进行关联分析


以上个人信息绝大多数均在手机App端和相关服务器产生(包括用户主动提供,如身份证、联系方式等,以及生成的各类活动记录),而且前提是需要注册账号。根据《移动互联网应用程序信息服务管理规定》,移动互联网应用程序提供者可以按照“后台实名、前台自愿”的原则,对注册用户进行基于移动电话号码等真实身份信息认证。目前,绝大多数App都基于有关规定采取了手机号码注册的方式,以满足账户注册、实名制规定、账户安全(动态密码、短信登录、密码找回等)等功能,可谓一举多得。因此,基于手机号码将不同行为信息相关联是可行性很高的一种措施。此外,手机号码有着独一无二的优势,利用手机号码可以直接联络到用户,向用户提供相关信息;在电信运营商的协助下,还可以利用信令核准使用手机号码人员所在精准位置。


2)基于设备识别码进行关联分析


对于未使用手机号码注册、登录的情形下App记录的各类个人信息,在App申请开启“电话/设备信息”权限和使用Cookie等情况下,可能收集了IMEI/IMSI/SN/MAC/IDFA等设备硬件设备码以及软件生成的识别码,这类信息也可以成为关联用户活动形成行踪轨迹的关联点。此外,借助设备识别码可以由国民级App(装机量上亿)的平台通过推送“通知”方式触达用户。


(二)基于行踪轨迹的二次关联分析和风险预测


由于病毒具备“人与人”传播的特性,且潜伏期可能长达14天,在这期间很难捕捉传播的路径,即使广泛散发通知,也不能保证人人看得到、人人有印象、人人愿反馈。因此,除了从已感染或疑似感染病毒的人群进行直接分析以外,借助大数据二次关联分析可以掌握与感染者/疑似感染者有过接触的人员动向。


比如,基于购物、用餐等相关的交易/支付信息,同一行程和同一住宿信息等,可以了解特定时间段内与已感染/疑似感染病毒人员有过接触的人员,然后再分析该人员其他行踪轨迹,从而形成完整的“二次/多次传播”态势信息。


在风险预测方面,可以通过分析“接触时间、时长”,如是否与已处在潜伏期人员进行接触、是否在传染源长时间逗留,也可以通过分析“接触空间”,如是否为密闭空间(如飞机、火车、汽车等),是否为人群密集场所(如商场、景区、游乐场等),并根据具体信息设定不同的风险级别,对高风险人群进行锁定和二次/多次追踪。并结合发病规律和人员流动规律,形成“预警”大数据,以协助疫情防控有关部门作好应对措施。


三、针对疫情防控应用场景的探讨



基于上述思路,对现有应用案例分析如下:


以武汉华南海鲜市场为例,作为最早被确认的“传染源”,应当准确掌握疫情发生前所有在市场出现人员的记录以及后续的行踪轨迹,其中支付/交易信息可以成为突破点。在扫码支付成为主流支付方式的今天,通过市场专用收款终端,以及固定摊主收款手机,可以明确找到最可能感染病毒时间段内所有进出市场购买农产品的人员信息,以支付信息为线索,找到关联的手机号或设备信息,可以结合行程、住宿、导航、收货等还原其行踪轨迹,如果其为重点关注对象,还可以进行二次关联分析,形成以武汉华南海鲜市场为对象的易感人员流动地图,且可以精确到可联系的具体人员。


以汉口火车站为例,作为出入武汉人员最主要的集散地,已经曝出有多辆列车上有确诊/疑似感染的人员,依赖火车站进出闸机以及实名制购票信息可以获知近距离可能感染人员信息。同时,还可以使用关联信息(如手机号)分析其出站后住宿、交易地点、收货地址等信息,形成以汉口火车站为对象的易感人员流动地图,且可以精确到可联系的具体人员。


以武汉出城自驾人员为例,通过时间区间和导航信息可以获知易感人群的行踪路线,同时,还可以通过ETC、沿途交易信息等进一步核对,包括在停留较长的停车带、加油站、服务区,可以进一步作二次关联分析,形成武汉出城自驾易感人员流动地图,且可以精确到可联系的具体人员。

 

以上只是基于已有数据假设的理论分析,实际的分析过程可操作性还需反复讨论和实践,比如数据源涉及多个行业领域、企业、机构等,如何获取?谁有权获取?谁来分析?如何保护?谁来使用?等等。


四、对保护个人隐私、科学安全使用大数据的建议



当前,全社会广泛采集各类人员信息,用于甄别与武汉相关人员的行踪,广泛采集的背后,势必有着一少部分的管理疏忽,使用不当等现象,甚至在人员信息泄漏或非法披露后,相关配合登记工作的人员反而“完全被暴露”在公众视线之下,承受了巨大的心理压力,甚至可能影响其人身安全。而且,对个人信息的保护不力将直接影响到后续信息采集过程中公众、机构对采集方的信任问题导致效率、精度等下降,让助力疫情防控的效果大大折扣。对保护个人隐私、科学安全使用大数据有以下建议:


第一,明确具有收集使用相关个人信息权力的指挥机构、执行机构,并明确相关工作的启动条件和流程规范,按需调取,责任到人。

第二,建立统一集中管理机制,运用去标识化、加密等措施对数据进行预处理,在数据关联分析过程中不指向个人身份,在锁定存在风险的对象后,再进一步进行身份重标识处理。

第三,大数据关联分析结果可主要用于监测疫情态势,涉及触达相关人员需审慎。

第四,采用严密的访问控制、审计、加密等安全措施,防止数据泄露、丢失、未授权的使用。

第五,做好疫情退散后数据处理的方案。

 

相信,有关部门已经全力以赴,科学运用数据助推打赢这场疫情“阻击战”。总而言之,利用大数据筛查、追踪传染源,为最需要的人提供最及时的医疗帮助,正是数字时代所赋予我们的“温度”和“力量”。


下一篇文章将关注域外在此方面的国外经验及提出的相应原则。




数据保护官(DPO)社群主要成员是个人信息保护和数据安全一线工作者。他们主要来自于国内头部的互联网公司、安全公司、律所、会计师事务所、高校、研究机构等。在从事本职工作的同时,DPO社群成员还放眼全球思考数据安全和隐私保护的最新动态、进展、趋势。2018年5月,DPO社群举行了第一次线下沙龙。沙龙每月一期,集中讨论不同的议题。目前DPO社群已近300人。关于DPO社群和沙龙更多的情况如下:


DPO社群成果

  1. 印度《2018个人数据保护法(草案)》全文翻译(中英对照版)(DPO沙龙出品)

  2. 巴西《通用数据保护法》全文中文翻译(DPO沙龙出品)

  3. 美国联邦隐私立法重要文件编译第一辑(DPO沙龙出品)

  4. 《非个人数据在欧盟境内自由流动框架条例》全文中文翻译(DPO沙龙出品)

  5. 第29条工作组《对第2016/679号条例(GDPR)下同意的解释指南》中文翻译(DPO沙龙出品)

  6. 第29条工作组“关于减轻对处理活动进行记录义务的立场文件”(DPO沙龙出品)

  7. 第29条工作组《第2/2017号关于工作中数据处理的意见》(DPO沙龙出品)

  8. “美国华盛顿哥伦比亚特区诉Facebook“起诉书全文翻译(DPO沙龙出品)

  9. 第29条工作组《关于自动化个人决策目的和识别分析目的准则》(DPO沙龙出品)

  10. 法国数据保护局发布针对与商业伙伴或数据代理共享数据的指南

  11. 第29条工作组《数据可携权指南》全文翻译(DPO沙龙出品)

  12. 德国联邦反垄断局对Facebook数据收集和融合行为提出严格限制(DPO沙龙出品)

  13. 德国联邦反垄断局审查Facebook数据收集融合行为的背景情况(DPO沙龙出品)

  14. EDPB“关于《临床试验条例》与GDPR间相互关系”意见的全文翻译(DPO沙龙出品)

  15. 第29条工作组关于GDPR《透明度准则的指引》全文翻译(DPO沙龙出品)

  16. “108号公约”全文翻译(DPO沙龙出品)

  17. 美国司法部“云法案”白皮书全文翻译(DPO社群出品)

  18. EDPB关于GDPR中合同必要性指引的中文翻译(DPO沙龙出品)

  19. 新加坡《防止网络虚假信息和网络操纵法案》中文翻译(DPO沙龙出品)

  20. 英国ICO《广告技术和实时竞价的更新报告》中译文(DPO社群出品)

  21. “FTC与Facebook达成和解令的新闻通告”全文翻译(DPO社群出品)

  22. CJEU认定网站和嵌入的第三方代码成为共同数据控制者(DPO沙龙出品)

  23. FTC与Facebook“2019和解令”全文翻译(DPO社群出品)

  24. 英国ICO《数据共享行为守则》中译文(DPO社群出品)

  25. “hiQ Labs诉LinkedIn案上诉判决”中译文(DPO社群出品)

  26. 法国数据保护监管机构(CNIL)有关cookies和其他追踪方式的指引(全文翻译)

  27. 美加州消费者隐私法案(CCPA) 修正案汇总中译文(DPO沙龙出品)

  28. FTC“首次针对追踪类App提起诉讼”的官方声明中文翻译(DPO社群出品)

  29. ICDPPC关于隐私和消费者保护、竞争维护交叉问题决议的中文翻译(DPO社群出品)

  30. 德国关于确定企业GDPR相关罚款数额官方指南的中文翻译(DPO社群出品)

  31. 亚洲十四个国家和地区数据跨境制度报告中译本(DPO社群出品)

  32. 印度《个人数据保护法》(2019年草案)全文翻译(DPO社群出品)

  33. 法国数据保护局(CNIL)关于人脸识别报告的中译文(DPO社群出品)

  34. AEPD和EDPS | “哈希函数简介——用于个人数据假名化技术”中译文(DPO社群出品)


线下沙龙实录见:

  1. 数据保护官(DPO)沙龙第一期纪实

  2. 第二期数据保护官沙龙纪实:个人信息安全影响评估指南 

  3. 第三期数据保护官沙龙纪实:数据出境安全评估

  4. 第四期数据保护官沙龙纪实:网络爬虫的法律规制

  5. 第四期数据保护官沙龙纪实之二:当爬虫遇上法律会有什么风险

  6. 第五期数据保护官沙龙纪实:美国联邦隐私立法重要文件讨论

  7. 数据保护官(DPO)沙龙走进燕园系列活动第一期

  8. 第六期数据保护官沙龙纪实:2018年隐私条款评审工作

  9. 第八期数据保护官沙龙纪实:重点行业数据、隐私及网络安全

  10. 第九期数据保护官沙龙纪实:《个人信息安全规范》修订研讨

  11. 第十期数据保护官沙龙纪实:数据融合可给企业赋能,但不能不问西东

  12. 第十一期数据保护官沙龙纪实:企业如何看住自家的数据资产?这里有份权威的安全指南

  13. 第十二期数据保护官纪实:金融数据保护,须平衡个人隐私与公共利益

  14. 第十三期DPO沙龙纪实:厘清《数据安全管理办法》中的重点条款

  15. 第十四期DPO沙龙纪实:梳理《个人信息出境安全评估办法(征求意见稿)》的评估流程

  16. 第十五期DPO沙龙纪实:SDK非洪水猛兽,但如果“作恶”乱收集信息,谁来管?

  17. 第十六期DPO沙龙纪实:查询App收集个人信息类型、禁止收集IMEI号是未来监管趋势

  18. 与欧美一流数据保护专家面对面(DPO沙龙特别活动)

  19. 第十七期DPO沙龙纪实:数据统一确权恐难实现 部门立法或是有效途径

  20. 第十八期DPO沙龙纪实:生物识别信息的安全保护


评估GDPR效果和影响:

  1. 评价GDPR一周年:一些正负面观点

  2. 评估GDPR效果和影响的参考资料(一):来自Capgemini的报告

  3. 评估GDPR效果和影响的参考资料(二):来自CIPL的报告

  4. 评估GDPR效果和影响的参考资料(三):来自IAPP的报告

  5. 评估GDPR效果和影响的参考资料(四):来自“黑客”的视角

  6. 评估GDPR效果和影响的参考资料(五):来自欧盟成员国的视角


线上沙龙见:

  1. DPO社群对数据堂事件的精彩点评

  2. DPO社群线上讨论第二期:“出售 & 提供” 个人信息之法律与实务对话

  3. 用户授权第三方获取自己在平台的数据,可以吗?不可以吗?(DPO沙龙线上讨论第三期)


DPO社群成员观点

  1. 个人信息委托处理是否需要个人授权?(DPO社群成员观点)

  2. 企业如何告知与保护用户的个人信息主体权利(DPO社群成员观点)

  3. GDPR“首张”执行通知盯上AlQ公司的前期后后(DPO社群成员观点)

  4. 隐私条款撰写调研报告(DPO社群成员观点)

  5. 我看到的数据安全(DPO社群成员观点)

  6. 数据爬取的法律风险综述(DPO社群成员观点)

  7. 银行业金融数据出境的监管框架与脉络(DPO社群成员观点)

  8. 解析公安机关《互联网个人信息安全保护指引(征求意见稿)》(DPO社群成员观点)

  9. 详解GDPR向Google亮剑缘由(DPO社群成员观点)

  10. 从生产安全体系视角看数据安全(DPO社群成员观点)

  11. 从Android Q看安卓系统的授权机制的三次重大演进(DPO社群成员观点)

  12. APP安全认证公告和实施规则解读:治理思路的创新与多样化(DPO社群成员观点)

  13. 从数据融合角度分析CNIL处罚谷歌案(DPO社群成员观点)

  14. 历史和国际比较视角DPO法律制度探源(DPO社群成员观点)

  15. 谷歌数据融合合规之路:从欧盟监管机构调查与处罚来看——上篇(DPO社群成员观点)

  16. 数据保护官岗位角色技术能力分析(DPO社群成员观点)

  17. 中国企业境外投资中儿童个人信息保护(DPO社群成员观点)

  18. 企业上市过程面临的数据合规问题和相关风险:境内篇(DPO社群成员观点)

  19. 企业上市过程面临的数据合规问题和相关风险:境外篇(DPO社群成员观点)

  20. 数据保护岗位需求与能力发展(DPO社群成员观点)

  21. DPO互助平台对企业数据治理实务的指导(DPO社群成员观点)

  22. 对网络安全负责人岗位的思考(DPO社群成员观点)

  23. 结合良好实践,细说APP自评估指南之一(DPO社群成员观点)

  24. 《个人信息安全规范》的效力与功能

  25. 结合良好实践,细说APP自评估指南之二(DPO社群成员观点)

  26. 《网络安全法》中数据出境安全评估真的那么“另类”吗

  27. 实施已满三月,区块链新规“回头看”(DPO社群成员观点)

  28. 从“布拉格提案”看美国政府的策略

  29. 《欧盟GDPR合规指引》前言:从一个损毁的雕像说起

  30. 对《网络安全审查办法(征求意见稿)》的几点观察

  31. 使命与界限:近期个人信息和数据安全新规的一些思考(DPO社群成员观点)

  32. 解析《个人信息出境安全评估办法(征求意见稿)》实体保护规则背后的主要思路

  33. “惟危惟微,允执厥中”:对《数据安全管理办法》中“定向推送”部分的思考

  34. 《儿童个人信息网络保护规定(征求意见稿)》评析:与美国COPPA对比的视角

  35. 网安法中的“范围”如何理解和落地:从头条案说起

  36. 《数据安全管理办法》的监管诉求及文本改进建议:DPO社群的现场讨论

  37. 数据安全的内部和外部视角初探

  38. 《个人信息出境安全评估办法》的流程改进建议:DPO社群的现场讨论

  39. GDPR与相关数据保护法律处罚案例调研(DPO社群成员观点)

  40. 个人信息侵权纠纷类型化试解(DPO社群成员观点)

  41. 英法两国对 AdTech和广告类SDK的监管案例分析

  42. 金控监管办法草案发布 有望扫清信息共享障碍(DPO社群成员观点)

  43. GDPR对用户画像的合规要求分析(DPO社群成员观点)

  44. IAPP新加坡会议上关于27701的Panel和PPT

  45. FTC vs Facebook:50亿美元和解令的来龙去脉(DPO社群成员观点)

  46. 人脸识别技术的法律规制研究初探(DPO社群成员观点)

  47. 澳《消费者数据权利法案》对数据共享与数据可携权的探索(DPO社群成员观点)

  48. FTC vs. YouTube:解读违规处理儿童个人信息之最大罚单(DPO社群成员观点)

  49. 个人数据在美欧外国投资审查中的角色初探(一)

  50. HiQ vs. LinkedIn案的启示与未决之题(DPO社群成员观点)

  51. 国家标准《个人信息安全规范(征求意见稿)》修订解读(DPO社群成员观点)

  52. 解析欧盟法院对与Cookies相关的告知和同意的最新判决(DPO社群成员观点)

  53. 推动域外应用商店下架“HKmap.live全港抗争即时地图”App的思路

  54. “客场作战”,法律先行:以“HKmap.live”为例

  55. 墨迹天气IPO被否 App治理工作组收集个人信息通报成依据之一

  56. 解读世界首例警方使用人脸识别技术合法性判决(DPO社群成员观点)

  57. 从墨迹IPO被否看拟境内上市企业的数据合规工作(DPO社群成员观点)

  58. 对美国外国投资审查新规的观察和评价(DPO社群成员观点)

  59. 《个人信息安全规范》在安标委重庆会议周上的汇报

  60. 人脸识别技术运用的六大场景及法律规制框架的适配(DPO社群成员观点)

  61. 他山之石:美国20年间33个儿童信息保护违法案例分析(DPO社群成员观点)

  62. 人脸识别技术的规制框架(PPT+讲稿)

  63. 全球视野中的金融数据安全

  64. 公司IPO/重组/投融资时,监管部门审查要点汇总及问题分析(DPO社群成员观点)

  65. 个人金融信息收集和共享的基本原理:基于中美欧规则的展开(文字稿+PPT)

  66. 透析印度《个人数据保护法2019年草案》

  67. 北京市关于自动驾驶车辆道路测试的立法综述及动态(DPO社群成员观点)

  68. 违反俄罗斯数据本地化的行政罚款新规(DPO社群成员观点)

  69. 零售门店使用人脸识别技术的主要法律问题(DPO社群成员观点)


    您可能也对以下帖子感兴趣

    文章有问题?点此查看未经处理的缓存