一、项目背景
2022年4月9日,《中共中央、国务院关于构建更加完善的要素市场化配置体制机制的意见》中数据作为一种新型生产要素首次正式出现在官方文件,并提出要加快培育数据要素市场,其中一大方面即为加强数据资源整合和安全保护。数据安全行业也在数据融合与隐私保护的双重驱动下迅速发展。
在数据融合方面,数据的核心价值在于共享和应用,多方数据的融合应用具有巨大意义。随着信息经济发展,数据已和其他要素一起融入经济价值创造过程,对生产力发展有广泛影响。而单一数据源的价值有限,多维数据、海量数据的联合应用的价值更高,通过打破现实世界中数据高度分散状况以适当方式集成多方数据资源,能够可观的协同效应。
在隐私保护方面,数据应用者迫切找到可靠的方法,合法合规地实现数据的共享流通。由于数据能够以极低的成本复制和无限使用并含有巨大价值,各种各样数据泄露、盗用、滥用等问题案件层出不穷,也为大数据应用蒙上了一层阴霾。为此,近三年来,欧盟GDPR、美国加利福尼亚州CCPA和我国的《数据安全法》(草案)、《个人信息保护法》(草案)等代表性法律法规出台,严格要求在数据使用过程中做好隐私保护。
近年来,伴随我国医疗健康产业迅速发展,医疗健康大数据成为新的热点。大数据的应用通过医疗机构、高校和政府等联合开展产学研合作,实现对健康医疗大数据价值的深度挖掘,开展重大专科疾病课题的研究、推动基层诊疗、智慧养老等,将成为造福民生、改善人民生活的重要部分。而由于医疗数据具有的特殊性、敏感性、变现价值极高,其早已成为隐私泄露的重灾区,并且在医学研究中数据处理的重要前提条件是数据提供者知情同意,这也在很大程度上影响了医疗机构共享数据。而我们的方案旨在通过匿名化算法,让个人被重新识别的风险降低到以至于数据可以被视为非个人所有,取得隐私泄露风险与数据效用间的平衡,满足法律意义上“匿名化”要求,实现对医疗数据合法的分析使用。
二、应用场景
1、分析挖掘场景
- 目标:医疗机构向第三方提供基础数据进行大数据分析应用
- 应用:通过安全医疗数据发布平台,保证数据安全及合规,保有数据的可用性及可挖掘分析的价值
- 效果:让医疗机构能够拥有数据主动权,消除数据安全及隐私保护顾虑
2、数据公开场景
- 目标:公开发布能够有效促进医疗大数据的使用
- 应用:安全医疗数据发布平台进行处理确保公开数据库中任意一条记录的隐私属性不能对应到具体个人
- 效果:攻击者无法通过破解某一条具体医疗数据
3、共享交换场景
- 目标:医疗机构之间病例数据互联互通、为学术研究机构提供数据等对外合作
- 应用:通过安全医疗数据发布平台可以便捷选择对何种类型数据进行匿名化处理
- 效果:满足不同情形下的数据共享交换需求
三、市场分析
1、供应端
随着《国务院办公厅关于促进和规范健康医疗大数据应用发展的指导意见》、《“十三五”全国人口健康信息化发展规划》等相关政策文件的出台,医疗改革的推进,众多医疗机构通过信息化升级和“互联网+医疗健康”的应用,完成如以HIS系统为核心的医疗管理系统、以EMR等为核心的电子病历系统等信息化系统的建设,同时便携化、智能化设备的发展,带来医疗数据的快速增长。
2、需求端
医疗大数据可应用于临床及临床研究、公共卫生、科研推进、医疗机构运营管理、医疗保险等多种场景,但同时其敏感性也带来了数据使用的合规要求:《网络安全法》早已生效,《民法典》在现行法律规定的基础上,对于隐私权和个人信息保护作出了专门规定,《数据安全法》于2021年9月1日正式生效,《个人信息保护法》于2021年11月1日正式实施,也正式将医疗健康数据列为敏感个人信息的重要部分,医疗大数据具有极高应用价值,同时也面临着严格的合规要求。
3、市场规模
- 据IBM Security发布的报告,自2021年3月至2022年3月期间全球 550家企业出现的数据泄露事件中医疗行业的损失最为严重。这项成本还在快速增长中。这对隐私保护技术提出了更高要求。
- 据Gartner于2018、2019年分别发布的《数据脱敏市场指南》,企业对于数据脱敏或其他类似去识别技术的使用从2017年的15%增加到了2018年的20%,预计在2022年将达到50%。IDC咨询指出中国数据泄露防护市场在2021年实现了39.2%的同比增长,规模达到1.25亿美元。
- 根据数说安全统计,医疗卫生行业2021年数据安全采购项目数量3700个,同比增长28.5%,其中专项项目数量469个,同比增长29%。