发布源:深圳维创信息技术发布时间:2020-11-11 浏览次数: 次
现如今随着GDPR、个人信息安全保护规范等一系列的实施,针对数据泄漏产生的负面影响越来越大,老板们为了能更好的保护公司数据,数据安全的岗位和产品开始火热了起来,那么数据安全有什么用?运营角度看数据安全从安全运营角度来看数据安全建设的必要性,在我们呆过企业中可能会存在这样的对话part1焦躁的安全工程师问到”你你你xxxxURL有个sql注入,赶紧看下,还有哪个应用使用这个库,表里都有哪些敏感字段,有多少受影响的数据量”。
业务通常会一脸天真的回复“这个表没什么敏感数据,不重要,我们现在就把漏洞修了,安全漏洞通告发给我就行了,别抄给我们领导”。
Part2焦躁的安全工程师收到来自暗网的监控告警,某某公司几亿订单数据泄漏,来自灵魂的拷问“是有内鬼吧,这是哪个库的数据,这么多敏感字段还是明文,之前某次应急好像在哪里见到过这种字段,难道上次的SQL注入拖出去这么多数据,md业务还坑我是测试数据”。
数据安全数据安全在数据生命周期内的六个阶段内凭借公司的基建完善程度,安全团队按自己团队的配置,有选择性的选取好下手的环节进行发力,以降低后续安全和业务相互沟通成本、普及数据安全重要性的成本。
如何解决笔者认为数据安全的基础的感知能力可以协同DB部门或者从业务侧首先开展,而作为数据安全工程师应该先考虑用何种方式可以达成你的第一个小目标-“具备基础数据在哪的感知能力”,笔者认为从DB部门切入可以更快的实现安全部门与db部门的协同工作闭环运营,主要因为db部有你需要的数据资源,安全部有数据分类分级使用上的需求分析能力,二者相结果,可以最短路径实现数据安全运营落地闭环;而先从业务线下手笔者认为成本会较大,因为企业内部业务部多则几千少则几百,对待安全的激情也是高低不均的,在前期开展数据安全所有的资源有限的情况下没必要将宝贵的安全工程师投入到业务线(试点除外),那无异议蚍蜉撼树,下场无非是安全同学被业务一顿怼”每天有这么多数据库、有什么变更都我要跟你说吗”,”你们安全部天天就知道让我们业务弄这个也弄弄那个也弄,我们自己业务还做不做了”。
更多的是场景更多的是场景问题,数据溯源,场景的数据溯源过程大致如下,数据样本收集、数据样本特征分析(定位泄漏时间、定位字段、定位数量)确认泄漏源、确认泄漏应用,我们需要从海量的数据中提取特征,比如本批次泄漏字段有哪些,该字段同时存在与哪些库表,隶属于哪几个应用。
依次定位调用时间、调用库表、调用应用。
围绕数据泄漏的不同场景,安全工程师会有意的向加工数据增加一些“染色数据”,增加“染色数据”的好处在于方便数据审计、方便数据溯源采集特征。
对二次存储分析使用的离线数据进行加密各种的数据脱敏(数据染色),二次使用的数据进行染色大致原则可以这样理解,将数据重新生成,但不影响原有业务开展数据统计分的析结果,例如业务提出的需求“我们需要最近24小时订单分析每个地区的下单情况”,安全工程师需要对此需求进行提炼,提炼后的业务真实想要的需求是“业务需要订单转化比率,关注的是总体的比例,是在统计一批数据的百分比,但不关注某一字段的准确性,”例如小明使用的是联通手机号185123123123,我们在保持联通的属性185不变后续几位可以转换为“0”即185123000、住所地址保留市区街道不变具体楼单号进行染色、一批数据的性别比例染色,保持原有的男女比例不变,这样这批数据在提供给业务侧进行统计分析的时候不会产生影响,同时可以保障用户数据的安全性。
这些都属于数据染色区别在于不同应用场景。
这块感兴趣的同学可以参考美团的数据差分隐私、数据染色的技术相关文章,都非常值得一读。
小结总之笔者在开展数据安全工作上踩过很多坑,总结总结,无非是受限于老三样,安全部规模,基建程度,老板关注度(是否出过事),比如在数据分散且没有统一的数据总线情况下最好不要异想天开的先去做什么权限管理,优先考虑那些能占用资源少且能闭环运营的工作,如做自动化分类分级打标打标、加解密等,不断迭代安全部对数据安全方面的能力,丰富企业常见的数据安全场景的解决方案能力,再去啃标识化染色权限管理未尝不是也是一种不错的选择。
Copyright © 2021 深圳市维创信息技术有限公司 版权所有