360大数据中心总监:如何制定可奏效的数据安全体系

Wesley13
• 阅读 529

在万物互联的大数据时代,数据安全是个不容忽视的大问题。但企业往往缺乏未雨绸缪的意识,直到数据泄露等事件发生时才亡羊补牢,因此造成不可逆的损失和影响。此类事件在近年来频繁发生,而围观的我们是否应该反省自身,及时作出防御措施?

360大数据中心技术总监徐皓接受dbaplus社群的专访,围绕**「大数据平台安全设计和实践」**这一话题展开了深度探讨。

本文首发于 DBAplus社群。

嘉宾介绍

徐  皓

现任奇虎360大数据中心技术总监,数据中心技术团队负责人,负责数据中心平台的规划和建设工作,主导并参与了数据中心全新一代平台的研发。曾就职于华为技术有限公司,从事平台相关研发工作,涉及大数据、中间件、云等相关领域。

360大数据中心总监:如何制定可奏效的数据安全体系

管理者的认知决定企业数据安全建设能否真正发挥价值

**Q1:**近年来发生的数据安全事件可以说到了屡见不鲜的程度,在您看来目前乃至今后较长一段时间,企业面临着哪些关键的数据安全隐患和挑战?

**A1:**首先我认为对企业而言「数据安全」其实并不是一个全新的话题。

为什么这么说呢?企业存在于社会之中,从诞生之日起,为了保证自身的持续正常运转,对内会有一系列的人员合作,对外会和其他的企业以及个人发生事务往来。那么在这个过程中不可避免的会有信息交换,有信息交换自然就会有数据安全风险。

那为什么我们还要提及这个话题呢?因为信息交换的动作对企业而言持续存在。

随着现代社会科学技术的不断演进,信息技术的快速发展和应用,使得全行业信息化的程度全面提升,整个社会的数据正在以前所未有的速度快速增长,呈现出数量大、来源广、种类多的特点,这些数据渗透到了各行各业,并逐渐成为企业的重要生产要素之一。

360大数据中心总监:如何制定可奏效的数据安全体系

这个时代数据已经无处不在、如影随形,我们今天讨论的议题也是以大数据为背景展开,来探讨数据安全相关的问题,并不是传统的数据安全。从这个角度来说这也算是一个新的话题。

数据安全这个话题虽然在概念上看比较的单一,但实际上覆盖面广、内容全,同时还涉及到很多重要的因素。

那么对企业而言,会面临哪些安全隐患和挑战其实是一个比较大的话题,从我自身的角度来看,可以分为三个方面:

  • **首先是法规流程方面。**随着云计算、大数据技术的逐步应用,数据自身的形态、数据使用的方式都在不断增加和变化,且这种发展趋势会变得越来越快。那么企业在这种大趋势下如何保证在法规流程上的系统性、时代感是需要优先考虑的要素。

  • **其次在系统建设方面。**数据安全本身不会产生价值,所以很多时候在系统建设初期为了快速构建,往往把安全相关的能力优先级放低,甚至在很长一段时间缺失。数据在系统中裸奔,一旦出现数据泄漏将会引起不可预知的损失。

    另一方面由于在系统建设初期对安全能力的忽视,导致后期增加安全能力会变得更加困难,甚至需要调整系统架构,无形之中增加了企业的投入成本。

  • **最后是管理者认知方面。**随着今年来大大小小的数据安全事件频繁发生,给企业和个人带来了严重后果,企业管理层在对保障数据安全上基本高度一致。

    但只做到意识形态上的认知是不够的,甚至对企业的安全建设起到反作用。管理者如果只关注数据本身的安全,就会导致安全体系的建设片面,最终无法达到对数据进行安全管控的效果。殊不知要保障数据安全不只是在数据层面。

    相反如果管理者对数据安全的建设走大而全的路线,可能这个目标永远都是水中月、镜中花,看似美好却无法达成。我认为最后一点也是最重要的一点,它决定了企业能否真正将数据安全的建设落到实处并发挥其价值。

如何制定真正可奏效的数据安全治理方案

**Q2:**面对这些数据安全风险,您在制定及落实真正得以奏效的安全治理方案上有什么建议?

**A2:**正如我之前所说,企业的数据安全体系建设是一个非常大的话题,我还是结合我所从事的工作,谈谈在大数据中心建设过程中所面临的一些具体的问题和挑战以及解决思路和方案。

随着公司的发展、产品形态上的调整,产品覆盖面越来越广,在数据层面呈现出数据海量、存储分散、用途多样的特点。

360大数据中心总监:如何制定可奏效的数据安全体系

大数据中心作为公司数据中场部门,除了自身数据平台和服务能力的建设,还要面对来自各个业务部门的数据分析需求,在处理这些需求的过程中遇到了各种数据安全相关的问题。

数据集中存放,如何做到数据平台管理和数据访问的权限分离?每个业务部门有多个角色,每个角色对应的数据权限都可能不一样,如何有效控制?数据一旦发生泄漏风险,如果做到溯源?跨产品的数据如何安全的共享?

360大数据中心总监:如何制定可奏效的数据安全体系

类似这样的问题还有很多,这些问题对大数据中心的发展提出了一系列的挑战,可以归纳为四个方面:

  • 平台层面的保障:传统的权限控制通常是以系统功能为中心来进行设计,通过控制用户对功能的访问来达到权限控制的目的。这种控制方式在大数据中心已经捉襟见肘,比如对于同一个数据分析功能,不同产品的分析人员只能操作本产品的数据;

  • 数据层面的保障:大数据中心面向公司所有的产品负责提供数据处理的能力,那么业务数据每天都在平台上流转,如何合理控制数据平台工程师对业务数据的访问;

  • 风险预防和审计:产品的业务形态决定了其系统设计,在其不断演进过程中,数据模型也在不断演进,必然会持续产生一些脏数据,要保证数据的质量,在数据治理环节会加入更多的人工参与,也增加数据泄漏的风险;

  • 流程和制度:哪些数据可以公开、公开的范围是多广?数据可以给哪些人使用?某个业务部门想使用另外一个业务部门的数据,应该走什么样的流程?处理这些事情在很长一段时间都是见招拆招,看起来很灵活其实毫无规则可言。

随着大数据中心业务的不断发展,这些问题带来的影响已经愈发明显,那么该如何有效解决,让大数据中心摆脱困扰,更加高效的去支撑整个公司的产品呢?

其实问题“千千万”,都是数据“惹得祸”。我们要使用数据、分析数据,发挥数据的价值,所以不可避免的要接触数据,数据安全问题也因此产生了。

360大数据中心总监:如何制定可奏效的数据安全体系

以终为始,我们在构建数据安全体系的指导原则就是,明确“让数据更加安全的被使用”的目标,打造以“数据”为中心,结合“平台能力”、“隐私管理”、“法规流程”三个要素,构建具有公司特色的数据安全体系,系统化解决数据安全问题,发挥数据的更大价值。

这里需要说明的是数据安全风险会一直存在,安全体系建设是尽可能地降低发生风险的几率,让数据分析人员能使用更多的数据、让数据开发人员尽可能聚焦在数据应用本身。

360大数据平台安全能力建设

**Q3:**能否以360自身经验为例,具体剖析其大数据平台在安全能力方面的设计思路、架构搭建,以及应用实践?

**A3:**变动就一定会带来阵痛,在进行大数据平台安全能力建设之初,我们也遇到了不少困难。

**首先,在规范治理方面。**数据安全能力建设包含了安全规范的治理,这种规范的治理势必会固化数据安全相关流程。

流程上的变动对产品部门会有感知,而安全能力建设的价值又很难呈现给产品,如何平衡这中间的矛盾?

既然大数据中心是整个公司中场部门,负责支撑全公司的数据业务,安全规范的治理采取了自上而下的策略,联合公司法务和隐私相关部门共同制定,最终完成360集团数据安全管理规范,让数据的使用合理、合规、合法,这也让我们的治理工作多了一份理解、少了一些阻力。

360大数据中心总监:如何制定可奏效的数据安全体系

**其次,在系统治理方面。**大数据中心的系统建设已经到了一定阶段,按照全新的系统去设计显然不适合,数据安全能力如何和当前系统平滑融合对我们也是一个考验。

这里要说明下很多公司在开发系统之初,往往会优先开发系统中的业务功能,把安全能力的优先级降低或者是做一些简单的安全加固能力,等到想系统化建设安全能力的时候发现已经没有那么简单,系统留出的可改造空间非常受限。

回顾系统治理的过程,我们主要做了两个维度的重构:

  • 一是以数据资产为中心对系统进行了服务化改造;

  • 二是围绕数据的全生命周期建设数据系统安全。

服务化能力让系统高内聚、低耦合,系统功能易于扩展,在增加安全能力的同时也减少了对原有系统的侵入;数据应用的全生命周期让安全治理有一个明确的范围标准,这在最大程度保证了安全能力的全覆盖。

基于这样的设计思想,整个大数据平台的安全能力在原有架构上进行了从“点”到“面”的一个改造。

360大数据中心总监:如何制定可奏效的数据安全体系

在数据共享方面,我们知道通常系统允许用户以文件或者图片的形式保存数据,并在保存文件中添加水印信息,用于在信息被非法传播之后的溯源,如果用户对单条数据进行复制传播的话,系统往往不能有效进行控制,

比如在数据查询结果页中通过复制粘贴将信息转发。类似场景还有很多,针对这些数据共享场景,我们引入了纯文本数字水印技术,保证在最小粒度层面的数据溯源能力。

360大数据中心总监:如何制定可奏效的数据安全体系

**最后以权限系统为例谈谈单系统的治理。**如上所说,老的权限系统主要是完成系统鉴权和功能控制,无法支撑大数据中心现有的业务场景,比如对数据层面进行不同维度的访问控制。

那么如何在现有权限模型的基础上进行扩展,以适配当前的业务场景呢?我们对权限做了扩展,将其定义为“资源+操作”一种组合,对于菜单、页面、按钮、表、字段、任务、拓扑等进行了泛化,统一定义为资源,既保证了数据鉴权流程的稳定,又灵活应对了由于数据类型繁多带来的不确定性。

360大数据中心总监:如何制定可奏效的数据安全体系

结合数据中心的职能定位和业务场景,将应用、菜单、服务、数据四个维度纳入权限系统管理,给权限系统赋予了新的定位-一站式权限管控中心。

360大数据中心总监:如何制定可奏效的数据安全体系

上云一时爽,冲动上云一身霜

**Q4:**除了企业内部的大数据平台建设以外,在数据上云的大势所趋之下,如何确保云上的数据安全?

**A4:**十多年前,亚马逊推出云计算服务的时候,云服务还鲜有人问津。十年之后的现在,随着云计算的高速发展,越来越多的企业开始了云化转型。

即使这样,我觉得企业在决定是否云化之前先要回答几个问题:为什么要上云?通过上云要取得的短期目标是什么?中长期目标又是什么?

通过回答这些问题来思考云化对自身来说是否真的需要。实际应用中,云化对一些企业所带来的价值远小于其投入,甚至都无法持续支撑后期的运维,那么这个时候可能就需要规划另外的资源优化模式。

对于已经准备上云的企业来说,首先要确定采用什么样的云化方案。是选择公有云、私有云还是混合云,不同的方案其数据安全策略也是不一样的。

其次不要单纯依赖云服务商提供的数据管理能力。云平台有助于实现数据的集中管理,提升企业的数据共享能力,同时也增加数据泄漏和丢失的风险。数据一定要有备份方案将安全隐患降到最低,比如多云或者异地存储等。

最后要建立全面完善的云服务协议。上云只是企业云化的开始,未来企业系统将会持续运行在云上,在这个过程中云平台自身难免不会不出现问题。如何保证云平台的服务响应速度和解决问题的效率,这不单单依靠云服务商本身的服务标准,而是需要企业结合自身的要求和云服务商共同完成服务协议的制定,让企业尤其是中小企业在产生问题之后可以有更多的话语权,将企业的损失尽可能降到最低。

(转载请务必保留文末二维码,谢谢~)

360大数据中心总监:如何制定可奏效的数据安全体系

关于360技术

360技术是360技术团队打造的技术分享公众号,每天推送技术干货内容

更多技术信息欢迎关注“360技术”微信公众号

点赞
收藏
评论区
推荐文章
blmius blmius
3年前
MySQL:[Err] 1292 - Incorrect datetime value: ‘0000-00-00 00:00:00‘ for column ‘CREATE_TIME‘ at row 1
文章目录问题用navicat导入数据时,报错:原因这是因为当前的MySQL不支持datetime为0的情况。解决修改sql\mode:sql\mode:SQLMode定义了MySQL应支持的SQL语法、数据校验等,这样可以更容易地在不同的环境中使用MySQL。全局s
皕杰报表之UUID
​在我们用皕杰报表工具设计填报报表时,如何在新增行里自动增加id呢?能新增整数排序id吗?目前可以在新增行里自动增加id,但只能用uuid函数增加UUID编码,不能新增整数排序id。uuid函数说明:获取一个UUID,可以在填报表中用来创建数据ID语法:uuid()或uuid(sep)参数说明:sep布尔值,生成的uuid中是否包含分隔符'',缺省为
待兔 待兔
4个月前
手写Java HashMap源码
HashMap的使用教程HashMap的使用教程HashMap的使用教程HashMap的使用教程HashMap的使用教程22
Jacquelyn38 Jacquelyn38
3年前
2020年前端实用代码段,为你的工作保驾护航
有空的时候,自己总结了几个代码段,在开发中也经常使用,谢谢。1、使用解构获取json数据let jsonData  id: 1,status: "OK",data: 'a', 'b';let  id, status, data: number   jsonData;console.log(id, status, number )
Wesley13 Wesley13
3年前
mysql设置时区
mysql设置时区mysql\_query("SETtime\_zone'8:00'")ordie('时区设置失败,请联系管理员!');中国在东8区所以加8方法二:selectcount(user\_id)asdevice,CONVERT\_TZ(FROM\_UNIXTIME(reg\_time),'08:00','0
Wesley13 Wesley13
3年前
00:Java简单了解
浅谈Java之概述Java是SUN(StanfordUniversityNetwork),斯坦福大学网络公司)1995年推出的一门高级编程语言。Java是一种面向Internet的编程语言。随着Java技术在web方面的不断成熟,已经成为Web应用程序的首选开发语言。Java是简单易学,完全面向对象,安全可靠,与平台无关的编程语言。
Stella981 Stella981
3年前
Django中Admin中的一些参数配置
设置在列表中显示的字段,id为django模型默认的主键list_display('id','name','sex','profession','email','qq','phone','status','create_time')设置在列表可编辑字段list_editable
Wesley13 Wesley13
3年前
MySQL部分从库上面因为大量的临时表tmp_table造成慢查询
背景描述Time:20190124T00:08:14.70572408:00User@Host:@Id:Schema:sentrymetaLast_errno:0Killed:0Query_time:0.315758Lock_
为什么mysql不推荐使用雪花ID作为主键
作者:毛辰飞背景在mysql中设计表的时候,mysql官方推荐不要使用uuid或者不连续不重复的雪花id(long形且唯一),而是推荐连续自增的主键id,官方的推荐是auto_increment,那么为什么不建议采用uuid,使用uuid究
Python进阶者 Python进阶者
10个月前
Excel中这日期老是出来00:00:00,怎么用Pandas把这个去除
大家好,我是皮皮。一、前言前几天在Python白银交流群【上海新年人】问了一个Pandas数据筛选的问题。问题如下:这日期老是出来00:00:00,怎么把这个去除。二、实现过程后来【论草莓如何成为冻干莓】给了一个思路和代码如下:pd.toexcel之前把这