本文主要分三个部分:
本文以大数据发展面临的安全挑战开篇。
一、大数据发现面临的安全挑战
(1)传统安全保护手段失效:大数据应用使用开放的分布式计算和存储框架来提供海量数据分布式存储和计算服务。新技术、新架构、新型攻击手段带来新的挑战,使得传统的安全保护手段暴露出严重的不足。
(2)大数据平台安全机制缺陷:Hadoop生态架构在设计初期对用户身份鉴别、访问控制、密钥管理、安全审计等方面考虑较少,并且大数据应用中多采用第三方开源组件,对这些组件缺乏严格的测试管理和安全认证。
(3)数据应用访问控制难度大:有在大厂工作经验的人都知道,数据应用有报表类、运营类、取数类等等,各类数据应用通常要为不同身份和目的的用户提供服务,在身份鉴别、访问控制、审计溯源上都带来了巨大的挑战。
(4)数据量大、潜在价值高,极易成为攻击目标:大数据平台处理环节多,需要针对数据采集、传输、存储、处理、交换和销毁等生命周期各阶段进行安全防护,在不同阶段采取适合的安全技术保护机制。
(5)数据滥用或伪脱敏风险增长:随着数据挖掘、机器学习、人工智能等学科领域技术研究的深入,数据滥用情况加剧。并且很多公开说明脱敏或者匿名处理的数据,有可能分析出对应的真实明细信息。
(6)数据所有者权限问题突显:数据共享和流通是大数据发展的关键,但是在很多大数据应用场景中,存在数据所有权不清晰的情况,例如:数据挖掘分析人员会对原始数据进行处理,分析出新的数据,这些数据的所有权到底属于原始数据所有方还是数据挖掘方,这个问题还很多场景下还没有定论。
(7)大数据安全法规标准不完善:不论是在公司内部还是国家范围内,大数据应用的使用促进了经济的发展,数据价值的最大化。然而要推进大数据健康发展,要加强政策、监管、法律的统筹协调,加快法律法规建设。
二、大厂大数据安全实践
看到上述如此多的挑战。大家是不是对大厂的大数据安全实践充满了好奇,废话不多说,下面直插主题:
2.1阿里云大数据安全管控体系架构
核心安全措施:
2.2蚂蚁金服大数据安全防护体系
核心安全措施:
2.3中国移动大数据安全保障体系
核心安全措施:
2.4IBM Security Guardium 数据安全保护体系
核心安全措施:
对来自各种应用和用户的hadoop和nosql的数据访问进行全面实时监控。在应用或用户违反安全策略时进行实时预警并在SIEM仪表盘中显示警告信息。
2.5Microsoft大数据安全框架
核心安全措施:
1)网络安全:企业管理员可在虚拟网络 (VNET) 中创建群集,并使用网络安全组 (NSG) 限制对虚拟网络的访问。只有入站 NSG 规则中允许的 IP 地址才能与 HDInsight 群集通信。
2)身份认证:提供基于 Active Directory 的身份验证、多用户支持和基于角色的访问控制。
3)授权:管理员可以配置基于角色的访问控制 (RBAC) 来确保ApacheHive、HBase和 Kafka的安全性,只需使用 Apache Ranger 中的这些插件即可。可以通过配置 RBAC 策略将权限与组织中的角色相关联。
4)审核:管理员可以查看和报告对 HDInsight 群集资源与数据的所有访问,跟踪对资源的未经授权或非故意的访问。管理员还可以查看和报告对在 Apache Ranger 支持的终结点中创建的访问控制策略进行的所有更改。
5)加密:应对数据加密。
三、结束语:
综上所述,结合笔者自己的实践,大数据平台安全建设应根据平台规模、大数据安全建设人员投入数量、历史案件比例等因素做调整,最合适的是才是最好的。
上述仅代表个人当前意见,如有异议可以多沟通多交流。
大数据技术的战略意义不在于掌握庞大的数据信息,而在于对这些含有意义的数据进行专业化处理。换而言之,如果把大数据比作一种产业,那么这种产业实现盈利的关键,在于提高对数据的“加工能力”,通过“加工”实现数据的“增值”。
上一篇:人工智能AI战“疫”
下一篇:大数据如何确保风控和利益
¥280.00
¥680.00
¥699.00