
课程咨询: 400-996-5531 / 投诉建议: 400-111-8989
认真做教育 专心促就业
随着互联网的不断发展,大数据技术的应用在各个领域都有不同的表现形式,今天我们一起来看看,大数据存储安全需要关注的那些问题。
大数据平台处理数据的方式不同于传统的信息系统。传统数据的生成、存储、计算和传输对应于明确定义的实体(被认为是分段的),这些实体可以用拓扑的方式清楚地表示。这种分段处理信息的方法在边界保护方面相对有效。
然而,在大数据平台上,采用了新的处理模式和数据处理方法(MapReduce、column storage等)。存储平台也是一个计算平台,采用分布式存储、分布式数据库、NewSQL、NoSQL、分布式并行计算、流式处理等技术,一个平台可以同时使用多种数据处理模式来完成多个业务流程,导致边界模糊,而传统的安全防护方法很难奏效。
(1) 大数据平台的分布式计算涉及多台计算机和多个通信链路。一旦出现多个故障点,就很容易导致分布式系统出现问题。此外,分布式计算涉及许多组织,相对容易受到安全攻击和未经授权的访问保护。
(2) 分布式存储由于数据在各个数据节点被分块存储,传统的安全保护在分布式存储中难以实现。
① 数据安全区域划分无效;
② 细粒度的访问存储访问控制不完善,NoSQL作为服务器软件没有足够的安全内置访问控制措施,使得客户端应用需要内置安全措施,从而产生授权过程认证和输入验证等安全问题;
③ 分布式节点间的传输网络易受攻击、劫持和破坏,使得存储数据的完整性和机密性难以保证;
④ 数据的分布式存储增加了每个存储节点的暴露风险。在一个开放的网络社会中,攻击者更容易找到入侵点,他们可以以相对较低的成本获得“滚雪球”的好处。攻击中,窃取的数据量和损失都非常巨大;
⑤ 传统的数据存储加密技术,很难满足高速、大容量数据加密在性能效率方面的要求。摘要大数据分布式存储面临的主要安全挑战归结为两个方面:数据丢失风险和数据泄漏风险。
(3) 大数据平台访问控制的安全风险主要体现在:访问控制的多样性和大数据应用中用户的多样性、业务场景的多样性带来的精细化要求超过了平台自身的访问控制安全级别和策略控制无法满足权限的动态要求。传统的角色访问控制无法有效地匹配角色、活动和权限。因此,大数据架构下的访问控制机制也需要对这些新问题进行分析和探索。
(4) [成都大数据工程师培训]针对大数据的新安全攻击的代表是高级持久攻击(APT)。由于APT的延迟和低频活动,其持久性成为一个不确定的实时过程,并且产生的异常行为不易被捕获。传统的基于内置攻击事件数据库的实时匹配检测技术对APT攻击检测效果不佳。大数据应用程序为入侵者提供了实现可持续数据分析的良好隐藏环境。一旦攻击成功,窃取的信息量甚至不可估量。
(5) 基础设施安全的核心是数据中心设备的安全,包括传统的安全风险和独特的安全风险。传统的安全防范措施,如网络防御、NoneDoS攻击、存储加密、容灾备份、服务器安全强化、防病毒、访问控制、自然环境安全等;独特的安全风险主要来自大数据服务所依赖的云计算技术所带来的风险,包括虚拟软件安全、虚拟服务器安全、容器安全、云服务带来的业务风险等。
(6) 服务接口安全。由于大数据平台支持的业务应用种类繁多,外界提供的服务接口差异很大,给攻击者带来了通过服务接口攻击大数据平台的机会。因此,如何保证不同服务接口的安全性是另一个大数据平台。巨大的挑战。
(7) 数据挖掘分析是安全的。大数据应用的核心是数据挖掘,从数据中挖掘出的高价值信息被企业所利用,这是大数据价值的体现。然而,数据挖掘技术的使用在为企业创造价值的同时,也容易出现隐私泄露。如何防止数据滥用和数据挖掘造成的数据泄露和隐私泄露,是大数据安全面临的重大挑战。