搜索
大数据中国 首页 行业资讯 业界动态 查看内容
大数据时代如何有效管理冷数据?
2019-10-14 19:50 | 查看: 3468| 评论: 0

大数据时代,人们的生活、工作都在数据化,时时刻刻都有新的数据产生,数据正在呈几何倍数爆炸式增长。如何存储、管理和使用这些数据,是现代企业面临的难题。

Forrester报告显示,组织中经常有多达73%的数据未使用,但很少有数据被丢弃。这些组织仍然保留旧的但很少或从未访问过的数据,原因主要是:

新的分析类型,比如长期趋势分析可能会使这些几乎被遗忘的数据变得必要。

诉讼的可能性,这可能要追溯到几年前的旧文档和电子邮件。

这些数据可以被称作“冷数据”,顾名思义,冷数据即是那些不经常访问、但又无法删除的信息,比如用户在社交媒体上存储的大量信息、企业备份数据、业务与操作日志数据、话单与统计数据等信息。

组织在这方面面临的挑战是,如何有效管理此类数据的存储,即使大部分时间组织看不到也用不到这些数据。

其中一个问题是,存储被IT界视为一种商品。存储很便宜,所以没有人会考虑在需要的时候订购更多的磁盘。

但是存储真的便宜吗?

带宽和基础架构成本不断增长,而这些成本通常需要支持更多存储(甚至便宜的存储)以及包含大数据的更大文件。更多的存储空间需要更多的资金用于处理、网络和人员等支持资源。与存储相关的成本会增加的另一个原因是,保留大型文件的多个版本时灾难恢复和备份过程变得复杂。

结果是,需要为很少使用或根本不使用的数据留出额外的存储空间,尤其是大数据的需要超出了存储空间的规模。这增加了总体IT支出。  

公司可以采取以下四个方法来有效地管理其冷存储数据。

1、使用便宜但可靠的冷存储

对于很少使用或存档的数据,慢速硬盘驱动器和磁带是最常用的存储介质。重要的是定期测试磁盘和磁带,以确保它们工作正常。另外,要避免将旧的驱动器和磁带降级为归档和数据备份功能——这些资源仍然有使用寿命,如果它们太旧,则更有可能出现故障。

2.考虑基于云的冷存储

如果您不想在现场或物理外部设施中存储大数据,则可以选择使用云。基于云的冷存储有很多选择,您可能会找到一种存储所有冷数据最合适的选择。

3.对冷数据进行年度评估

即使您已经有存储冷数据的方法,也并不意味着您应该存储所有数据。如果您还没有,您可以与管理层和法律部门商议确定应该保留哪些数据、丢弃哪些数据,每年评估一次即可。

4. 使用数据/存储自动化

大多数存储提供商提供分层的数据存储,这种存储是通过人工智能实现的。人工智能会采用您定义的存储数据的规则,并自动应用它们来确定数据的存储位置。

数据存储的主要层是内存存储或固态驱动器,您经常访问的数据存储就在其中。不常访问的数据可以存储在更便宜的硬盘存储的二级数据层上。

很少使用的数据或冷数据将被分配给速度较慢的磁盘驱动器或磁带,这些磁盘或磁带是您最便宜的存储介质。通过利用这种自动化,您可以确保经常以最低的成本存储冷数据的同时,始终可以将大量热数据提供给用户。

结束语

大多数大数据存储管理策略的重点是让用户随时可以实时获得数据,但这也增加了存储和处理的预算支出。公司可以通过管理很少使用的数据来帮助抵消这些较大的支出,这样就可以以最低的成本存储这些数据。对于这些数据,冷存储是一种安全、可靠、经济的解决方案。
免责声明: 除非特别声明,文章均为投稿或网络转载,仅代表作者观点,与大数据中国网无关。其原创性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。如果本文内容有侵犯你的权益,请发送信息至ab12-120@163.com,我们会及时删除

最新评论

关闭

站长推荐上一条 /1 下一条

 
 
大数据行业交流
大数据行业交流
大数据求职招聘
大数据求职招聘
站长电话:
15010106923
微信联系:
hb-0310
站长邮箱:
ab12-120@163.com
大数据中国微信

QQ   

版权所有: Discuz! © 2001-2013 大数据.

GMT+8, 2024-4-25 15:30 , Processed in 0.080160 second(s), 23 queries .

返回顶部