分布式存储有什么优势?为什么有些人仍使用传统存储?


布式存储简单的来说,就是将数据分散存储到多个存储服务器上,并将这些分散的存储资源构成一个虚拟的存储设备,实际上数据分散的存储在企业的各个角落。分布式存储系统具有的优势:

(1)高可靠,这个不管哪个存储系统,都是排在第一位的!既要满足存储读取不丢失发生错误,还要保证数据长期存储不丢失。在保证部分硬件损坏后依然可以保证数据安全。

(2)高可用,存储系统使用和维护方便、简易!后期的软件升级更新和现有的硬件设备升级更换,在不断电或者发生故障期间仍然可以使正常使用。

(3)高性能,存储系统软件的实现强劲性能。现在存储数据越来越多、越来越大!分布式存储可以在增加数据容量的同时实现高速存储设备再不断降低延迟增加吞吐。

(4)可扩展,分布式存储的优势就是“分布式”,所谓的“分布式”就是能够将多个物理节点整合在一起形成共享的存储池,节点可以线性扩充,这样可以源源不断的通过扩充节点提升性能和扩大容量,这是传统存储阵列无法做到的。

(5)低成本,首先需要在满足高可靠、高可用、高性能的前提条件下根据自身需求,做到更低的成本会从根本上提高产品的竞争力。

(6)好用,存储系统面临的用户多种多样,提供丰富的接口接入,以及后期工作人员维护方便。至于为什么现在还有人在用传统存储,是因为规模越大、存储数据量越大,分布式的优势越是明显!但是,目前大多数企业并非都有大数据的需求,因此,在小数据量下传统存储,拥有价格优势!同时完全能够满足客户需求!

分布式存储比如现在的超融合。传统存储架构通过服务器虚拟化方式然后通过FC交换机接存储。但是服务器端横向扩展越多,数据库越大,读取数据都得通过交换机到存储这条线,必然出现脖子响应。数据库IO越大,数据越慢。但是现在超融合也就是软件定义存储SDS,去掉传统存储,所有存储空间放服务器上,数据存储通过软件切片分散到多台机器上,避免了脖子照应,这样不仅速度起来了,而且还可执行数据副本,不担心数据丢失。分布式存储好处很多。另外,还有些应用跑在传统存储其实也并不是一无是处,而且本身数据量不是那么大,后期扩展也不是那么多。比如制造业上的系统MES,通常也就是传统的烟囱式架构。这样单一应用最多做个双机HA也就够了。或者那家IT建设连服务器虚拟化都没做,也就不指望他们会一步登到分布式存储了。今天看了最近那部啥宫廷剧里的一个台词,世界只有一种病,那就是穷病。很多人都希望拥抱新技术,但是苦于没预算没钱,哪门子搞嘛!

众所周知,随着云计算、大数据、5G、AI等技术的应用,数据不仅成为企业转型和数字化的核心资产,并呈现出新的特征。首先,海量、多元和非结构化成新数据时代常态。据IDC与浪潮联合发布的《年数据及存储发展研究报告》显示,年,全球存储新装机容量就已经从EB级达到ZB级,到年全球新创建的数据将达到175ZB。数据环境多样、复杂,数据从单一内部小数据形态向多元动态大数据发展,大量文本、图片、视频等非结构化数据被产生和存储。由此产生的海量新数据给存储系统带来压力,例如传统存储通过纵向拓展增加了容量,但性能增长存在天花板,无法解决海量增长的非结构数据存储管理问题。其次,数据的实时性需求变得更迫切。随着互联网、物联网以及人工智能等技术在各行业的不断渗透,企业对于数据实时性的需求日益增加。而金融的风险评估、交通的自动驾驶、运营商的智能网络等许多场景,都需要依赖快速实时的数据采集、存储和分析得以实现。最后,基础架构向云-边-端演进,重要的数据存储位置依然在核心。未来两年,全球将有超过70%的企业选择多云部署模式,而管理一直是云部署和云管理的重中之重。面对上述数据新特征,传统集中式存储较难适应需求,业内需要一种全新存储方式来应对上述数据新特征带来的挑战,而分布式存储可谓正当时。原因何在?与传统存储相比,分布式存储具有容量横向扩展、连接横向扩展以及性能线性提升等优势。例如在容量横向扩展方面,集群容量的扩展,通过增加存储节点实现,因为网络强大的扩展性,在理论上节点可以扩充到几千个,可以很好的满足海量存储容量需求。此外,分布式存储还具备成本低、易管理等特性。正是基于上述分布式存储的优势,根据Gartner的预测,与年40%的比例对照,到年将有超过80%的企业数据存放在分布式存储架构中,这无疑为存储厂商提供了新的赛道和市场机会。但目前大多数企业并非都有大数据的需求,因此,在小数据量下传统存储,拥有价格优势!同时完全能够满足客户需求!

传统存储架构通过服务器虚拟化方式然后通过FC交换机接存储。但是服务器端横向扩展越多,数据库越大,读取数据都得通过交换机到存储这条线,必然出现脖子响应。数据库IO越大,数据越慢。但是现在超融合也就是软件定义存储SDS,去掉传统存储,所有存储空间放服务器上,数据存储通过软件切片分散到多台机器上,避免了脖子照应,这样不仅速度起来了,而且还可执行数据副本,不担心数据丢失。分布式存储是一种数据存储技术,通过网络使用每台机器上的磁盘空间,并将这些分散的存储资源构成一个虚拟的存储设备,数据分散的存储在网络中的各个角落。所以,分布式存储技术并不是每台电脑都存放完整的数据,而是把数据切割后存放在不同的电脑里。就像存放100个鸡蛋,不是放在同一个篮子里,而是分开放在不同的地方,加起来的总和是100个。个人也可以使用。比如在办公室和家里用分布式存储搞个网盘,任意一边做了修改,另一边会自动同步。glusterfs和ceph这两种软件都有文件存储模式和副本功能。ceph如果只有两个节点时,其中任意一个不在线则整个集群用不了,而glusterfs则可以。而且glusterfs可以不分块,存储完整文件在节点上,就算主机坏了只要挂载硬盘就可以把文件拷回来

分布式存储特点是:高可用,任何一台服务器坏了不影响数据存取;数据更安全,任何一台服务器就算被火烧没了,数据也不会丢;可以cdn加速负载均衡,根据地域访问速度最快的存储节点;扩展能力强,可以在线扩容并自动负载均衡;并发访问能力强,单个节点并发访问数肯定无法与多节点相比。分布式存储一般分为:块存储,可以把它作为一个网络移动硬盘,对它分区、格式化。对象存储,通过api接口存入键、值对,有点类似数据库那样。文件存储,可以远程挂载分区,像操作本地文件系统一样访问文件。不光企业用到分布式存储,个人也可以使用。比如在办公室和家里用分布式存储搞个网盘,任意一边做了修改,另一边会自动同步。glusterfs和ceph这两种软件都有文件存储模式和副本功能。ceph如果只有两个节点时,其中任意一个不在线则整个集群用不了,而glusterfs则可以。而且glusterfs可以不分块,存储完整文件在节点上,就算主机坏了只要挂载硬盘就可以把文件拷回来