云存储是将数据存储在一大堆廉价的硬件上,将网络中大量各种不同类型的存储设备通过软件结合起来协同工作,对外提供统一的海量数据存储和数据访问服务。
我们的产品针对绝大多数数据密集型应用的特点从多个方面进行了优化,从而在一定规模下达到成本、可靠性和性能的最佳平衡,具有高性能、低成本、高可靠、低功耗、高密度、在线伸缩、易用、通用等鲜明特点。
高可靠---支持副本容错和超安存容错方式,任意损坏一个或多个节点,数据完整可靠,不会丢失。
可灵活设置数据块备份数目,自动备份,不须人工干预。
超安存是公司自有的一项专利技术,支持N+M冗余容错方式,它可以在有效提高数据可靠性的情况下,大大的减少冗余备份带来的容量损失
高性能---采用分布式的存储架构,随着存储节点的增加,I/O性能呈线性增长。
在线伸缩---能在不需要停止服务的情况下,很方便地动态增加或减少存储节点;
低功耗---采用超低功耗主板,主板功耗只有10W,为传统方式的二十分之一
超高集成度---由于采用超低功耗主板,成功解决了散热问题,42U单机柜容量能够达到1.125PB
易用性---云存储的感觉就好像是你的机器上多了一个超大容量的硬盘,操作简单,无须另外学习
低成本---云存储是可以构建在大量廉价的硬件之上的,总造价只有传统方式的五分之
一。
如果数据是动态的就会被迁移到靠上的存储层,最终保存在某种固态盘(SSD)中。自动分层系统有很多种,其中影响最小也是最安全的使用方式就是将其作为保存动态数据的缓存。特别是,这些系统将帮助云存储迈向主流。
缓存类型的自动分层系统将动态数据从传统机械存储中拷贝到基于高速内存的缓存(RAM或者闪存固态盘)中。在这种拷贝模式中,自动分层系统被用作一个大型的读取缓存,几乎不保留数据的唯一副本。即使当他们通过缓存入站写入的写入加速器,保留唯一数据副本也仅仅需要几分钟的时间。在这些模式下,这些系统可以帮助云存储技术为更主流的存储要求提供服务。
云存储系统也分为几种形式。比较常见的一种是作为NAS存储型的“价值层”,具有极高的成本效益和高度可扩展性。但是这种成本效益和可扩展性通常是以牺牲性能为代价的,使得基于云的存储系统无法被更多地用于主流的存储资源。很多用户和提供商希望能够更广泛地部署云存储,并利用自动分层系统来填补这个空白。
然而,当被用于更主流的用途时,云存储系统将带来一个挑战,那就是他们通常是软件解决方案,有时候采用了提供给用户的通用硬件和磁盘驱动器。这使得成本降低下来,因为数据集被分布到多个类型的存储应健中。现在主要的存储制造商都将精力放在了交付用于他们一级存储平台的自动分层系统上,在提升性能的同时控制住成本。然而一级存储并不常用于云存储部署中,而且主要的存储制造商也都坚持在他们的低端存储系统中提供自动分层系统技术,防止这些性能升级的系统影响到他们的一级存储市场。
自动分层系统解决方案部署就绪之后,所有网络传输都将通过这个系统。自动分层系统设备会对存储传输进行分析,然后根据它的访问特性,将动态数据块保存在高速存储层中——通常是RAM或者SSD,也可能是高速SAS。因为对这些数据的读取操作来自于高速存储区,因此可以快速地交付给用户或者应用。
在基于NAS的云存储中,有很多中应用实例是要求有更高的性能。首先是安装一个比传统NAS成本更低、可扩展性更高的NAS云存储系统;一个内部私有云存储系统。在这种应用实例中,不可避免地需要比云存储系统本身设计交付更高的性能。向云存储前端添加自动分层系统往往可以解决大多数性能问题。
第二个使用实例就是更经典的“云存储提供商”模式。如果一个提供商的某些用户拥有一些突然变得非常动态的数据,那么这些数据就可以被迁移到自动分层系统中。尽管这些数据的大多数请求可能是从一个速度较低的连接访问这些数据,但是1000个用户的访问合起来就可能导致存储方面的瓶颈。
大多数云存储系统是“松散集群的”,这意味着单个节点的性能会成为瓶颈,因为数据并没有像和紧密配对的集群一样被分布到节点中。结果是,如果一个文件被频繁访问,那么每次它只能从一个节点被读取。解决方法就是,将这个文件拷贝到集群中的多个节点,然后改变应用以了解还有谁需要这个文件。除此之外,如果对这个文件的访问频率降低下来,则需要找到这个文件的冗余副本并进行删除。在大多数情况下,最后一个步骤很少发生,这就导致大量的空间浪费。这样就要求存储管理员付出更多额外的管理时间。
另外一个更简便且更有效的解决方案就是添加自动分层系统。系统分层系统会将访问频繁的文件(或者文件片段) 迁移到RAM或者基于固态盘的缓存区中。然后,当文件被频繁访问的时候,系统就会从高速存储区提供这个文件。这种方法不需要对环境进行变动(或者变动有限),当文件被频繁访问的时候可以被识别出来并迁移到高速存储中。然后,随着访问频率降低,文件将被自动迁移到缓存中。因此,存储就变成可自主管理和自主调节的存储。
自动分层系统解决方案通常被用于加速高端NAS。这些系统已经拥有高速磁盘子系统和多个高速网络连接。高端NAS被用于交付机械驱动器所能提供的最佳性能。在更换整个存储阵列之前,自动分层系统往往被作为最后一种解决方法。
另一方面,NAS云存储系统并不一定具有和传统NAS相同的性能水平。正如前面所说,重点往往是成本削减和可扩展性,以牺牲性能为代价。随着云存储环境的扩展——或者随着云存储被更多地用于主流应用中,原始存储性能的欠缺迫使存储经理考虑选择更传统的解决方案。他们可以考虑的选择之一就是不限制存储的自动分层应用。这两种技术的结合将提供更高的性能,同时保持了成本和可扩展性方面的优势。