什么是Web 2.0存储

2008-07-22 16:43:51.0     推荐:0    收藏:0    评论:0     来源:赛迪网


去年,Web 2.0已经在存储行业内成为一个热门词汇,许多大公司和初创公司都保证开发快速增长、合作型环境下的存储系统。但是在我们看到这些存储系统的将来样子之前,我们先看看这些系统适合哪些类型的数据。

因为没有更好的术语,我们就叫它Web 2.0数据。这种数据在本质和用途上都不同于传统的、基于事务的数据。它经常以大型文件的形式出现,一般是一个用户所创建的,而且这种数据可能在一定地理距离上共享。大部分的Web 2.0数据就如同它的名字所指的那样:图片、视频、以及电子邮件归档,但是这种类型的数据也开始包括来自监视摄像机镜头、地理空间挖掘数据、基因序列以及金融分析情境的信息。

基于文件的Web 2.0数据和公司的事务型数据一样重要,而且也要求类似的可用性水平、安全和保护。如同传统的公司数据一样,Web 2.0数据在不断膨胀——有过之而无不及。

它是Web 2.0数据吗?

大型文件

非事务型

经常是单个用户所创建

可能在一定地理距离上共享

加速的容量增长率

例子:电子邮件、图片、基因组、归档…..

不太适合于基于块的公司SAN(存储局域网)

为了应对Web 2.0数据的增长,企业们纷纷采用一种由Google(纳斯达克代码:GOOG)和Yahoo(纳斯达克代码:YHOO)这样的Web先驱所开发的存储技术。这种存储方式借用了高性能网格计算技术,使用大型的机架式的计算机和存储节点集群,而这些计算机或存储节点是由比较廉价的行业标准式的服务器和驱动器所组成。数据被分布和复制在不同的节点上,而且经常是地理上分开的。存储组件是CAS(内容寻址存储)或NAS(网络附加存储),使用SATA(串行ATA)或SAS(串行连接SCSI)驱动.

为了更低的成本,更少的电能消耗及冷却成本,节点被优化成只带有那些为应用程序所需求的功能。集群节点比刀片更便宜,更密集,而且没有冗余的电能供应和风扇。只有在节点层次上才有冗余,而且集群软件能够透明地处理节点故障,并同时提供弹性和灵活性。这种节点一定程度上是自我管理的,而且可以快速扩

根据你对硬件的设置和你所安装的软件,集群可以是计算密集型的,以便进行HPC(高性能计算);也可以是更加存储导向型的,能够在单一名字的空间内提供和大型NFS(网络文件系统)云一样的存储。

像Google和Yahoo这样的公司已经构建并仍在构建它们自己的定制架构。Google直接从英特尔定购了大量的定制主板来满足它的低成本及低能耗要求。(如果Google是一个系统制造商,那么它可以排到前五位)。但是,你没有必要构建你自己的定制的Web 2.0存储架构。越来越多的主流存储厂商已经在为你开发这种类型的产品和服务了。

根据定购而设计

戴尔(纳斯达克代码:DELL)就是首先提供Web 2.0架构的公司之一。它的数据中心解决方案事业部在2007年3月宣布了云存储解决方案。通过这个计划,戴尔能够为集群式服务或存储设计、提供、甚至安装服务器及存储机架,并根据你的应用程序(以及低能耗要求)进行优化。该解决方案甚至还有维护和租赁选项。

根据戴尔在The Clouds博客上的讨论,该服务是针对大型订单(1500个以上的节点),而且你必须提供你自己的集群软件。戴尔没有像它销售给公众的产品那样提供现成的系统,但是它已经开发了专门针对集群应用程序的系统。

Sun微系统(纳斯达克代码:JAVA)和Rackable Systems(纳斯达克代码:RACK)也进入了Web 2.0市场。除了提供适合于集群的计算机及存储节点机架外,这两家公司还引人注目地提供移动式数据中心,这种数据中心是打包在存储集装箱内。例如,Sun的Modular Datacenter S20就是安在一个20英尺长的海运集装箱内,只使用一套电能、网络和水处理设备。

水冷方式使得这些单元比起传统空气制冷方式的数据中心中的类似数量的节点更加密集,更加节省电能。这种系统的主要优点就是能够让大量的存储或计算资源在很短的时间内启动起来。你还是必须要提供集群软件来将它们整合起来,不过Sun在去年收购了Lustre集群文件系统,而且将它带进了它的Open Storage(开放式存储)项目中。

[第1页]   [第2页]   [第3页]   [下一页]
您可以针对本文进行:[评论]  [收藏]  [推荐]  
  • 共有0条评论  点击查看更多评论
  • 网友评论仅供网友表达个人看法,并不表明e800同意其观点或证实其描述
我想发表评论:
用户名密码
  • 匿名发表
    验证码: