找回密码
 注册
搜索
热搜: 回贴

服务器技术之服务器硬盘

2010-1-30 22:23| 发布者: admin| 查看: 32| 评论: 0|原作者: 夙瑶

硬盘是我们最熟悉不过的配件之一,很多人碰到服务器硬盘,自然而然就想到SCSI接口的硬盘,不了解还以为SCSI就是唯一的标准。然而一直统治着台式机领域的IDE在服务器硬盘中仍未销声匿迹,随后的SATA作为一名新将正慢慢占据服务器中低端市场。或许你产生了质疑,服务器硬盘的可靠性可以让IDE和SATA承担吗?怎么存在着标准不一的硬盘呢?怎么还有一些支持PCMCIA接口、IEEE 1394接口、USB接口和FC-AL(FibreChannel-Arbitrated Loop)光纤通道接口的产品?下面的文字将会为你讲解。其实有个很明显的原因,就是由于在新标准不断推出时,原有老标准并没有因新标准的出现而迅速退出市场,相反却因具有非常高的实用性仍长期在市场中存在,具有相当的生命力,占有相当的市场份额,这就造成了目前多种硬盘接口同时存在的局面。

当然作为高端领域的SCSI不可能退出历史的舞台,但如今很多人面临着SATA或者是SCSI的抉择,很大程度上是市场造成的,但追究起来,主要还是用户对硬盘类型的不了解,不知道如何去选择。我们相信,“存在就有价值”,当然这么多中类型的硬盘存在也必定有它们的市场定位,了解企业的所需,选择符合企业发展的需求的硬盘才是明智之举。现在让我们一起来了解服务器硬盘……
一、市场篇
为了满足网络应用不断增长的性能需要,我们通常增加新服务器个数,分担业务,提高系统工作性能,即横向扩展。其实也可以通过提高现有服务器的配置来提高服务器的整体性能,即纵向扩展——因为服务器部件的选配对服务器的性能至关重要。而直接存储数据的硬盘更是影响服务器服务性能的重要一环。
  提高服务器性能的方法就是寻找制约服务器性能的瓶颈在哪。不同应用可能存在的瓶颈是不同的,有的要重点考虑处理器、内存,有的要重点考虑硬盘或网络的I/O吞吐能力;那么,在哪些应用环境下需要重点考虑服务器硬盘瓶颈呢?
  通讯服务器(messaging/E-mail/VOD):快速的I/O是这类应用的关键,硬盘的I/O吞吐能力是主要瓶颈;
  数据仓库(联机事务处理/数据挖掘):大型商业数据存储、编目、索引、数据分析,高速商业计算等,需要具有良好的网络和硬盘I/O吞吐能力;
  数据库(ERP/OLTP等):服务器运行数据库,需要具有强大的CPU处理能力,大的内存容量来缓存数据,同时需要有很好的I/O吞吐性能;
  其他应用:应用集中在数据查询和网络交流中,需要频繁读写硬盘,这时硬盘的性能将直接影响服务器整体的性能。

二、参数篇
  谈到硬盘的指标参数,首先就应提到硬盘的接口标准。当今主流服务器硬盘的接口界面有两种:SATA和SCSI,当然此外还有IDE接口的,不过在服务器领域处于淘汰边缘。主要原因是并行接口的电缆属性、连接器和信号协议都已经到达一个顶点。随着工作频率的提高,原来在低频率下的IDE接口标准越来越受到交叉干扰、地线增多、信号混乱等因素的制约,特别是在新的Ultra ATA/133标准中。而新的Serial ATA标准不仅可以全面解决以上问题,而且其数据传输速率有相当大的发展空间。光纤接口类型的硬盘并不常见,因其接口宽带很宽,所以常用于大型的数据存储服务器上,如NAS或者SAN数据存储网络,还经常用于流媒体服务器,因流媒体容量非常大,而且连续性要求很高,光纤接口的高带宽就满足了以上要求。

当然,也有部分低端服务器采用了IDE硬盘,目前,几乎所有服务器主板都集成了IDE控制器,但在中高端服务器中还只是普遍用来连接低速外设IDE光驱,而硬盘一般采用SCSI接口标准,如浪潮英信服务器就普遍采用了Ultra160 SCSI硬盘,提供更高的硬盘吞吐能力。SCSI接口硬盘有着极低的CPU占用率、支持更多的设备和在多任务下工作的优势明显等优点,更适合于服务器应用的需求,当然SCSI硬盘价格要高得多。
如今随着SATA-II的推出,在中低端的企业级的应用环境中,SATA已经显现出强大的竞争力。专家指出硬盘的可靠性是与接口无关,使用与SCSI硬盘相同的组件加上ATA接口电路完全可以达到相同的可靠性级别。WD Raptor硬盘就可以提供120万小时的平均无故障时间和5年质保。SCSI硬盘目前的最高转速可达15000rpm,SATA硬盘则是10000rpm,更高的转速可以获得更高的寻址速度,这永远是高转速硬盘的优势。但15000rpm并不是市场的主流,就目前最高采用率的SCSI硬盘而言,仍以10000rpm为主。

在接口速度方面,SCSI目前最高的水平是320MB/s,SATA是150MB/s。但SCSI总线是共享的,SATA则是点对点的,这就意味着当SCSI通道内的硬盘实际带宽总和超过320MB/s时(目前SCSI硬盘数据传输率最高在75MB/s,4块SCSI硬盘就基本达到了实际带宽总和),SCSI总线反而将成为瓶颈。SATA则没有这个问题。举个例子来说,5块SCSI硬盘系统的数据传输率仍然是有限的320MB/s 然而5块SATA的系统则能够达到750MB/s。容量方面SATA硬盘已经达到400GB,而计划上市的SCSI硬盘只达到300GB的水平。而且SATA硬盘的价格更加便宜。这就意味着在同一总容量下,用户可以使用数量更少的SATA硬盘,从而节约总成本。
如今也推出了SAS接口 ,SAS是紧接在平行 SCSI 接口之后所开发出的全新接口。此接口的设计将有效改善存储系统的效能、可用性和扩充性,以及提高与 Serial ATA (SATA) 硬盘的兼容性。它主要好处之一是,它可让 IT 人员在组装系统时拥有更多的弹性。SAS 与 SATA 为兼容的传输技术,二者可同时存在于一个存储系统之中,满足更广泛的需求。

  然而,一切硬盘的数据传输系统之瓶颈不在于PCI总线或是接口速率上,而在硬盘本身,这是由硬盘机械部分与结构设计等诸多因素造成的。


衡量硬盘的指标:
  衡量硬盘性能的指标主要包括:
  主轴转速:
  主轴转速是一个在硬盘的所有指标中除了容量之外,最应该引人注目的性能参数,也是决定硬盘内部传输速度和持续传输速度的第一决定因素。如今硬盘的转速多为7200rpm、10000rpm和15000rpm。从目前的情况来看,10000rpm的SCSI硬盘具有性价比高的优势,是目前硬盘的主流,而7200rpm及其以下级别的硬盘在逐步淡出硬盘市场。15000rpm产品在高端领域采用。
  内部传输率:
  内部传输率的高低才是评价一个硬盘整体性能的决定性因素。硬盘数据传输率分为内外部传输率;通常称外部传输率也为突发数据传输率(Burstdata Transfer Rate)或接口传输率,指从硬盘的缓存中向外输出数据的速度,目前采用Ultra 320 SCSI技术的外部传输率已经达到了320MB/s;内部传输率也称最大或最小持续传输率(Sustained Transfer Rate),是指硬盘在盘片上读写数据的速度,现在的主流硬盘大多在30MB/s到60MB/s之间。由于硬盘的内部传输率要小于外部传输率,所以只有内部传输率才可以作为衡量硬盘性能的真正标准。
  单碟容量:
  除了对于容量增长的贡献之外,单碟容量的另一个重要意义在于提升硬盘的数据传输速度。单碟容量的提高得益于磁道数的增加和磁道内线性磁密度的增加。磁道数的增加对于减少磁头的寻道时间大有好处,因为磁片的半径是固定的,磁道数的增加意味着磁道间距离的缩短,而磁头从一个磁道转移到另一个磁道所需的就位时间就会缩短。这将有助于随机数据传输速度的提高。而磁道内线性磁密度的增长则和硬盘的持续数据传输速度有着直接的联系。磁道内线性密度的增加使得每个磁道内可以存储更多的数据,从而在碟片的每个圆周运动中有更多的数据被从磁头读至硬盘的缓冲区里。

  平均寻道时间:
  平均寻道时间是指磁头移动到数据所在磁道需要的时间,这是衡量硬盘机械性能的重要指标,一般在3ms~13ms之间,建议平均寻道时间大于8ms的SCSI硬盘不要考虑。平均寻道时间和平均潜伏时间(完全由转速决定)一起决定了硬盘磁头找到数据所在的簇的时间。该时间直接影响着硬盘的随机数据传输速度。

  缓存:
  提高硬盘高速缓存的容量也是一条提高硬盘整体性能的捷径。因为硬盘的内部数据传输速度和外部传输速度不同。因此需要缓存来做一个速度适配器。缓存的大小对于硬盘的持续数据传输速度有着极大的影响。它的容量有512KB、2MB、4MB,甚至8MB或16MB,对于视频捕捉、影像编辑等要求大量磁盘输入/输出的工作,大的硬盘缓存是非常理想的选择。
  体形的大小:

  面向服务器的硬盘大部分为3.5英寸规格,而面向笔记本电脑的2.5英寸的硬盘也步入了服务器。随着刀片服务器和1U架构的盛行,服务器内部也面临着散热的问题,2.5英寸硬盘能在减下空间同时,实际上增大了散热面积和导风的空间。希捷和日立2.5英寸服务器硬盘相继上市。两公司发布产品后,2.5英寸硬盘在服务器硬盘领域的应用也将日趋活跃。2.5英寸服务器硬盘主要用于企业储存。
  选好服务器硬盘
  知道了服务器硬盘的性能指标,下一步自然要依此选择出适合具体应用的服务器硬盘,以提高系统的工作性能。

三、技术篇
  由于SCSI具有CPU占用率低,多任务并发操作效率高,连接设备多,连接距离长等优点,对于大多数的服务器应用,建议采用SCSI硬盘,并采用最新的Ultra320 SCSI控制器;对于低端的小型服务器应用,可以采用最新的SATA硬盘和控制器。确定了硬盘的接口和类型后,就要重点考察上面提到的影响硬盘性能的技术指标,根据转速、单碟容量、平均寻道时间、缓存等因素,并结合资金预算,选定性价比最合适的硬盘方案。
  RAID技术
  冗余磁盘阵列RAID系统提供了比通常的磁盘存储更高的性能指标、数据完整性和数据可用性,尤其是在当今面临的硬盘I/O总是滞后于CPU性能的瓶颈问题越来越突出的情况下,RAID解决方案能够有效地弥补这个缺口。
  依据磁盘阵列数据不同的校验方式, RAID技术分为不同的等级(RAID Levels),各有不同的技术特点,具体的可以看下面这篇文章。



quote:
--------------------------------------------------------------------------------
[技术]浅谈服务器的RAID技术

  所谓RAID就是Redundant Array of Independent Disk的缩写,中文意思是“独立冗余磁盘阵列”,简单来说就是一种利用多个硬盘来提高系统对磁盘的读写速度及其数据安全系数的一种技术。RAID技术开始一般用于服务器或大型工作站上面,但随着RAID技术的不断成熟,现在不少的家用PC的主板都内置了RAID芯片。

  RAID技术主要有6类,分别为RAID 0~RAID 5,它们各有各的优缺点,所以应根据不同的实际情况选用不同的技术。下面我们就简单介绍一下这6种RAID技术。

RAID 0

  RAID 0的原理很简单,就是将n个硬盘并联起来,然后把一大段的数据分成大小一定的带区(striping),再将每一个带区分成n份同时写入各个硬盘。这样一来数据的读写速度将提高n倍,但是RAID 0没有冗余功能,一旦其中一个硬盘损坏,所有的数据将会无法使用,所以其可靠性也会大大降低,仅等于当单独使用一块硬盘时的1/n,因此RAID0技术不适合于执行关键任务的环境。

RAID 1

  RAID 1运用的是磁盘镜像技术,就是将偶数个硬盘分成两份,将其中的一半拿来做另外一半的备份,这样做的好处就是在不影响性能的情况下,能够最大限度地保证系统的可靠性和可修复性。当然,在6类的RAID技术中,RAID 1的成本是最高的,硬盘的利用率是最低的——仅为50%。因此RAID 1主要用于要保存关键数据的场合。

RAID 2

  RAID 2综合利用了共轴同步技术和ECC(Error Checking and Correcting)检验技术,原理是将若干个硬盘分成两组,分别用来储存数据和校验用的海明码。RAID2是将数据分散为位(bit)分别并算出其ECC代码,然后同时写入各硬盘。如果某一个硬盘发生故障,系统也能够根据海明码和其余的有效数据算出正确的数据进行恢复。因为RAID2的存取是所有硬盘同时进行的,用的是又单位元的存储,所以小于一个扇区的存取会大大削弱其性能,在磁盘利用率方面,RAID2一般只有在使用15个硬盘以上的系统中才会凸显其利用率的优势。因此RAID2不适合用于网络服务器,小型机或PC上。

RAID 3

  RAID 3 与RAID2 相似,只不过用奇偶校验码来代替了ECC代码,所以只需要一个硬盘来存储校验码,但其存在的问题是当要向某一个硬盘的某一个扇区写入数据的时候,就要读取其他数据硬盘相同位置的数据,并算出校验码再写入存储校验码的硬盘。所以,RAID3 也不适合需要经常写入零碎文件的场合。显然,在某一个硬盘出现故障的时候系统仍能够正常工作并可以恢复,其磁盘的利用率为(n-1)/n。

RAID 4

  RAID 4虽然也是选用了一个硬盘用来存储奇偶校验码,但RAID对数据的读写实按块来进行,所以在读取数据方面会比RAID3快了不少,但写入方面则因要读取其他数据盘在同一位置上的数据块,速度会比RAID3要慢,其他方面,跟RAID3都基本上一样。

RAID5

  RAID5又是RAID4的改进,它将本来存储在一个硬盘上的奇偶校验块按一定的顺序平均放到每一个硬盘上。这样做就避免了在存储数据的时候对校验硬盘过于频繁的读写,同时这也大幅度提高了写入零散数据时的效率。RAID5一样具有容错能力和较高的磁盘利用率,但RAID5的读写控制比较复杂,所以RAID的芯片造价也比较高,一般只用于联机交易处理。

  以上6种是最基本的RAID技术,在其基础上还派生出了许多的RAID技术。

最新评论

相关分类

QQ|小黑屋|最新主题|手机版|微赢网络技术论坛 ( 苏ICP备08020429号 )

GMT+8, 2024-9-30 23:26 , Processed in 0.246088 second(s), 12 queries , Gzip On, MemCache On.

Powered by Discuz! X3.5

© 2001-2023 Discuz! Team.

返回顶部