大家周三好。
今天在贵阳和网友聚会未果(网友临时去紧急处理ORACLE RAC问题去了,哎,IT都是苦逼的命啊)。西瓜哥空着肚子去了机场,发现机场居然有临时工位,太贴心了。本来打算写今天的文章,但是好像不能上传图片,罢了。
回到帝都,发现空中看夜景真是漂亮,灯火通明,美轮美奂。可惜不能开手机拍照。看来APEC和风的效果一样,O(∩_∩)O哈!
由于家住机场反方向的农村,太远了,打车太贵,公交到家已经很晚了。今天能不写文章了不?亲。
哎,不矫情了,打开电脑,来聊聊我今天的学习心得。
话说昨天西瓜哥解读了3Par RAID,好像很受欢迎啊,现在阅读量都过4000了。看来我们的网友中的好学之徒还是不少的嘛。不过,毕竟西瓜哥没有配置过3Par的东西,因此文章还是有一些不准确的地方。很多熟悉3Par的朋友都反馈了很多问题,今天我们一块来澄清一下。
有网友告知dell compellent有计划抛弃物理热备盘:
HP的网友指出西瓜哥理解不准确的地方:
前3Par元老,西瓜哥从未见过的硅谷存储大拿也更正西瓜哥解读不对的地方:
还有网友问没有热备盘如何做热备,一个LUN太分散了是否风险太高(比如双盘失效的概率增加)?今天西瓜哥看了很多HP的资料,包括在飞机上仔细看了3Par的技术手册,然后问了HP 3Par的元老和现在在HP的网友,感觉理解又深了一些,今天一块来给大家分享。
首先更正一下3PAR的历史,正确的是1999年成立,2007年底IPO,但是胡司令说是在纽约证交所,而不是西瓜哥说的纳斯达克。其高端存储推出是2002年,我一直记成了2004年。感谢HP网友提供的官方的编年史。
关于3PAR RAID如何做热备,我今天也找到了答案。在硬盘切片的时候,根据相应的热备策略(高、中、低),系统自动在硬盘的最后的chunklet保留为spare chunklet(SC)。华为的RAID 2.0+配置的时候,也是要选择热备策略,也是分三档。但具体的SC放置在哪里,不知道是否和3PAR一样?
但如何控制一个LUN的某个条带不要跨越太多的硬盘,避免双盘失效呢(假设做RAID 5或者RAID 1)?华为的做法我们前面讲过,有一个disk domain的概念,用来做业务隔离。
我看到HP手册里面CPG策略也可以选择具体的物理磁盘,因此,也是有这个手段的。但如果用户没有做这个控制,或者选择了很多的硬盘,如1000块,那么双盘失效概率风险还是蛮高的。
华为技术人员告诉西瓜哥,RAID 2.0+系统内部还有一个disk group的概念,这个值是64。也就是重构的最大盘数是64个。这样就保障了系统的可靠性。这个值如果太小,重构的优势就体现不出来,太大风险又太高。
那么3PAR是否有这个机制呢?西瓜哥发现,有,而且思路是一样的。大家还记得我们前面提过的row size的概念吧。比如下面的logical disk,其row size就是3。也就是LD的一行由多少给RAID SET组成。只要控制了这个row size,其意义等同于华为的disk group。
查了HP的售后手册,发现这个值HP也是不能设置的(好像老版本可以设置)。而且不同的RAID级别,这个row size的最大值还不一样。西瓜哥查到当采用RAID 1的时候,其row size最大值是40。由于RAID 1的set size是2(即两块盘构成一个RAID SET,HP老的术语好像也叫raidlet),LD一行有40个RAID SET,那么就是80块磁盘。也就是HP 3PAR也做了自动故障隔离,它的取值是80块硬盘,比华为取的64块略多一些。至于RAID 5和RAID 6,由于其支持多种设置,如14+2的RAID 6情况下,估计row size最大值是5,因为16*5=80。但具体是多少,西瓜哥没有查到,HP的网友帮忙也没有查到。但相信3PAR肯定做了类似的控制,保证系统的可靠。
还有网友问,是否3PAR有更细的条带,类似华为的extent?我仔细看了HP的手册,有的,就是step size。其大小也是用户可以设置的,不同的RAID级别,其default值都不同,粒度也很小,好像粒度也小到128K。
到这里,估计大家都被各种术语搞糊涂了吧?我们拿一个RAID 5的例子来看一下,大家就比较清楚了。
可能西瓜哥翻译得不好,大家可以看看国外一个博客作者的英文定义:
最后,我们再来理解一下CPG这个术语。这个CPG其实就是一个虚拟的池,刚开始里面啥也没有,只有策略(这些策略就是上面的各种参数,如RAID级别啦,set size, step size,哪些硬盘,哪种硬盘啦等等)。当LUN需要空间的时候,通过CPG策略,可以生成符合策略的LD,然后再从LD里分配空间给VLUN。这里面还有一个小术语region,西瓜哥理解应该就是一个控制器上面组成LD的大条带,不知道理解对不对?
大家可以看到,一个VLUN其实是由无数的LD组成,每个LD都是有归属的。比如3PAR有4个控制器(node),某一个LD归属到某一个控制器上,一个VLUN由于有无数给LD组成,因此当访问这个VLUN的时候,所有的控制器都工作。这个就是3PAR宣传的A-A多活的负载均衡架构。因此,在VLUN这一级没有归属,但在LD这一级是有归属的。当然,一个控制器失效,另外一个控制器会接管上面的所有LD。
在3PAR的老的培训胶片里,举了一个例子,有助于大家理解这些术语,大家可以看看,但要注意,具体的值新版本是不同的,如chunklet大小现在是1GB了。
仔细看3par的手册,发现3par考虑还是很全面的。CPG策略,可以选择chunklet的速度(缺省是fast,也就是优先使用磁盘开始的部分chunklet,这部分速度快),这个功能在DELL的compellent也有,叫fast track。还有,大家知道3PAR的架构是4个磁盘组成一个cage,然后10个cage组成一个磁盘柜。3par RAID可以做到跨cage冗余(这个必须的,否则没法换盘了),如果磁盘框足够都,也可以实现跨框冗余,也就是整个磁盘框失效数据也不丢失。
好了,这么多术语,估计大家都被搞晕了。其实还有很多的细节,如元数据保存在哪里?CACHE掉电数据保存到哪里?块虚拟化确实还是比较复杂的,3PAR的文档是工程师写的,理解起来确实比较困难。
总的来说,3par RAID和华为的RAID 2.0+原理是一样的,但双方实现的思路不太一样,但最后呈现的效果基本一致。3par由于历史较长,在一些精细化的控制方面,做的还是比较完善的。
最后,我想调查一下,通过读了这两天的文章,你对3par RAID技术了解了吗?
好了,再不发出就过零点了。估计大家都睡了吧,明天见。
本文分享自微信公众号 - 高端存储知识(High-end_Storage)。
如有侵权,请联系 support@oschina.cn 删除。
本文参与“OSC源创计划”,欢迎正在阅读的你也加入,一起分享。