*ディスクアレイ [#b72b8cc1] **RAID5 の故障確率 [#x2d58e93] RAID5 全体の AFR = (1-(1-AFR^2)) * nC2 AFR ... 年間故障率 n ... RAID5 を構成するディスク本数 C ... 組合せ Combination 組合せは、Excel で COMBIN(n,m) 関数が便利。 考え方は、同時に二本壊れる確率を (1-(1-AFR^2)) で計算し、その組合せが nC2 分だけ存在するため。 ||4 本|5 本|6 本|7 本|8 本|9 本|10 本|11 本|h |使用効率|75%|80%|83%|86%|88%|89%|90%|91%| |ディスク容量|3|4|5|6|7|8|9|10| |~AFR 1 %|0.06%|0.10%|0.15%|0.21%|0.28|0.36%|0.45%|0.55%| |~AFR 2 %|0.24%|0.40%|0.60%|0.84%|1.12%|1.44%|1.80%|2.20%| |~AFR 3 %|0.54%|0.90%|1.35%|1.89%|2.52%|3.24%|4.05%|4.95%| |~AFR 4 %|0.96%|1.60%|2.40%|3.36%|4.48%|5.76%|7.20%|8.80%| |~AFR 5 %|1.50%|2.50%|3.75%|5.25%|7.00%|9.00%|11.25%|13.75%| **RAID6 の故障確率 [#idf29ea2] RAID6 全体の AFR = (1-(1-AFR^3)) * nC3 AFR ... 年間故障率 n ... RAID6 を構成するディスク本数 C ... 組合せ Combination ||5|6|7|8|9|10|11|12|h |使用効率|60%|67%|71%|75%|78%|80%|82%|83%| |ディスク容量|3|4|5|6|7|8|9|10| |~AFR 1%|0.00%|0.00%|0.00%|0.01%|0.01%|0.01%|0.02%|0.02%| |~AFR 2%|0.01%|0.02%|0.03%|0.04%|0.07%|0.10%|0.13%|0.18%| |~AFR 3%|0.03%|0.05%|0.09%|0.15%|0.23%|0.32%|0.45%|0.59%| |~AFR 4%|0.06%|0.13%|0.22%|0.36%|0.54%|0.77%|1.06%|1.41%| |~AFR 5%|0.13%|0.25%|0.44%|0.70%|1.05%|1.50%|2.06%|2.75%| これであってるでしょうか? 何かご指摘があればコメントしてください。 //#comment **RAID が理論値よりも壊れやすい理由 [#v1763402] -ディスクアレイを構成する HDD は通常、同一メーカー、同一容量、同一時期の出荷であり、同一ロットである可能性が極めて高い。 -ディスアレイを構成しているということは、同程度の温度と湿度、同程度の使用頻度、同程度の期間使用されていると言える。 -同じロットの製品は、同じ故障特性を持っており、同じような状況で集中して故障する可能性がある。 -そのため RAID ディスクの 1 本が故障し、そのスペアが到着するのを待っているうちに、もう 1 本が故障してしまう事が、理論値以上に発生しうる。(経験的にも、理論値以上に故障しやすいと思われる。) -そのため、サーバー用の RAID 製品ではホットスペアに対応している。ホットスペアの HDD も同一ロット、同一環境、同一期間であるが、「使い減り」していない分だけ、同時に故障する可能性は低いと思われる。 結論 : 上記 RAID の故障確率を鵜呑みにしてはいけない。 **RAID 構成だったのにデーターが失われてしまった理由 [#d76d9fbc] +ある 1 本が故障してしまったのに気づかず、さらにもう 1 本が故障してしまった。→ しっかり監視する。 +ある 1 本が故障してしまい、そのスペアが到着する前に、もう 1 本が故障してしまった。→ ホットスペアか、HDD の買い置きを用意する。 +RAID コントローラーが壊れた。ディスクアレイの電源が壊れた。→ この辺も二重化できるが、ある程度リスクとして見込むべき +ファイルを誤って消してしまった、上書きしてしまった。→ RAID が救えるのは物理破損だけ、論理バックアップをとりましょう。 ---- #vote(参考になった[9],参考にならなかった[0]) #vote(参考になった[10],参考にならなかった[0])