データ復旧
株式会社ピーシーキッド
RAIDについて
RAIDとは
RAID(Redundant Arrays of Inexpensive(Independent) Disksの略)とは、「安価なディスクを組み合わせることで冗長性を持たせる仕組み」のことです。耐障害性を高めるためや読み書きの高速化を図るために予備システムを用意することを冗長化といい、それによって安全性や信頼性が保たれている状態を冗長性があると言います。万が一のHDD障害時にも瞬時に予備システムに切り替えることでデータ復旧・アクセスを可能にします。また、モードごとに特徴があるので、用途に応じてさまざまな構築が可能です。
RAIDの仕組みが考え出された当時は、大容量のHDDは高額なので、容量が小さく安価なディスクを使ってディスクアレイを構築することが目的でした。現在ではHDDの価格も下がり、主に安全性の確保を目的として構築されています。特に信頼性を必要とするビジネスシーンにおいては、必要不可欠なストレージとして利用されています。
HDDの構成によってRAID1から5までの5種類が定義されていましたが、冗長性が確保されないストライピングもRAIDの1種とみなされ、RAID0と呼ばれています。今日ではRAID0、RAID1、RAID5、及びこれらの方式の組み合わせが主に用いられていて、RAID2、RAID3、RAID4は現在あまり使われていません。RAID5を拡張したRAID6はRAID5より耐障害性が必要な場面で使われています。
導入を検討しているユーザーは、コスト・速度・信頼性のうちの何を重視するかによって必要に応じた組み合わせを選択し導入することができます。
RAIDの種類と特徴
ディスクアレイのアーキテクチャ
- レベル1
- ディスクミラーリング
- レベル2
- ストライピング(ハミングコード)
- レベル3
- ストライピング(パリティコード)
- レベル4
- 独立R/Wアクセス(パリティディスク固定)
- レベル5
- 独立R/Wアクセス(パリティディスク分散)
- レベル6
- 独立R/Wアクセス(パリティディスク分散)2台
RAID技術において使われる用語
- ストライピング
- データを複数台のハードディスクドライブ(HDD)に分散して書き込み、読み書きを高速化すること。短所としては、1つのHDDにトラブルが発生すると、全てのデータが使えなくなり、耐障害性が低い。そのため、RAIDには含まれずにRAID0と呼ばれている。一般的には、RAID1やRAID5などと組み合わせて使われている。
- ミラーリング
- PCでデータを保存するときに、同時に複数の記憶装置に書き込むこと。仮に1つの記憶装置がダメになっても、別の記憶媒体に保存されているデータを読み出すことができるので、信頼性が保持される。
- パリティディスク
- PCの記憶装置において、さらに信頼性を高めるために誤りをパリティ検査で検出したり、誤り訂正符号で訂正したりしています。複数台のHDDのデータから計算されたパリティを作成し、そのパリティを、もう1台別のHDDに保存することです。
- スペアディスク
- ディスクが壊れた時にRAIDの冗長性を取り戻すために準備しておくディスクをスペアディスクと言います。スペアディスクは、ストレージ機器に格納され、通電されています。あるディスクが壊れると自動的に動作を開始するのでホットスペアディスクとも言います。RAIDとスペアディスクの組み合わせで、ディスクにトラブルが発生しても、人の手を介さなくても正常な状態で運用できます。
RAID導入によるメリットと注意点
RAIDにはいくつかの利点がありますが、レベルによって目的が違ってきます。処理速度を上げたいのか、安全性・信頼性を重視したいのか、容量自体を増やしたいのか。どれを目的にするかでRAIDの組み合わせが違ってきます。まずは、その特徴を理解しましょう。
RAID導入によるメリット
- 冗長性の確保
- RAIDを導入する最大の目的は、冗長性の確保にあります。サービスを常に提供し、ダウンタイムを避けるという目的においては非常に有効です。 一台のHDDではそれが壊れると保存されているデータは無くなりますが、複数のHDDをアレイに組み込むことで、システムが停止するリスクを回避することが可能で、システムの信頼性を保つことができます。
- 容量の拡大
- RAIDは、ハードディスクを複数台組み合わせることにより、仮想的な大容量のハードディスクとして使用する技術です。例えば、1TBのHDDを4台組み合わせると最大4TBまで使用出来る仮想的な記憶装置になります。(使用するRAIDのレベルによって利用可能な容量は変わります。)このディスクスペースはOSから見ると1台の大きなディスクとして扱われ、パーティションを区切って複数のボリュームに分割して使用することもできます。
- 処理速度の向上
- 一つの処理を複数のハードディスクに分散することにより、データの読み書きを高速化することも可能です。動画編集や大きなデータベースを扱う場合、複数台のHDDを使用することで、一台では不可能な処理速度を実現することができます。
RAID導入に関する注意点
- 故障リスクの増加
- RAIDに組み込むディスクの数が増えるにしたがって故障確率は増えていきます。純粋に故障確率の観点から見ればRAIDを導入することで故障のリスクは高まるので、バックアップをとることが必須となります。特に冗長性のないRAID0のみで構成する場合は注意が必要です。
- RAIDの冗長性に頼りすぎてしまう
- RAIDを導入したことで、障害を察知できずに冗長性がカバーする範囲を超えてしまい、データを失う場合があります。また、障害からの復旧作業の手順ミスでデータを失う場合もあり、人的なミスでデータを消失してしまう危険性があります。RAIDの冗長性に頼りすぎることなく、適切に運用・管理すること、障害からの復旧作業においては、手順書を作成しておき、それにそって作業をすすめることなどが求められます。
- RAIDはバックアップツールではない
- 2台のディスクに対して同じデータを書き込むRAID1において、間違って削除してしまった場合、両方のディスクから同じようにデータが無くなっています。RAIDはバックアップツールではありませんのでご注意下さい。
よく使われるRAIDレベル
RAID0
データを一定のブロックごとに複数のディスクに分散して保存します。高速な処理速度が必要な時に使われます。別名をストライピングとも言います。冗長性を持たないという意味でRAIDレベル0(ゼロ)が付与されています。速度は向上するものの、故障率が上がるため、単独のRAID0で使用されることは少なく、RAID1やRAID5と組み合わせて組まれることが多いのが実状です。最小の構成台数はディスク2台です。
- 長所
-
- RAIDレベル中最もディスクの容量効率が高い。
- ディスク数が増えるほど転送速度が高速になる。
- 短所
-
- 故障リスクは1台のディスクの時よりも高く、冗長性や耐障害性は確保されない。
- ストライプサイズやコマンドキューの調整を適切に行わないと、ランダムアクセス速度があまり速くならないか、ディスク数の増加によってむしろ低下するおそれがある。
RAID1
複数のディスクに対して同時に同じデータを保存していきます。このことをミラーリングと言います。常にディスクのコピーを作っておくことができます。両方のデイスクが同時に壊れる可能性は非常に低いため、システムの安定性は高くなります。冗長性を確保する目的で使います。最低2台のディスクが必要になります。
- 長所
-
- ディスク数が増えるほど、耐障害性が高くなる。1台のディスクに障害が生じてもシステムの稼働を続けられる。
- 障害のあるディスクを交換すれば、簡単に正常な状態に戻せる。
- 短所
-
- 容量の効率はよくない。2台で構成した場合、容量効率は1/2。
- 高速化はあまり見込めない。
RAID5
もし、特定のディスクにのみアクセスが集中すると、そのディスクの消耗が激しくなり、負担が増え、寿命が短くなります。そこで、水平パリティを利用して複数のディスクに誤り訂正符号データと共に、分散して記録します。最小ディスク数は3台。RAID1に比べ容量効率に優れ、複数のディスクに分散しているため読み出し効率が良くなっています。書き込みの際はキャッシュを利用しパリティ演算を行って速度の低下を避けています。
- 長所
-
- ディスク数が増えるほど、高速化が見込める。
- 1台のディスクが故障してもデータ回復できる。
- 短所
-
- 高価格帯の製品を除き、ソフトウェアRAIDに不向き(パリティ演算が必要なため、処理は重くなる。)
- 停電やディスクの故障などで書き込みの途中で急に停止が発生した場合、検出困難な不整合が起こる場合がある。ハードウェアRAIDでは、このリスクに備えバッテリを搭載するなどして急な停止を避けるように構成されているケースが多い。
- ディスク一台が故障した際はパリティデータから復元するため、性能が落ちる。
- 2つ以上のディスクが同時に故障すると、RAIDのシステムでは回復できない為、データ復旧が必要になる。
- データの書き込み時にパリティデータが生成されるため、読み込みに比べると早くはならない。
- 最小構成台数が最低3台必要なので、初期導入コストは高い。
RAID6
冗長データを2種類作成し、2つのディスクに記録することで2重障害に対応でき、2台のディスクに障害があってもシステムが維持でき、データの復元ができます。別名をダブルパリティRAIDと呼びます。技術的にはRAID5と同じですが、パリティデータを二重に生成して異なるディスクに保存し、RAID5よりもさらに冗長性を高めています。最低4台のディスクが必要です。
- 長所
-
- ディスクの台数が増えるほど高速化を見込める。
- RAID5よりさらに高い耐障害性がみこまれ、信頼性が高くなる。
- 構成するディスクのうち2台が故障してもシステムの稼働を継続できる。
- 障害があるディスクだけを取り出して交換することで、正常な状態に戻すことができる。
- 短所
-
- 長期的な運用コストはRAID5と大差ないが、初期費用が高くなる。
- 2重でパリティデータを生成するためRAID5よりも書き込みのパフォーマンスが低くなる。
- 3つ以上のディスクが故障するとデータの復元ができない。
RAID10
RAID0とRAID1を組み合わせて各々の弱点を補いあったRAID構成。RAID0の弱点のランダムアクセスがRAID1の特性で高速化できます。構造としては、複数のRAID1のミラーセットをさらにRAID0(ストライピング)として組み合わせたものです。高速化、大容量化を目的とするRAID0と冗長性を目的とするRAID1を組み合わせることで大容量化を図り、速度、耐障害性も叶えることができます。最低ディスク数は4台。
- 長所
-
- 同じミラーセットを構成するディスクに同時に障害が起こらない限りシステムの稼働を維持できる。
- パリティデータ生成の必要がないため、構成がシンプル
- 障害があるディスクのみの交換で正常な状態に戻せる。
- 短所
-
- ミラーリングの特性でディスクの利用効率は低い。ディスク容量の半分になる。
- 初期導入コストは高くなる。安全性は高くなるが容量コストが倍になる。
RAIDの復旧について
RAIDの復旧のご依頼を頂く際に「RAIDのレベル」と「RAIDの種類」(ソフトウェアかハードウェアか)を予めお知らせ下さい。おわかりになる範囲で結構です。確実にデータ復旧の作業を進めるために必要な情報です。
セキュリティついて
当社ではお客様の情報を適切に管理・保護することを重要な社会的責務と考え、セキュリティの強化に努めております。