- 会員限定
- 2014/02/27 掲載
どうしてデータ消失が起こるのか 消失事故の4パターンから導くバックアップ対策
データ消失は、ハード障害と人的ミスが8割
しかし、最近ではデータの増大やシステムの複雑化によって、多くの企業にとってそのバックアップ作業が面倒になっている状況だ。たとえツールを利用してバックアップしても、データが大きくなれば、復旧時のリストアにも時間がかかる。あらかじめ生データを複製して運用すれば、その分のコストがかかる。
HP社の調べによれば、データ消失の原因のうち、ハードウェア障害(44パーセント)と人的ミス(32パーセント)が全体の約8割を占めるそうだ。
データ消失の原因を違う角度で見てみると、内的・外的要因に分けて考えることもできる。内的要因には「プログラム不良」「HDD障害」があり、外的要因には「メンテナンスミス/操作ミス」「限界を超えた運用」「災害/不正アクセス」がある。この中から実際に起きた事例について、大塚商会のエンジニアである吉田 圭吾氏がバトンタッチして詳しく説明した。
RAID構成でも起きるデータ消失
吉田氏はこの講演で、企業におけるデータ消失例を4点ほど挙げた。ひとつずつ具体例について説明していこう。(1)HDD障害によるデータ消失
(2)人的なミスによるデータ消失
(3)限界を超えた運用によるデータ消失
(4)災害によるデータ消失
まずは、HDD障害によるデータ消失について。これはRAID構成での障害だ。
RAIDは、複数のディスクをまとめて冗長性を確保する仕組みである。たとえば500ギガバイトのHDD×2基をまとめて仮想的に1つのディスクとし、両者に同じデータを保管すれば、メインのHDDが故障しても、もう1基のデータで業務を継続できる。
「もしRAID5でHDDが故障した場合には、HDDを交換するか、あるいは予備スペアディスクを用意しておき、データ領域の再構築(リビルド)を行うことになります。この、リビルドの途中で別のHDDに障害が発生することがあり、データにアクセスできず、データを消失してしまうのです」
冗長性を確保するRAIDを組んだにもかかわらず、データ消失しては本末転倒だ。では、どのような対策をすべきなのか。吉田氏は次のように語る。
「たとえRAIDを構築しても必ずしも安全ではないため、別途データ保護の仕組みを用意しておく必要があります。すぐにデータ保護の仕組みを導入することが難しい場合は、 HDDを交換してデータ領域の再構築をする前にデータをバックアップしたり、ネットワーク経由で他のマシンにデータを逃がす等、データ領域の再構築を行う前に何等かの形でデータを退避しておく事がポイントになります」(吉田氏)。
次は人的ミスによるデータ消失の事例だ。どんな企業でも起こる可能性があるリスクだ。
「『いざデータを復旧しようとしたら、バックアップが取れていなかった』というケースがよくあります。バックアップがしっかり取れているか、その確認がとても重要です。確実な方法は、バックアップシステムのコンソールやログから調べることです」
最近のソリューションには、バックアップの成功/失敗を知らせる通知機能が用意されているものもある。しかし、吉田氏は「”アラートが来ないから安心”ではありません。システムが落ちてアラートが飛ばなかったり、バックアップ中にOSアップデートによる再起動が発生して以降のバックアップが実行されなくなる事態もあります。”バックアップの失敗だけでなく成功も通知”したほうがよいのです。アラートだけでなく、通知自体がこないことにより何等かの問題が発生していることを察知できます」と指摘する。
【次ページ】まだまだある、データ消失事例
関連コンテンツ
関連コンテンツ
PR
PR
PR