開閉ボタン
ユーザーメニュー
ユーザーメニューコンテンツ
ログイン

  • 2011/02/01

富士通、運用中のストレージを重複除去するソフトウェアを開発 業界初

富士通は2月1日、運用中のブロックストレージにおいて、データの保存と同時に、ソフトウェアのみで重複データを除去する技術を業界で初めて開発したと発表した。データの重複を瞬時に発見するアルゴリズムを開発することで、特殊なハードウェアを使わずに運用中のストレージの容量をスリム化できるという。

 今回、富士通が発表した技術は、運用中のストレージに格納された複数の仮想マシンのOSデータを含め、さまざまなデータの重複部分を除去することが可能になるというもの。同社によれば、たとえば仮想マシンのデータが10個ある場合には容量を約10分の1にスリム化できるという。本技術の一部は、独立行政法人 新エネルギー・産業技術総合開発機構(NEDO)委託の「グリーンITプロジェクト ストレージシステム向け省電力技術の開発」の成果。

 運用中のストレージに格納されたデータの重複を除去するためには、データの保存時に重複しているかどうかの判断をする必要があるが、従来の技術では困難だった。そのため、運用中のデータを別のストレージに一時的にオフラインで格納して夜間などシステムが忙しくない時間に重複するデータを除去する方法がとられていた。

 これに対して今回開発された技術のポイントは、「データを瞬時に検索するアルゴリズム」と「さまざまなOSに対応できる」こと。

 本技術では、書き込むデータがすでにストレージに格納されたデータと重複していないかを瞬時に判断し、新規のデータのみをストレージに書き込み、重複したデータはストレージに記録されない。重複しているかどうかを効率的に判断する手法としてブルームフィルターという手法があるが、本技術ではブルームフィルターを検索にも対応させ、重複の判断とともにデータの保管場所の検索も処理できるようにした。この技術により、検索に必要な処理量を削減し、ソフトウェアだけでデータ保存と同時に重複除去を行うことを可能にしたという。

photo
重複検索技術

 また、本技術はさまざまなOSを用いる仮想環境でも利用できるという。仮想環境では、それぞれのOSが割り当てられたブロックストレージにデータを書き込むが、本技術ではすべてのブロックストレージの中で重複するデータを除去してからデータを書き込むため、OSは意識することなく利用できるという。

photo
重複除去技術と仮想環境の関係

 富士通では、本技術を利用することでストレージを有効に活用して大量のデータを格納したり、ストレージにかかるコストを低減することが可能になるとして、今後は実用化に向けた開発を進め、データセンターでの活用など、数年以内の実用化を目指して取り組んでいくという。

お勧め記事

ストレージ ジャンルのセミナー

ストレージ ジャンルのトピックス

ストレージ ジャンルのIT導入支援情報

関連リンク

PR

ビジネス+IT 会員登録で、会員限定コンテンツやメルマガを購読可能、スペシャルセミナーにもご招待!