開閉ボタン
ユーザーメニュー
ユーザーメニューコンテンツ
ログイン

  • 会員限定
  • 2018/12/19

AzureやOffice 365にログインできない…マイクロソフト、多要素認証の障害を「2度」も

約1週間で2回ダウン

ユーザーIDとパスワードだけでログインが可能なシステムは、もはやセキュアなシステムとはいえません。セキュリティトークンやショートメッセージの利用や、生体認証などの要素を加えた多要素認証を用いることが、特に企業向けサービスなどセキュリティを重視するシステムへのログインでは欠かせない仕組みになっています。

新野淳一(本記事は「Publickey」より転載)

新野淳一(本記事は「Publickey」より転載)

ITジャーナリスト/Publickeyブロガー。大学でUNIXを学び、株式会社アスキーに入社。データベースのテクニカルサポート、月刊アスキーNT編集部 副編集長などを経て1998年退社、フリーランスライターに。2000年、株式会社アットマーク・アイティ設立に参画、オンラインメディア部門の役員として2007年にIPOを実現、2008年に退社。再びフリーランスとして独立し、2009年にブログメディアPublickeyを開始。現在に至る。

photo
アップデートしたコードにバグが潜り込んでサーバがフリーズしたという
 ところが、マイクロソフトのクラウドサービスであるMicrosoft AzureやOffice 365、Microsoft Dynamicsなどへログインするための多要素認証のシステムが、2週間で2回もダウンするという障害を引き起こしています。障害が発生しているあいだは多要素認証を用いたログインができない深刻な状態でした。

 一度目の障害は11月19日午前4時(世界協定時。日本時間の19日午後1時39分)から、午後6時38分(日本時間20日午前3時38分)までと、ほぼ一日の営業時間全体で止まっており、二度目は11月27日午後2時20分(日本時間午後11時20分)から午後5時39分(日本時間翌28日午前2時39分)まで約3時間、止まっていました。

 それぞれの原因は異なっており、マイクロソフトは「Azure Status History」のページで二度の障害についての原因と対策を報告しています。


 なぜ多要素認証という重要なシステムで障害が発生したのか、そしてどのような対策が行われたのか。同社の報告から概要を見ていきます。

システムアップデート後、トラフィック増大が引き金になってバグが発生。

 11月19日の一度目の障害の遠因となったのが、13日から16日にかけての内部システムのアップデートでした。ここで潜り込んだバグが、数日後の19日になって、あるデータセンターでのトラフィックが閾値を超えたタイミングで以下の障害を次々に引き起こすことになったのです。

1)多要素認証システムの負荷が一定以上に高まると、多要素認証システムのフロントエンドからキャッシュサービスへのアクセスに対する遅延が発生した
2)この遅延が多要素認証システムのバックエンドサーバを再利用する際に競合状態を作り出し、それがさらに全体の遅延を引き起こした
3)上記の遅延が障害検知システムにもおよび、障害の検知そのものができなくなっていた

 それでもなんとか障害に気づいた多要素認証システムの担当チームは、遅延が遅延を呼んで障害を起こしているシステムをなんとか立て直そうとシステムの一部に変更を加えます。

対策するはずが火に油をそそぐ結果に

 残念ながらそれは火に油を注ぐような逆効果になったと、次のように報告されています。

【次ページ】 およそ1週間後、多要素認証システムは再び障害を起こす

BCP(事業継続) ジャンルのセミナー

BCP(事業継続) ジャンルのトピックス

BCP(事業継続) ジャンルのIT導入支援情報

PR

ビジネス+IT 会員登録で、会員限定コンテンツやメルマガを購読可能、スペシャルセミナーにもご招待!