開閉ボタン
ユーザーメニュー
ユーザーメニューコンテンツ
ログイン

  • 会員限定
  • 2018/08/08

Google Cloudのロードバランサー障害、原因は新機能に含まれていたバグ

テスト時も導入時にも発見できず

Google Cloudのロードバランサーが、7月17日の12時17分(米国太平洋標準時夏時間。日本時間7月18日午前4時17分)から約40分のあいだ障害を起こし、Pokémon GOやSpotifyなどGoogle Cloud上で提供されている多くのサービスが影響を受けた件について、Googleは経緯や原因などの報告を公開しました。

Publickey 新野淳一

Publickey 新野淳一

ITジャーナリスト/Publickeyブロガー。大学でUNIXを学び、株式会社アスキーに入社。データベースのテクニカルサポート、月刊アスキーNT編集部 副編集長などを経て1998年退社、フリーランスライターに。2000年、株式会社アットマーク・アイティ設立に参画、オンラインメディア部門の役員として2007年にIPOを実現、2008年に退社。再びフリーランスとして独立し、2009年にブログメディアPublickeyを開始。現在に至る。

photo

 報告によると、原因はロードバランサーに追加された新機能にバグがあったことだとされています。

ロードバランサーがバックエンドと通信できなくなる

 前述の通り、障害が発生したのは7月17日の12時17分(米国太平洋標準時夏時間。日本時間7月18日午前4時17分)。

 主な現象は、Google HTTP(S) Load BalancerがHTTPステータス502(不正なゲートウェイ)を返す、つまりロードバランサーがバックエンドのサービスと通信できない、というものでした。関連するサービスであるTCP/SSL Proxy Load BalancerとGoogle App Engineでも障害が発生しました。

 ただしすべてのリクエストに対して502が返ったわけではなく、約33%から最大87%の割合でこの現象が発生していたとのことです。

 502ステータスが返る障害は12時49分まで続き、またこの影響でキャッシュのヒット率が約70%低下。キャッシュヒットを含むすべてが正常に戻ったのは12時55分でした。

 報告によると、Googleのエンジニアリングチームは障害発生の2分後となる12時19分にアラートを受けて対応を開始、12時44分に原因を究明して対策をデプロイしたとのことです。

テスト時にも導入時にもバグが発見できなかった

この続きは会員限定です

ここから先は「ビジネス+IT」の会員の方(登録は無料)のみ、ご利用いただけます。

今すぐビジネス+IT会員にご登録ください。

すべて無料!ビジネスやITに役立つメリット満載!

  • 1

    インタビューから事例記事まで、ここでしか読めない1万本超の記事が無料で閲覧可能

  • 2

    導入事例資料や技術資料、デモ動画などを無料でダウンロード・閲覧可能

  • 3

    年間1,000本以上、会員限定のスペシャルセミナーにご招待

  • 4

    ビジネス+IT編集部が必読記事を、メールマガジンでお知らせ!

BCP(事業継続) ジャンルのトピックス

BCP(事業継続) ジャンルのIT導入支援情報

PR

ビジネス+IT 会員登録で、会員限定コンテンツやメルマガを購読可能、スペシャルセミナーにもご招待!