これが「IT運用最適化」の新常識、属人化を脱し全体最適化へ導く「4ステップ」を解説
「もぐら叩き状態」に陥る現場、事後対応型アプローチの限界
従来の監視手法は多くの場合、障害が発生した後のログやメトリクスといった「証跡」を基に原因を究明するものだ。問題が起こってから対応する事後的なアクションであるため、根本的な解決にはつながりにくい。結果として、障害対応は経験豊富なエンジニアの知識や勘の暗黙知に依存し、「業務の属人化」を招いてしまう。
ある企業では、無数のアラートが鳴り響き、担当者が夜間や休日を問わず呼び出されるという状況に陥っていたという。これは決して特殊な例ではない。これを放置すれば、MTTR(平均修復時間)の長期化やSLA(サービスレベル合意)の未達に直結し、最終的にはビジネス機会の損失という形で企業に跳ね返ってくる。疲弊した現場では、新たな価値を生む戦略的なIT投資にリソースを割くことも困難になるだろう。
現場を疲弊から救い、攻めの体制へと転換するには、障害が起きてから対処するサイクルを断ち切り、システムを「予防的・計画的」に管理できる仕組みへと根本から見直す必要がある。では、具体的にどのようなプロセスを踏めば、この課題を解きほぐし、コストとリソースの全体最適を実現する運用体制を築けるのだろうか。実際の企業運用事例とともに解説する。
IBMが提唱するIT運用高度化のベストプラクティス
テクノロジー事業本部
オートメーションプラットフォーム事業部
製品統括部/SME/営業部長
高萩 英樹氏
「あまたの成功事例を調査し、インタビューを通じて高度化の要因をひもときました。そこから整理したのが、準備段階を含むステップ0を含む、4段階のノウハウです」(高萩氏)
- ステップ0:運用現場の前提整理・意識合わせ
- ステップ1:可観測性(Observability)の向上
- ステップ2:リソース・コスト自動最適化
- ステップ3:IT投資の最適化と将来設計
多くの成功企業が最初に取り組んだのが、土台となる「ステップ0」である。「運用の高度化を考える前段階として、現状の運用環境や体制、目的・課題を定量的に明示できている状態」が不可欠だ。
具体的には3つの要素が求められる。第1に、運用課題とKPIの明確化だ。なぜ運用しているのか、何を達成すべきか、たとえば安定稼働なのか、コスト最小化なのかを明確に定義する必要がある。第2に、運用プロセスの棚卸しである。現在の業務フロー、使用しているツール、関係者の役割を可視化し、ムダや重複を洗い出す。第3に、各種課題の洗い出しだ。セキュリティ要件、人員配置、レガシーシステムの制約など、改善を阻む要因を明らかにする。
重要なのは、これらが組織の上から下まで、横断的に共有されていることだ。
「どこに課題があり、誰が、いつまでに、どう解決するのか。これが明確に定義されているかどうかが非常に重要です。また、自動化を推進するワークフローや、インフラストラクチャー・アズ・コードといった基礎的な仕組みが整っているかどうかも確認すべきポイントになります。この土台なくして、次の全体最適化のステップへ進むことはできません」(高萩氏)
ステップ1「可観測性」で予兆検知による障害の事前対応へ
「問題が起こってから対処するのではなく、起こりうるリスクを事前に検知し、予兆の段階で通知する。さらに『何が起こっているのか』『なぜ起こっているのか』『担当者は何を確認・対応すべきか』の把握を、A Iが支援する。これこそが可観測性の世界です」(高萩氏)
可観測性を高めることで、システムの状態を深く理解し、障害の予兆やビジネスへの影響を常に把握できるようになる。ある企業では、IBMの可観測性ソリューション「Instana」を導入したことで、経験の浅い担当者でもブラウザを開けば、いつ・どこで・何が起きているのか、影響範囲や根本原因、次の取るべき対応を迅速に把握できる状態を実現したという。
ステップ2・3でリソースとIT投資を全体最適化
単にコストを削減するだけでなく、リソース不足によるパフォーマンス低下や、過剰リソースによるコスト増を避け、常にビジネスに最適な状態を維持することが目的だ。
そして最終段階が、ステップ3「IT投資の最適化と将来設計」である。ここでは、グローバルなベストプラクティスであるTBM(Technology Business Management)を導入し、IT部門のビジネス貢献度を可視化する。
「本来、ビジネスを支える『影の英雄』であるはずのIT部門が、単なるコストセンターと見なされがちな実情があります。(中略)だからこそ、ビジネスに貢献するIT領域に対して『いくら投資し、なぜ投資し、どれだけのリターンを生んだのか』を、論理的に証明する手だてが必要なのです」(高萩氏)
TBMを実践することで、ITコストの予実管理や事業部門へのチャージバックが可能となり、データに基づいた戦略的な投資判断を下せるようになる。これにより、現状維持に8割が割かれているといわれる日本のIT予算を戦略的な新規投資へと振り向け、IT投資におけるROIの最大化を実現するのだ。
業種・規模を問わない成功事例
たとえば、流通グループのデジタル事業会社では、従来型の監視から包括的な可観測性への取り組みの中でInstanaを採用し、ページロード時間と障害原因特定時間を従来比36倍改善した。
製造業でも成果は顕著だ。電気機器メーカーでは、社内IT環境にTurbonomicを適用し、クラウドリソースを最大33%超削減できることが実証された。また、総合建設機械メーカーでは、Turbonomicによりクラウド上のアプリケーションのパフォーマンストラブルを年間10件にまで削減し、65万米ドル以上のコスト削減を達成している。
IT投資管理の領域では、製薬企業がApptio OneをITファイナンス基盤として採用し、グローバル標準のITコスト可視化とIT予算統制に役立てている。さらに、小売グループのIT機能会社では、Apptioと自社のコスト可視化プラットフォームを連携させ、開発期間短縮と高度なITファイナンスオペレーションを実現した。
「これらの成功事例に共通しているのは、ステップ0からステップ3までを着実に実践している点です。まずステップ0で個別最適化を図り、続くステップ1から3で全体最適化を進める。この『個別最適化』と『全体最適化』の両輪を同時に回していくことで、実際に多くのお客さまが確かな成果を上げています」(高萩氏)
運用高度化の第一歩は、自社の現状を可視化し、次に着手すべき課題を明確にすることである。各ステップに着実に取り組み、必要に応じてPDCAを回していくことが、運用高度化への最短経路となるだろう。