システム運用において、グーグルが提唱・実践する「サイト・リライアビリティ・エンジニアリング(SRE)」モデルへの注目が集まっている。アプリの安定性・信頼性・可用性をリアルタイムに改善することを期待されているSREチームだが、先進的な企業のSREチームであっても、いくつもの課題に直面しているのが現状だ。中でも、ハイブリッド・マルチクラウド環境下で急増するデータから、必要なデータを選別し、インシデント解決に導くまで、多くの時間を要し、本業であるアプリ開発やサービス向上のための時間を奪われてしまっている。これらの状況を改善するには、IT運用にAIと自動化を活用した「AIOps」が必要だ。AIOpsがSREにどのようなメリットをもたらすか説明する。