- 会員限定
- 2023/03/14 掲載
AIOpsとは何か? 事例や市場、実際のツールまで一挙に解説
AIOpsとは何か?
AIOpsとは、「Artificial Intelligence for IT Operations」の略で、簡単に言うとIT運用にAIを活用することを意味します。IT運用に対して、大量の運用データを収集・加工し、機械学習を活用して、高度化・効率化・自動化を実現する考え方です。AIOpsという言葉自体は近年生まれましたが、IT運用にAIを活用するという考え方自体は、かなり古くからあります。
たとえば、AIを異常・障害検知に活用する発想は、1990年代ごろより存在しており、積極的に議論が行われてきました。それが近年AIOpsという形で改めて脚光を浴びています。
AIOpsで実現できること3つと実現サイクル
AIOpsで実現できることは大きく分けて3つあります。・高度化
人間では検知・判断・対応することが非常に困難な大容量のデータまたは散財しているデータ(例:ログ、イベント、メトリック、トレース、グラフ、ドキュメントデータ)を元に、機械学習・ビックデータテクノロジーを駆使して、事前・早期に検知・対応します。
・効率化
パターンや統計的・確率的分析アプローチを用いて、異常検出やその原因を特定します。また、図形の連結性に注目するトポロジー分析により、人間の判断に必要なデータやアドバイス、ソリューションを提示し、効率的な運用を可能にします。
・自動化
分析結果や過去データと、それに対するアクション、人間が事前に決めた閾値を元に、AI自身が判断してアクションすることで、人間が介在しない運用課題を解決します。
また、AIOpsプラットフォームは、IT運用管理において、下図の3ステップで、継続的な示唆を提示することができます。このサイクルを繰り返すことにより、AIOpsプラットフォームは成熟していきます。
第1ステップ:観察(モニタリング)
システムから提供される膨大なイベントや、メトリクスなどを取り込み、システムの裏側で起きている問題を検知するべく、機械学習を活用します。運用中のシステムのログやパフォーマンスを分析し、システム内の異常や障害を検知して、複数のシステム間のログからイベントの相関を見つけ出し根本原因分析を行います。原因を特定したら問題解決・修復に向けて人間が理解可能な文脈化を行います。
第2ステップ:エンゲージ(IT Service Management/ITSM)
第1ステップで収集したデータ、分析結果、根本原因に加えて、AIプラットフォームをITSMと統合して、ITサービスのライフサイクル全体をカバーし、そこからインプットされる、インシデント、依存関係・変更情報もインプットとします。
監視観点だけではなく、運用観点で過去事例・対処方法を元に、変更リスク・パフォーマンスを総合的に分析します。その結果をITSMに基づいて適切なIT運用担当者に通知し、IT運用者はAIOpsプラットフォームから提供されるデータ・分析結果・原因を元に、対応方法を検討します。
第3ステップ:アクション(自動化)
第2ステップにて検討された対応方法を元に、IT運用者の対応手順・スクリプトを作成して、問題解決と修復を行います。AIOpsプラットフォームが次回同種の問題を検知した際に、自動的に実行されるように、設定・実装を行います。
AIOpsとMLOpsの違い
AIOpsと似た言葉に、MLOpsという言葉があります。ときどき近しい意味として扱われることがあるのですが、実態はまったく異なります。AIOpsは、IT運用の高度化と効率化、そして自動化を目的とした、機械学習やビッグデータを利用した運用手法です。一方、MLOpsは、機械学習を効率的に運用することを目的とし、データサイエンティストや、開発者、運用担当の役割分担や、分析・開発・運用のプロセス整備、機械学習プログラムマネジメントのシステム化、モニタリング、チューニングなどの仕組みを実現するための手法です。
そのため、AIOpsはAIにより運用を効率化、MLOpsは機械学習やAIの効率的な運用という意味で、アプローチはまったく逆のものですし、目的も異なります。
AIOpsが必要となった背景
前述のとおり、古くよりIT運用に対してAIを活用するという考えはありました。その中で、昨今特にAIOpsが注目を集めている理由は、「IT運用の複雑化」と「技術革新」の2点です。IT運用が複雑になり人間だけでは対応が難しくなったこと、また技術革新によりAIOpsが実現できる土壌が整ったことにより、AIOpsの活用は今後加速していくでしょう。
IT運用の複雑化
近年、ビジネス環境の変化が早くなり、アプリケーションの変更サイクルが短くなっています。環境の変化に対応するために、アプリケーション構成は、疎結合で堅固なモジュール境界を提供した小さい機能の集合体となります。さらに、利用言語やライブラリ、サービスなどが異なる環境でも対応可能となり、各機能が独立して変更可能なコンテナ化やマイクロサービスアーキテクチャ化が進みつつあります。
コンテナ&マイクロサービスにおいては、小規模で分散されるアプリケーション構成が、構成要素の増大、構成要素間の依存関係の複雑化をもたらすことによって、IT運用の複雑化を招いています。
技術革新
技術革新においては、以下、2つの要素が含まれます。(1)ビッグデータの取り扱い
IT運用では、AIOpsを実現するための元となるログデータが大量で、散在しているという特徴があります。大容量・散在データを取り扱う環境は、データ連携ツールの進化、ストレージの低価格化、クラウドサービスの充実などを背景に整備されてきました。
(2)AI活用
第三次AIブームでは、AIの著しい進化がみられています。従来の推論・探索やエキスパートシステムではなく、人間では扱えないような大量データを元にして、機械学習やディープラーニングなどを活用することで、現実課題を解決しようとするAIがする実現されるようになりました。これによって、IT運用で発生する現実課題に、AIが対応できる範囲が大幅に広がり、予測や検知、原因判断などもできるようになりました。
今すぐビジネス+IT会員にご登録ください。
すべて無料!今日から使える、仕事に役立つ情報満載!
-
ここでしか見られない
2万本超のオリジナル記事・動画・資料が見放題!
-
完全無料
登録料・月額料なし、完全無料で使い放題!
-
トレンドを聞いて学ぶ
年間1000本超の厳選セミナーに参加し放題!
-
興味関心のみ厳選
トピック(タグ)をフォローして自動収集!
関連コンテンツ
関連コンテンツ
PR
PR
PR