NVIDIA AIファクトリーが示す生成AIインフラのこれから ― ソブリンAI基盤の設計と実装
講演内容
AIファクトリーは、生成AIを「速く動かす仕組み」であると同時に、「自社や国内の管理下で安全に運用する仕組み」として理解する必要があります。
本セッションでは、NVIDIAが提唱する「AIファクトリー」という新しい生成AIインフラの考え方を起点に、その構成要素と設計思想をわかりやすく整理してご紹介します。従来のデータセンターにおける汎用的なクラウド利用から、今後は特に推論処理を中心としたAIワークロードを安定かつ効率的に実行するオンプレミスやプライベートクラウド型の基盤へと需要がシフトしていくことを見据え、トークン生成を継続的に行うためのインフラ像を解説します。さらに、GPU、ネットワーク、ソフトウェアを統合したフルスタック型アーキテクチャが、なぜこれからの生成AI活用に不可欠なのかを整理し、日本企業がAIインフラ戦略を考えるうえで押さえるべき視点をコンパクトにお伝えします。
登壇者
エヌビディア合同会社
AIファクトリプラットフォーム事業部
石田 大樹 氏