- 会員限定
- 2025/02/04 掲載
AIモデル「多すぎ」問題を解決? アクセンチュアも投資「モデルルーティング」とは
英大学院修了後、RPA企業に勤務。大手通信社シンガポール支局で経済・テクノロジーの取材・執筆を担当。その後、Livit Singaporeでクライアント企業のメディア戦略とコンテンツ制作を支援(主にドローン/AI領域)。2026年2月、シンガポールで「SimplyPNG」を設立し、AI画像編集のモデル運用とGPUコスト最適化を手がける。主にEC向け画像処理ワークフローの設計・運用自動化に注力。
AIモデルで悩まなくていい「モデルルーティング」
AIモデルの数が爆発的に増加する中、最適なモデル選択の重要性が高まっている。HuggingFaceに登録されている大規模言語モデル(LLM)を含むAIモデルの数は100万を超えており、その中から適切なモデルを選ぶことは容易ではない。
この課題に対する解決策として注目を集めているのが、「モデルルーティング」と呼ばれる技術だ。この技術は比較的新しい分野で、まだ名称が定着しておらず、海外メディアにおいてはモデルルーティングのほか、LLMルーティングやスマートルーティングなど、複数の名称が用いられている。
モデルルーティングは、ユーザーのクエリ/プロンプトを分析し、最適なAIモデルを選択する役割を果たす。たとえば、OpenAIのGPTシリーズだけでなく、メタのLlama-3、DatabricksのDBRX、AnthropicのClaudeシリーズ、Mistral AIのMistral Largeなど、さまざまな特徴を持つモデルの中から、タスクに最適なものを選択できるのだ。
AI業界が注目するスタートアップ「2社」とは
これまでもOpenAI、Anthropic、グーグルなど複数の企業のAPIをつなげつつ、エージェントシステムを用いることで、自前でルーティングシステムを構築することはできたが、各社のAPI構文の違いやエージェントシステムとのコンパティビリティ問題などにより、実装が複雑化することが多く、ルーティングシステムをアプリケーションに統合するまで多くの課題が発生していた。しかし最近になり、高精度のルーティングを簡単に使えるプラットフォームがいくつか登場しており、ルーティングシステムのアプリケーション統合が圧倒的に簡素化されている状況だ。
また、コスト削減の観点からもモデルルーティングへの関心は高くなっている。簡単なクエリ/プロンプトであれば、安くて速いモデルを選択し、複雑で難解な場合のみ高コスト/高精度のモデルを自動で選択できるため、アプリケーションの運用コストを大幅に下げることが可能になっているのだ。
この分野で特に注目されているのが、MartianとNot Diamondの2社のスタートアップである。ともに創業間もないが、すでに大手企業との提携のほか、AI業界の著名人らから投資を受けるなど、話題に事欠かない存在となっている。ではこの2社はそれぞれどんな企業なのだろうか。 【次ページ】アクセンチュアが投資で話題の「Martian」
AI・生成AIのおすすめコンテンツ
AI・生成AIの関連コンテンツ
PR
PR
PR