- 会員限定
- 2025/02/04 掲載
AIモデル「多すぎ」問題を解決? アクセンチュアも投資「モデルルーティング」とは
バークリー音大提携校で2年間ジャズ/音楽理論を学ぶ。その後、通訳・翻訳者を経て24歳で大学入学。学部では国際関係、修士では英大学院で経済・政治・哲学を専攻。国内コンサルティング会社、シンガポールの日系通信社を経てLivit参画。興味分野は、メディアテクノロジーの進化と社会変化。2014〜15年頃テックメディアの立ち上げにあたり、ドローンの可能性を模索。ドローンレース・ドバイ世界大会に選手として出場。現在、音楽制作ソフト、3Dソフト、ゲームエンジンを活用した「リアルタイム・プロダクション」の実験的取り組みでVRコンテンツを制作、英語圏の視聴者向けに配信。YouTubeではVR動画単体で再生150万回以上を達成。最近購入したSony a7s3を活用した映像制作も実施中。
http://livit.media/

AIモデルで悩まなくていい「モデルルーティング」
AIモデルの数が爆発的に増加する中、最適なモデル選択の重要性が高まっている。HuggingFaceに登録されている大規模言語モデル(LLM)を含むAIモデルの数は100万を超えており、その中から適切なモデルを選ぶことは容易ではない。
この課題に対する解決策として注目を集めているのが、「モデルルーティング」と呼ばれる技術だ。この技術は比較的新しい分野で、まだ名称が定着しておらず、海外メディアにおいてはモデルルーティングのほか、LLMルーティングやスマートルーティングなど、複数の名称が用いられている。
モデルルーティングは、ユーザーのクエリ/プロンプトを分析し、最適なAIモデルを選択する役割を果たす。たとえば、OpenAIのGPTシリーズだけでなく、メタのLlama-3、DatabricksのDBRX、AnthropicのClaudeシリーズ、Mistral AIのMistral Largeなど、さまざまな特徴を持つモデルの中から、タスクに最適なものを選択できるのだ。
AI業界が注目するスタートアップ「2社」とは
これまでもOpenAI、Anthropic、グーグルなど複数の企業のAPIをつなげつつ、エージェントシステムを用いることで、自前でルーティングシステムを構築することはできたが、各社のAPI構文の違いやエージェントシステムとのコンパティビリティ問題などにより、実装が複雑化することが多く、ルーティングシステムをアプリケーションに統合するまで多くの課題が発生していた。しかし最近になり、高精度のルーティングを簡単に使えるプラットフォームがいくつか登場しており、ルーティングシステムのアプリケーション統合が圧倒的に簡素化されている状況だ。
また、コスト削減の観点からもモデルルーティングへの関心は高くなっている。簡単なクエリ/プロンプトであれば、安くて速いモデルを選択し、複雑で難解な場合のみ高コスト/高精度のモデルを自動で選択できるため、アプリケーションの運用コストを大幅に下げることが可能になっているのだ。
この分野で特に注目されているのが、MartianとNot Diamondの2社のスタートアップである。ともに創業間もないが、すでに大手企業との提携のほか、AI業界の著名人らから投資を受けるなど、話題に事欠かない存在となっている。ではこの2社はそれぞれどんな企業なのだろうか。 【次ページ】アクセンチュアが投資で話題の「Martian」
AI・生成AIのおすすめコンテンツ
AI・生成AIの関連コンテンツ
PR
PR
PR