ビジネス+IT編集部
大規模言語モデル(LLM)を活用したAIエージェントを複数組み合わせる「マルチエージェントシステム(マルチAIエージェント)」の構築において、LangChainとCrewAIという2つのフレームワークが注目を集めている。LangChainは、特定機能を持つエージェントを設計し、多様なLLMを統合できる基盤的プラットフォーム。一方、CrewAIは、LangChain上に構築されており、マルチエージェントシステムに特化した組織化と協調の層を提供するフレームワークだ。この記事では、AIマルチエージェントシステムの基礎と具体的なサービス、さらにはCrewAIを使って、リサーチャー、データアナリスト、ライターの3つのAIエージェントが市場分析を行う具体的なシステムの構築方法を紹介したい。
大規模言語モデルの開発において、アウトプットの質をチェックする「エバリュエーション(評価)」プロセスは非常に重要だ。ChatGPTが人間らしい回答を生成できるのも、このプロセスがあってこそといわれている。しかし、このプロセスには大量の人的資源・時間・資金が必要となるだけでなく、バイアス問題などの課題が多数存在しており、現在その課題解決に向けた動きが活発化している。そんな中、メタが2024年8月に発表した「Self-Taught Evaluator」は、LLMに自己改善ループの能力を与えるアプローチとして注目を集める存在に。どのようなアプローチなのか、評価プロセスの現状に触れつつ、その詳細を解説したい。