• 2026/06/11 掲載

【松尾研究所】RAG導入はなぜ失敗? クレディセゾンに学ぶ「AI前提」の超・情報設計

1
会員(無料)になると、いいね!でマイページに保存できます。
金融機関をはじめ、多くの企業が生成AIや「RAG(検索拡張生成)」の導入を進めている。しかし、高価な最新AIモデルを導入したにもかかわらず、「期待した精度が出ない」「古い情報ばかり参照してしまう」と頭を抱える企業は後を絶たない。 果たして、AI活用を失敗に導く“最大の罠”はどこにあるのか? 実は、その根本原因は「AIの性能」ではなく、企業内に眠る「人間向けのレガシーな文書」にあった。本稿では、クレディセゾンの先進的な取り組みを紐解き、生成AI時代を勝ち抜くための“真のデータ戦略”に迫る。
執筆:松尾研究所 副社長 金 剛洙

松尾研究所 副社長 金 剛洙

東京大学工学部卒、同大学院工学系研究科技術経営戦略学専攻修了。2020年より、松尾研究所に参画し、機械学習の社会実装プロジェクトの企画からPoC、開発を一貫して担当。その後、社内外の特命プロジェクトを推進する経営戦略本部を立ち上げ・統括。また、AI・知能化技術の応用により成長の見込めるベンチャー企業への投資に特化したVCファンドを新設し、代表取締役を務める。松尾研究所の参画以前は、シティグループ証券株式会社にて、日本国債・金利デリバティブのトレーディング業務に従事。

photo
なぜRAG導入は失敗する?
(出典:松尾研究所)

なぜデータが重要なのか?

 以前の記事(注1)では、「Prompt Engineering(プロンプトエンジニアリング)は死んだのか?」という問いを通じて、モデルが賢くなった現在においても、LLMに情報として何を与えるかが依然として重要であることを論じた。

 プロンプトの巧拙だけでなく、「どのような情報を、どのような形で与えるか」という設計思想こそが、生成AI活用の本質であると整理した。

 では、その”与える情報”はどこから来るのか。

 業務活用において生成AIの精度が上がらない背景には、モデルの能力不足だけではなく、入力されるデータ環境の未整備がある。社内文書が整理されていない、データが分断されている、最新情報が反映されていない──。こうした状況では、どれほど高性能なモデルを使っても、その能力を十分に引き出すことは難しい。

 生成AIの性能は、モデルそのものだけではなく、それを取り巻く「データ供給網」によっても大きく左右される。

「AIモデル選び」は無意味? 精度を落とす“魔窟”な文書群

 生成AI活用の議論において、金融機関の文書環境は極めて象徴的である。

 金融機関には、膨大な規程類、通達、業務マニュアル、商品説明資料、約款、FAQ、監督指針対応資料、内部監査報告書などが存在する。しかもそれらは、長年の制度改正や組織再編、業務追加の積み重ねの上に成り立っている。

 実際、金融機関における生成AI活用状況の調査(注2)(注3)(注4)でも、「データ・文書の未整備」は精度や運用上の課題に関わる重要な論点として繰り返し指摘されている。その結果、多くの組織で以下のような状況が生じている。

  • 同じ趣旨の規定が複数文書に分散している
  • 改訂履歴はあるが、どの版が実務上の最新版か分かりづらい
  • 用語の定義が文書ごとに微妙に異なる
  • 例外規定が脚注や別紙に散在している
  • 部門ごとに独自のローカルルールが存在する

 人間であれば、経験や暗黙知によってこれらをある程度補完できる。しかし生成AIは、そのような暗黙の前提を共有していない。

 たとえば、「内部管理責任者」という言葉が文書Aと文書Bで微妙に異なる役割を指していた場合、AIはその違いを正確に解釈できないことがある。あるいは、古い商品仕様書が検索結果に含まれていた場合、AIはそれを最新情報と取り違える可能性がある。

 つまり、金融機関の文書環境は、人間中心の設計としては成立していても、AI前提の設計にはなっていないのである。

 ここで重要なのは、「文書が多いこと」自体が問題ではないという点だ。問題は、情報が「構造化されていない」ことである。

 金融機関の文書は、制度対応や監査対応を優先して作られてきた。そのため、網羅性や証跡性は高い。一方で、AIが情報を検索・解釈・統合するために必要な構造は十分に整備されていないことが多い。

 たとえば、ある規程の本文では一般原則が示され、具体的な例外は別紙や通達に記載されていることがある。また、商品説明資料、業務マニュアルFAQ、社内通達の間で、同じテーマが異なる粒度で説明されていることも少なくない。

 人間であれば、所属部門の知識や過去の経緯を踏まえて「どの文書を優先すべきか」「どの記述が現在有効か」を判断できる。しかしAIにとっては、その優先順位や文脈が明示されていなければ、誤った情報を参照したり、複数の記述を不適切に統合したりするリスクがある。

 よって、金融機関において生成AIの精度を高めるためには、モデル選定やプロンプト改善だけでは不十分である。規程、マニュアル、商品情報、FAQ、通達、監査対応資料などを、AIが利用可能な形で整理し直す必要がある。

 具体的には、文書間の関係性、情報の鮮度、正式文書と補足資料の区別、部門ごとのローカルルール、例外条件などを明示し、AIが誤解しにくいデータ環境を整えることが求められる。

 この意味で、生成AI活用の成否は「どのモデルを使うか」だけでは決まらない。むしろ、AIに何を読ませ、どの順序で参照させ、どの情報を信頼させるかというデータ供給網の設計こそが、実務精度を左右する重要な競争軸になっている。

画像
「AI前提」の超・情報設計とは?
【次ページ】RAGは魔法ではない…実証実験で判明した「残酷な現実」
関連タグ タグをフォローすると最新情報が表示されます
あなたの投稿

    PR

    PR

    PR

処理に失敗しました

投稿したコメントを
削除しますか?

あなたの投稿コメント編集

通報

このコメントについて、
問題の詳細をお知らせください。

ビジネス+ITルール違反についてはこちらをご覧ください。

通報

報告が完了しました

コメントを投稿することにより自身の基本情報
本メディアサイトに公開されます

基本情報公開時のサンプル画像
報告が完了しました

」さんのブロックを解除しますか?

ブロックを解除するとお互いにフォローすることができるようになります。

ブロック

さんはあなたをフォローしたりあなたのコメントにいいねできなくなります。また、さんからの通知は表示されなくなります。

さんをブロックしますか?

ブロック

ブロックが完了しました

ブロック解除

ブロック解除が完了しました

機能制限のお知らせ

現在、コメントの違反報告があったため一部機能が利用できなくなっています。

そのため、この機能はご利用いただけません。
詳しくはこちらにお問い合わせください。

ユーザーをフォローすることにより自身の基本情報
お相手に公開されます

基本情報公開時のサンプル画像