- 2026/03/06 掲載
みずほFGの金融特化型LLM、銀行実務テストで正答率89.0%を記録
機密データを扱う金融業務において高い精度と処理速度を両立
こうした背景からみずほフィナンシャルグループでは複雑な推論ステップを経ずに、金融特有の実務知識やコンプライアンス上の留意点を反映できる独自モデルの構築を進めてきた。開発にあたっては一般に公開されている基盤モデルをベースに社内のマニュアルや研修資料そして過去の稟議データなどを集中的に学習させている。
モデルの回答生成の正誤を分析して得意な領域と不得意な領域を特定したうえで正答を導き出すために必要な金融知識や社内ルールの根拠となる情報を教師データとして付与、回答と根拠の対応関係が学習されるようデータを最適化することで推論プロセスに依存しない高精度な回答を可能にした。
銀行の実務テストは預金や融資および外国為替などの分野を対象とした多肢選択式で実施された。推論を用いない条件での正答率は89.0パーセントとなり平均回答時間は1秒未満であった 。汎用的な言語モデルであるGPT-5.2の推論機能を有効にした設定では正答率89.7パーセントに対して平均回答時間が67.4秒かかっていたため、十分な精度を維持したまま応答時間を大幅に短縮したことになる。
外部へデータを送信することなく銀行内のオンプレミス環境ですべての処理を完結できる仕組みを採用、外部のシステムに依存せずに運用できるため機密性の高いデータに対しても汎用モデルと同水準の高度な処理を安全に適用できるとしている。
同グループは業務特性に応じたAI基盤を段階的に整備する戦略を掲げている。今回の成果を第一段階と位置付け一般的な照会応答や資料作成の支援から運用を始める。次の段階では融資や法務などの各部署に特化した専門データを学習させベテラン担当者と同等の知見を活かした与信判断の支援や稟議書の素案作成といった高度な実務サポートへと適用範囲を広げる計画である。
最終的には複数の特定領域特化モデルを連携させる協調型エキスパートモデルを構築し部門横断的な判断を支援する体制の確立を目指している。
金融AIのおすすめコンテンツ
PR
PR
PR