• 会員限定
  • 2026/05/28 掲載

NTTが国産LLM「tsuzumi 2 Visionモデル」を発表、複雑な図版入り文書に対応

複雑な図表などを画像として読み込み、内容を理解して回答

1
会員(無料)になると、いいね!でマイページに保存できます。
NTTは2026年5月19日、独自開発の大規模言語モデル(LLM)「tsuzumi 2」のアップデート版となる「tsuzumi 2 Visionモデル」を発表した。複雑な図表やグラフを含む日本語のビジネス文書を画像として読み込み、内容を理解して回答できる。機密情報を扱う企業向けに、1基のGPUで稼働する軽量性を維持しながら業務のデジタル化を推進する。
photo
(図版:ビジネス+IT)
 日本企業のデジタルトランスフォーメーション(DX)推進において、機密性の高い社内文書の自動処理は長らく課題とされてきた。従来の大規模言語モデルはテキスト処理に優れる反面、見積書やフローチャート、財務諸表など、特有のレイアウトや図表を含む文書の読み取りには限界があった。NTTはこの課題を業務DXを阻む「ラストマイル」の障壁と位置づけ、図表入りビジネス文書の視覚的理解に特化したモデルを開発した。

 今回発表された「tsuzumi 2 Visionモデル」は、2025年10月に提供を開始した300億パラメータのテキスト専用モデル「tsuzumi 2」を基盤としている。この基盤モデルに、独自開発した文字および図表理解用のアダプタを組み合わせることで、文書内の視覚情報を直接処理できるようになった。これにより、これまで人間による目視確認や手作業での入力に頼っていた複雑な帳票類、会議資料の電子化や内容のデータベース化の工程を自動化する。

画像
【図版付き記事はこちら】NTTが図表などのビジネス文章を処理可能な国産LLM「tsuzumi 2 Vision」(図版:ビジネス+IT)

 新モデルの最大の特徴は、高度な情報処理能力と導入コストの低さを両立している点にある。海外製の巨大な汎用モデルとは異なり、単一のGPU(NVIDIA A100相当)によるオンプレミス環境やプライベートクラウド環境での稼働を維持している。パラメータ数を抑えた軽量設計でありながら、独自のベンチマークテストではメタの「Llama 4 Scout」やオープンAIの「GPT-5.2」といった最新の海外製モデルと同等水準の読解性能を示した。さらに、テキストモデル単体における数値情報の計算能力や、外部ツールを呼び出すAPI連携などの論理的処理能力も強化している。

 NTTは本モデルを、学習データや開発プロセスのすべてを自社で管理する純国産AIとして展開する。著作権や学習データの権利保護を徹底し、データ主権を重視する「ソブリンAI」の需要に応える方針だ。今後はNTTグループ各社を通じて順次サービスを提供し、金融機関や医療機関、行政機関など、外部への情報流出を警戒する領域での導入を見込んでいる。

Googleで見つけやすく

評価する

いいね!でぜひ著者を応援してください

  • 1

会員(無料)になると、いいね!でマイページに保存できます。

共有する

  • 0

  • 0

  • 0

  • 0

  • 0

関連タグ タグをフォローすると最新情報が表示されます
あなたの投稿

    PR

    PR

    PR

処理に失敗しました

投稿したコメントを
削除しますか?

あなたの投稿コメント編集

通報

このコメントについて、
問題の詳細をお知らせください。

ビジネス+ITルール違反についてはこちらをご覧ください。

通報

報告が完了しました

コメントを投稿することにより自身の基本情報
本メディアサイトに公開されます

基本情報公開時のサンプル画像
報告が完了しました

」さんのブロックを解除しますか?

ブロックを解除するとお互いにフォローすることができるようになります。

ブロック

さんはあなたをフォローしたりあなたのコメントにいいねできなくなります。また、さんからの通知は表示されなくなります。

さんをブロックしますか?

ブロック

ブロックが完了しました

ブロック解除

ブロック解除が完了しました

機能制限のお知らせ

現在、コメントの違反報告があったため一部機能が利用できなくなっています。

そのため、この機能はご利用いただけません。
詳しくはこちらにお問い合わせください。

ユーザーをフォローすることにより自身の基本情報
お相手に公開されます

基本情報公開時のサンプル画像