- 会員限定
- 2026/05/28 掲載
NTTが国産LLM「tsuzumi 2 Visionモデル」を発表、複雑な図版入り文書に対応
複雑な図表などを画像として読み込み、内容を理解して回答
今回発表された「tsuzumi 2 Visionモデル」は、2025年10月に提供を開始した300億パラメータのテキスト専用モデル「tsuzumi 2」を基盤としている。この基盤モデルに、独自開発した文字および図表理解用のアダプタを組み合わせることで、文書内の視覚情報を直接処理できるようになった。これにより、これまで人間による目視確認や手作業での入力に頼っていた複雑な帳票類、会議資料の電子化や内容のデータベース化の工程を自動化する。
新モデルの最大の特徴は、高度な情報処理能力と導入コストの低さを両立している点にある。海外製の巨大な汎用モデルとは異なり、単一のGPU(NVIDIA A100相当)によるオンプレミス環境やプライベートクラウド環境での稼働を維持している。パラメータ数を抑えた軽量設計でありながら、独自のベンチマークテストではメタの「Llama 4 Scout」やオープンAIの「GPT-5.2」といった最新の海外製モデルと同等水準の読解性能を示した。さらに、テキストモデル単体における数値情報の計算能力や、外部ツールを呼び出すAPI連携などの論理的処理能力も強化している。
NTTは本モデルを、学習データや開発プロセスのすべてを自社で管理する純国産AIとして展開する。著作権や学習データの権利保護を徹底し、データ主権を重視する「ソブリンAI」の需要に応える方針だ。今後はNTTグループ各社を通じて順次サービスを提供し、金融機関や医療機関、行政機関など、外部への情報流出を警戒する領域での導入を見込んでいる。
AI・生成AIのおすすめコンテンツ
AI・生成AIの関連コンテンツ
PR
PR
PR