• 2026/06/05 掲載

米Google、ノートPCで動作する軽量マルチモーダルAI Gemma 4 12B公開

ローカル動作する軽量性とより大規模なモデルに匹敵する性能

2
会員(無料)になると、いいね!でマイページに保存できます。
米Googleは2026年6月3日、テキスト、画像、音声を直接処理できるオープンウェイトのマルチモーダルAIモデル「Gemma 4 12B」を発表した。パラメータ数は約120億で、16GBのメインメモリを搭載した一般的なノートPC上でローカル動作する軽量性を維持しながら、より大規模なモデルに匹敵する性能を持つ。
photo
(画像:Google blog)
 米Googleは2026年6月3日、新たなオープンウェイトモデル「Gemma 4 12B」を公開した。画像や音声の入力に対応するマルチモーダル機能を備えつつ、パラメータ数を約120億に抑えた中規模モデルである。最大の特徴は、16GBのメインメモリ(VRAMまたはユニファイドメモリ)を搭載したコンシューマー向けのノートPC上で、完全にローカルな環境で動作する点にある。

 従来のマルチモーダルAIは、テキスト、画像、音声を処理する際、各データ形式に対応した独立したエンコーダーを用いてデータを変換してから言語モデルに入力する手法が主流であった。この方式はモデル全体のサイズを肥大化させ、推論時の遅延やデータ処理におけるメモリ消費量の増加を招く要因となっていた。Gemma 4 12Bは、このエンコーダーを完全に排除した「エンコーダーレスアーキテクチャ」を同ファミリーの中規模モデルとして初めて採用した。画像や音声のデータを単一のトランスフォーマーコアへ直接入力して処理する構造を確立したことで、メモリ使用量を大幅に削減し、低遅延での推論を実現している。

画像
【図版付き記事はこちら】Googleより16GBのノートPCで動作する軽量AIモデル「Gemma 4 12B」リリース(画像:ビジネス+IT)

 本モデルは、エッジデバイス向けの小型モデルと、高性能サーバー向けの巨大モデルの間に存在する空白を埋めるプロダクトとして位置づけられている。小型軽量な設計でありながら、同シリーズのより大規模なモデル「Gemma 4 26B」に迫る推論性能をベンチマークテストで記録した。さらに、ローカル推論の速度を最大化する目的で、専用のマルチトークン予測(MTP)モデルも併せて公開されている。

 ライセンスにはApache 2.0を採用しており、商用および研究目的での利用が可能となっている。Hugging Faceなどのプラットフォームを通じてモデルデータが提供されるほか、llama.cpp、MLX、Ollamaといったローカル環境用の各種推論エンジンとの互換性も確保されている。これにより、外部のクラウドインフラやAPIに依存することなく、機密性の高いデータを保護しながら、自律的なエージェント機能や高度なマルチモーダル処理を個人のデバイス上で構築および実行する環境が提供される。

Googleで見つけやすく

評価する

いいね!でぜひ著者を応援してください

  • 2

会員(無料)になると、いいね!でマイページに保存できます。

共有する

  • 0

  • 0

  • 0

  • 0

  • 0

関連タグ タグをフォローすると最新情報が表示されます

AI・生成AIの関連コンテンツ

あなたの投稿

    PR

    PR

    PR

処理に失敗しました

投稿したコメントを
削除しますか?

あなたの投稿コメント編集

通報

このコメントについて、
問題の詳細をお知らせください。

ビジネス+ITルール違反についてはこちらをご覧ください。

通報

報告が完了しました

コメントを投稿することにより自身の基本情報
本メディアサイトに公開されます

基本情報公開時のサンプル画像
報告が完了しました

」さんのブロックを解除しますか?

ブロックを解除するとお互いにフォローすることができるようになります。

ブロック

さんはあなたをフォローしたりあなたのコメントにいいねできなくなります。また、さんからの通知は表示されなくなります。

さんをブロックしますか?

ブロック

ブロックが完了しました

ブロック解除

ブロック解除が完了しました

機能制限のお知らせ

現在、コメントの違反報告があったため一部機能が利用できなくなっています。

そのため、この機能はご利用いただけません。
詳しくはこちらにお問い合わせください。

ユーザーをフォローすることにより自身の基本情報
お相手に公開されます

基本情報公開時のサンプル画像