• 2026/03/28 掲載

グーグル、AIメモリを1/6に圧縮する新技術発表、AIメモリ企業の株価下落

必要なメモリーを6分の1に削減、推論時の処理速度を8倍に高速化

会員(無料)になると、いいね!でマイページに保存できます。
米グーグルは2026年3月24日、大規模言語モデル(LLM)の推論実行に必要なメモリー消費量を従来の6分の1に削減する新たなデータ圧縮技術「TurboQuant」を発表した。推論速度を最大8倍に向上させつつ、モデルの精度低下をゼロに抑える。この発表を受け、世界のAIインフラ需要を牽引してきた半導体メモリー市場では関連銘柄の株価が軒並み下落し、業界に波紋を広げている。
photo
(画像:ビジネス+IT)

グーグル、LLM実行に必要なメモリーを6分の1に圧縮する新技術

 グーグルの研究部門であるGoogle Researchは2026年3月24日、大規模言語モデルとベクトル検索エンジン向けの新たなデータ圧縮技術群として「TurboQuant」「PolarQuant」「Quantized Johnson-Lindenstrauss(QJL)」を発表した。同技術に関連する研究成果は、2026年4月23日からブラジルのリオデジャネイロで開催される国際会議「ICLR 2026」で発表される。
 
画像
【図版付き記事はこちら】グーグル、LLMのメモリ使用を6分の1に圧縮する新技術「TurboQuant」発表(図版:ビジネス+IT)

 現在の大規模言語モデルは、一度に処理できる文章量が拡大するにつれて、推論時に過去の計算結果を一時保存する「Key-Value(KV)キャッシュ」のデータサイズが指数関数的に増大する問題を抱えている。数百万トークン規模の処理では、このKVキャッシュのメモリー消費量がモデル自体の重みデータを超えることもあり、GPUの限られたメモリー容量と通信帯域を圧迫する最大の要因となっていた。

 TurboQuantは、このKVキャッシュに特化した圧縮フレームワークである。データ構造を単純化して極座標変換による圧縮を行うPolarQuantと、生じた微小な誤差を1ビットのデータで数学的に補正するQJLという2段階のアルゴリズムを組み合わせている。この手法により、事前の追加学習やファインチューニングの工程を省きながら、通常16ビットで保存されるKVキャッシュを実質3ビットまで圧縮する。

 グーグルの検証結果によると、この圧縮によって大規模言語モデルの実行に必要なメモリー量を従来の6分の1に削減し、推論時の処理速度を最大8倍に高速化した。同時に、圧縮に伴うモデルの認識精度や推論能力の低下をゼロに維持している事実が確認されている。NVIDIA H100などの最新GPU環境だけでなく、限られたメモリー容量しか持たない端末での高度なAI実行を可能にする技術として実装が進められている。

グーグルAIメモリーショック、マイクロン、SKハイニクス、キオクシアなど株価軒並み下落

 TurboQuantの技術公開は、AIインフラのハードウェア需要を前提に成長を続けてきた半導体メモリー市場の構造に大きな変化をもたらした。論文発表の直後となる2026年3月25日の米国株式市場では、NASDAQ100指数全体が上昇する中でメモリーおよびストレージ関連銘柄が逆行安となった。具体的には、マイクロン・テクノロジーの株価が3.4%下落し、ウエスタンデジタルが4.7%、シーゲイト・テクノロジーが2.59%、サンディスクが3.5%の急落を記録した。この影響は日本のキオクシア、韓国のSKハイニクスなどにも波及している。
 
画像
グーグル「TurboQuant」ショックAIメモリ市場を揺るがす(図版:ビジネス+IT)

 これまで世界のAI開発競争は、計算能力の向上と大容量の広帯域メモリー(HBM)を大量に投入する物理的な資源拡張が主軸であった。しかし、今回のソフトウェアアルゴリズムによる極限圧縮が実証されたことで、AI推論における高価なハードウェアへの依存度が低下する事実が浮き彫りとなった。世界のHBM市場を牽引するSKハイニクスやサムスン電子、フラッシュメモリー大手のキオクシアといったメーカーは、大規模データセンター向けの需要予測の見直しに直面している。

 市場調査機関のトレンドフォースは、この技術革新をメモリー関連企業に対する明確な逆風として報じた。金融市場では、AI処理の大幅な効率化が短期的なハードウェアの販売量減少に直結するという事実と、推論コストの劇的な低下がAIアプリケーションの普及を加速させ長期的にはメモリー市場全体の裾野を拡大するという見方が対立している。

 現段階で各メモリーメーカーから生産計画の変更に関する公式な発表は出されていない。ソフトウェアのブレイクスルーがハードウェア市場の成長前提を揺るがした事象は金融市場に動揺をもたらし、AI開発の主戦場が計算資源の物量戦から極限の効率化競争へ移行したことを裏付けている。

評価する

いいね!でぜひ著者を応援してください

  • 0

会員(無料)になると、いいね!でマイページに保存できます。

共有する

  • 1

  • 0

  • 0

  • 0

  • 1

  • 0

関連タグ タグをフォローすると最新情報が表示されます
あなたの投稿

    PR

    PR

    PR

処理に失敗しました

人気のタグ

投稿したコメントを
削除しますか?

あなたの投稿コメント編集

通報

このコメントについて、
問題の詳細をお知らせください。

ビジネス+ITルール違反についてはこちらをご覧ください。

通報

報告が完了しました

コメントを投稿することにより自身の基本情報
本メディアサイトに公開されます

基本情報公開時のサンプル画像
報告が完了しました

」さんのブロックを解除しますか?

ブロックを解除するとお互いにフォローすることができるようになります。

ブロック

さんはあなたをフォローしたりあなたのコメントにいいねできなくなります。また、さんからの通知は表示されなくなります。

さんをブロックしますか?

ブロック

ブロックが完了しました

ブロック解除

ブロック解除が完了しました

機能制限のお知らせ

現在、コメントの違反報告があったため一部機能が利用できなくなっています。

そのため、この機能はご利用いただけません。
詳しくはこちらにお問い合わせください。

ユーザーをフォローすることにより自身の基本情報
お相手に公開されます

基本情報公開時のサンプル画像