ただの生成AIじゃない…150兆円市場を下支え、東京エレクトロン「特化型AI」の全貌
- ありがとうございます!
- いいね!した記事一覧をみる
東京エレクトロンの「生成AI戦略」
同社は、2025年12月、DXソリューションの新コンセプト「Epsira(イプシラ)」を発表。これは、生成AIを含むデジタル技術を活用して開発・生産・フィールド支援を横断的に高度化し、顧客の生産性向上を実現する計画である。最終的には、リアルとデジタルを同期するデジタルツイン基盤の構築を目指しているという。
生成AIについては、装置の立ち上げからトラブルシューティングなど全般の支援、データ解析など、さまざまなところで活用が期待されている。中でも半導体製造装置の保守・トラブル対応で生成AIを活用する必要性について、同社 革新技術開発センター PLMDX開発部 モデル基盤開発グループ シニアスペシャリスト 西口 賢弥氏は次のように述べる。
「保守・トラブル対応では、エンジニアがこれまでの履歴を記録したデータベースを見て、都度、必要な対策を見つけていました。しかし、弊社は多種多様な装置を提供していますので、膨大なデータから必要な対策を効率的に見つけるには幅広い知識と経験を要します。そこで生成AIを活用することは、エンジニアを支援する重要な取り組みとなります」(西口氏)
その背景にあるのが、急速に拡大する半導体市場と、それに伴って深刻化するエンジニア不足だ。
半導体市場“急拡大”で懸念される「エンジニア不足問題」
「社員数で言うと、10年前は1万人だったのですが、今では約2万人にまで増えています。現段階ではエンジニアは不足していませんが、いずれはfabの増加にエンジニアの数が追いつかなくなることが危惧されています。同時に、エンジニアの育成も追いつかなくなってきています。これは弊社だけではなく、業界全体の問題だと思います」(西口氏)
エンジニアは装置の立ち上げだけでなく、現場で発生するさまざまなトラブルへの対応も担う。それには装置に関する高度な専門知識が不可欠であり、一朝一夕で育成できるスキルセットではない。
その一方で、fabの増設ペースは緩む気配を見せない。もしエンジニアの供給が間に合わなければ、fab自体の立ち上げ遅延につながりかねず、ひいては半導体の増産計画全体に影響が及ぶ。
「半導体市場をもっと拡大させるためには、エンジニアの育成が非常に重要になってきます。人員と育成の課題に向き合うためにも、保守・トラブル対応における生成AIの活用はエンジニアをサポートするという意味でも不可欠だと考えています」(西口氏)
保守・トラブル対応で「生成AI活用」、直面した「データの課題」
「複数の条件を含むなど複雑な事象に対して、解決策を検索するのが難しいという課題もありました」(西口氏)
こうした課題を解決するには、既存のデータをAIに学習させれば良いはずだ。実際に西口氏も、それを行ったという。ところが、データをそのままAIに学習させても芳しい成果は得られなかったと、西口氏は次のように述べる。
「これまでのデータは、人間が利用することを前提としたデータであり、AIが使いやすい形にはなっていません。そこで、AIにも利用しやすい形にデータを整えた上でAIに学習させる必要があります。また、AIの品質を高めるにはリーズニング(注1)が不可欠ですが、必要なデータを人手で用意すると膨大な工数がかかります。それを何とかしたいというのも大きな課題でした」(西口氏)
さらに、日本語のデータならではの課題も存在する。AIの学習に用いる高品質な日本語データは、英語に比べて絶対量が不足している。一方で、人手でゼロから学習データを作成しようとすれば、膨大なコストがかかってしまう。このデータ品質の課題も、AI活用を進める上で大きな障壁となる。
ただし、こうした課題を解決するためにクラウドを活用することは難しい。なぜなら、扱われるデータはすべて極秘扱いであり、無計画にクラウドサービスを利用すると、社外に情報が流出する危険性が高まるからだ。また、安全に利用可能な形態のクラウドサービスも社内に用意されているが、膨大な量のデータを作成するには、相応のクラウド使用料がかかってしまう。
したがって、AIに関わるすべての処理をクローズドな環境で完結するのが望ましい。こうしたクローズド環境は、ユーザー数が多くAIサービスへの課金が莫大になりやすい大手企業も同様に求められるという。
そこで同社が選択したのが、NVIDIAのソリューションだった。
「特化型AI」構築、その仕組みとは?
-
今回活用されたNemotronの5つのテクノロジー
- Nemotron-Personas-Japan:日本人のペルソナ(人物設定)を大量に生成したデータセット。NVIDIAが日本におけるソブリンAI(注2)の開発を支援するために開発・提供している
- Nemotron-Nano-9B-v2-Japanese:日本語特化のLLMモデル本体(約90億パラメータ)
- NVIDIA NeMo Data Designer:LLM用の高品質な学習データを自動生成するツール
- NVIDIA NeMo Curator:重複排除やノイズ除去によって学習データを整理・クリーニングも可能なツール
- NVIDIA NeMo RL:LLMを強化学習もしくはファインチューニングなども可能なツール
これらNemotronファミリーを活用したプロセスはこうだ。まず、同社がもともと持っているデータを基に「NVIDIA NeMo Data Designer」で合成データを作り、データ量を増やす。その際にデータの多様性を確保するために使われるのが「Nemotron-Personas-Japan」である。
次に「NeMo Curator」で重複排除やノイズ除去を行ってデータをクリーニング。ここまでで、LLMの学習に必要なデータ、特にリーズニングに必要なデータを大量に用意できる。そして、そのデータを使って「NeMo RL」でLLMをファインチューニングする。そのLLM本体が「Nemotron-Nano-9B-v2」である。
その後は評価だ。ここは、西口氏が推論用のサーバを立ち上げ、独自の評価データセットを用いてAIの回答を評価する仕組みを構築したという。
なお、NVIDIAテクノロジーを導入する前、同社にはそもそもデータを合成して増やしたり、重複排除やノイズ除去でデータをクリーニングしたりするスキルに乏しかったという。NVIDIA Nemotornを採用した最大の理由が、こうした知見を得られることだったのは間違いない。加えて、「コンテナ」での利用がサポートされていたことも重要だったと、西口氏は次のように述べる。
「GPUは、種類や型番が少し異なるだけで、今まで動いていたソフトウェアが動かなくなることが珍しくありません。また、LLMの技術は進化が激しく、日々、新しいライブラリが出てアップデートされるため、環境構築が非常に難しいのが現実です。しかし、NVIDIAさんのテクノロジにはコンテナの基となるイメージが提供されているものが多く、環境が異なってもほぼ動作します。そこも採用における重要なポイントでした」(西口氏)
回答精度「10%向上」と「副産物の効果」
「既存のデータをそのまま学習させた場合と、Nemotronで合成・クリーニングしたデータを学習させた場合を比較したところ、独自に作成した社内評価データセットにおいて、回答精度は約10%向上しました。半導体製造装置の保守・トラブル対応における非常に高度なナレッジが要求されるデータセットですので、10%の精度向上は、非常に価値があると思います」(西口氏)
さらに西口氏は、「自社環境で実現できた意義が大きい」と、次のように続ける。
「今回はあくまで検証でしたが、それでも我々自身で生成AIのモデルをトレーニングできることを社内に示せたことは大きいと思います。自分たちのデータでトレーニングしたモデルを活用できることで、今後のAI戦略における選択肢が広がったと考えています」(西口氏)
半導体市場は、2026年に1兆ドル(約150兆円)に達すると試算されている。市場の成長にともなって半導体工場が建設され、同社のエンジニアが派遣される。その流れを止めないためにも、AIを活用したエンジニアの支援は不可欠だ。今回の取り組みは、その可能性を大きく広げたといえるだろう。
今回の取り組みに関連して、2026年2月にNVIDIAがリリースした日本語ファインチューニング済みモデル「Nemotron-Nano-9B-v2-Japanese」も試用している。現状試験段階のため、正確な評価を出しにくい状況にはあるというが、一方で、こうした日本語に特化したモデルへの期待は高い。
「日本語のデータでチューニングするときは、ベースになったモデルの日本語能力が高いほうがスコアの伸びがいいということはあり得ます」という見立ての下、今後のデータ生成フェーズでNemotron-Nano-9B-v2-Japaneseを活用することを現在検討中だという。日本語に強いベースモデルを起点にすることで、東京エレクトロンのドメイン知識を学習させた際の品質向上効果がより大きくなることが期待される。
なお、今回の取り組みで活用されたNVIDIAのソリューションは、インターネット接続のないクローズドな環境で利用できるのも大きな特徴だ。非常に機密性の高い環境での利用はもちろん、PoCから本格運用に移行する際にコストを抑えるために導入されることも多いという。同様の課題を抱えている企業にとっては、ぜひ注目したい最新テクノロジーといえるだろう。
その際の動画はこちら
https://www.nvidia.com/ja-jp/on-demand/session/gtc26-s81827/