ただの生成AIじゃない…150兆円市場を下支え、東京エレクトロン「特化型AI」の全貌

ありがとうございます！
いいね！した記事一覧をみる

会員（無料）になると、いいね！でマイページに保存できます。

半導体市場は2026年に1兆ドル（約150兆円）規模へ達すると試算されている。市場が急拡大する中で、半導体製造装置メーカーである東京エレクトロンは今、エンジニアの不足と育成の問題に直面している。そこで、生成AIを活用してエンジニアをサポートする取り組みに注力。その1つの施策が、保守・トラブル対応におけるナレッジ活用の高度化だ。だがただの生成AIではない。独自の生成AIを構築し、回答精度の向上などにつなげている。一体どのような仕組みなのか、同社革新技術開発センター PLMDX開発部モデル基盤開発グループシニアスペシャリストの西口賢弥氏に話を聞いた。

東京エレクトロン
革新技術開発センター PLMDX開発部モデル基盤開発グループシニアスペシャリスト
西口賢弥氏

東京エレクトロンの「生成AI戦略」

　東京エレクトロンは、世界最大級の半導体製造装置メーカーである。半導体の製造に不可欠な装置を開発・製造し、特にウエハーの塗布・現像装置では世界シェア90％以上という圧倒的なシェアを誇る。

　同社は、2025年12月、DXソリューションの新コンセプト「Epsira（イプシラ）」を発表。これは、生成AIを含むデジタル技術を活用して開発・生産・フィールド支援を横断的に高度化し、顧客の生産性向上を実現する計画である。最終的には、リアルとデジタルを同期するデジタルツイン基盤の構築を目指しているという。

　生成AIについては、装置の立ち上げからトラブルシューティングなど全般の支援、データ解析など、さまざまなところで活用が期待されている。中でも半導体製造装置の保守・トラブル対応で生成AIを活用する必要性について、同社革新技術開発センター PLMDX開発部モデル基盤開発グループシニアスペシャリスト西口賢弥氏は次のように述べる。

「保守・トラブル対応では、エンジニアがこれまでの履歴を記録したデータベースを見て、都度、必要な対策を見つけていました。しかし、弊社は多種多様な装置を提供していますので、膨大なデータから必要な対策を効率的に見つけるには幅広い知識と経験を要します。そこで生成AIを活用することは、エンジニアを支援する重要な取り組みとなります」（西口氏）

　その背景にあるのが、急速に拡大する半導体市場と、それに伴って深刻化するエンジニア不足だ。

半導体市場“急拡大”で懸念される「エンジニア不足問題」

　半導体製品への需要は世界的に急拡大しており、その製造を担うfab（半導体製造工場）が各地で相次いで建設されている。fabが立ち上がるたびに同社の装置が納入されて、トラブル対応などを担うエンジニアを現地に派遣している。市場が拡大し新たなfabが次々と建設される中、こうしたエンジニアの需要も急増の一途をたどっているのだ。

「社員数で言うと、10年前は1万人だったのですが、今では約2万人にまで増えています。現段階ではエンジニアは不足していませんが、いずれはfabの増加にエンジニアの数が追いつかなくなることが危惧されています。同時に、エンジニアの育成も追いつかなくなってきています。これは弊社だけではなく、業界全体の問題だと思います」（西口氏）

　エンジニアは装置の立ち上げだけでなく、現場で発生するさまざまなトラブルへの対応も担う。それには装置に関する高度な専門知識が不可欠であり、一朝一夕で育成できるスキルセットではない。

　その一方で、fabの増設ペースは緩む気配を見せない。もしエンジニアの供給が間に合わなければ、fab自体の立ち上げ遅延につながりかねず、ひいては半導体の増産計画全体に影響が及ぶ。

「半導体市場をもっと拡大させるためには、エンジニアの育成が非常に重要になってきます。人員と育成の課題に向き合うためにも、保守・トラブル対応における生成AIの活用はエンジニアをサポートするという意味でも不可欠だと考えています」（西口氏）

保守・トラブル対応で「生成AI活用」、直面した「データの課題」

　同社では、これまで半導体製造装置の保守・トラブルに対応するためFAQやナレッジベースを拡充してきた。しかし、いくつかの点で課題があったと、西口氏は次のように説明する。

「複数の条件を含むなど複雑な事象に対して、解決策を検索するのが難しいという課題もありました」（西口氏）

　こうした課題を解決するには、既存のデータをAIに学習させれば良いはずだ。実際に西口氏も、それを行ったという。ところが、データをそのままAIに学習させても芳しい成果は得られなかったと、西口氏は次のように述べる。

「これまでのデータは、人間が利用することを前提としたデータであり、AIが使いやすい形にはなっていません。そこで、AIにも利用しやすい形にデータを整えた上でAIに学習させる必要があります。また、AIの品質を高めるにはリーズニング（注1）が不可欠ですが、必要なデータを人手で用意すると膨大な工数がかかります。それを何とかしたいというのも大きな課題でした」（西口氏）

注1）入力された情報の関係性や因果関係を踏まえて推論を行い、結論を導く能力。近年のLLMでは、推論能力を高めるために専用データや強化学習が用いられる。

　さらに、日本語のデータならではの課題も存在する。AIの学習に用いる高品質な日本語データは、英語に比べて絶対量が不足している。一方で、人手でゼロから学習データを作成しようとすれば、膨大なコストがかかってしまう。このデータ品質の課題も、AI活用を進める上で大きな障壁となる。

　ただし、こうした課題を解決するためにクラウドを活用することは難しい。なぜなら、扱われるデータはすべて極秘扱いであり、無計画にクラウドサービスを利用すると、社外に情報が流出する危険性が高まるからだ。また、安全に利用可能な形態のクラウドサービスも社内に用意されているが、膨大な量のデータを作成するには、相応のクラウド使用料がかかってしまう。

　したがって、AIに関わるすべての処理をクローズドな環境で完結するのが望ましい。こうしたクローズド環境は、ユーザー数が多くAIサービスへの課金が莫大になりやすい大手企業も同様に求められるという。

　そこで同社が選択したのが、NVIDIAのソリューションだった。

「特化型AI」構築、その仕組みとは？

　今回、同社が目指したのは、半導体工場における半導体製造装置の保守・トラブル対応を支援する"特化型AI"の開発だ。半導体のfabは非常に特殊な環境で、セキュリティのためインターネットへの接続は高度に管理されている。そこで、インターネット接続のないクローズドな環境で実現するために採用されたのが、NVIDIAのオープン AI テクノロジであるNVIDIA Nemotronだ。NVIDIA Nemotronとは、あらゆる場所で動作する最も高効率かつ高精度な特化型エージェントAI の構築を実現する、オープンなモデル、データセット、テクノロジのファミリーである。

今回活用されたNemotronの5つのテクノロジー

Nemotron-Personas-Japan：日本人のペルソナ（人物設定）を大量に生成したデータセット。NVIDIAが日本におけるソブリンAI（注2）の開発を支援するために開発・提供している
Nemotron-Nano-9B-v2-Japanese：日本語特化のLLMモデル本体（約90億パラメータ）
NVIDIA NeMo Data Designer：LLM用の高品質な学習データを自動生成するツール
NVIDIA NeMo Curator：重複排除やノイズ除去によって学習データを整理・クリーニングも可能なツール
NVIDIA NeMo RL：LLMを強化学習もしくはファインチューニングなども可能なツール

注2）自国や自組織のデータ、インフラ、人材を活用して、独自の AI を構築、管理、活用することを前提とした考え方。組織や企業のナレッジ、データ、文化を反映したAIの実装、機密性の高いデータ活用を想定した場合に重視される。

　これらNemotronファミリーを活用したプロセスはこうだ。まず、同社がもともと持っているデータを基に「NVIDIA NeMo Data Designer」で合成データを作り、データ量を増やす。その際にデータの多様性を確保するために使われるのが「Nemotron-Personas-Japan」である。

　次に「NeMo Curator」で重複排除やノイズ除去を行ってデータをクリーニング。ここまでで、LLMの学習に必要なデータ、特にリーズニングに必要なデータを大量に用意できる。そして、そのデータを使って「NeMo RL」でLLMをファインチューニングする。そのLLM本体が「Nemotron-Nano-9B-v2」である。

　その後は評価だ。ここは、西口氏が推論用のサーバを立ち上げ、独自の評価データセットを用いてAIの回答を評価する仕組みを構築したという。

　なお、NVIDIAテクノロジーを導入する前、同社にはそもそもデータを合成して増やしたり、重複排除やノイズ除去でデータをクリーニングしたりするスキルに乏しかったという。NVIDIA Nemotronを採用した最大の理由が、こうした知見を得られることだったのは間違いない。加えて、「コンテナ」での利用がサポートされていたことも重要だったと、西口氏は次のように述べる。

「GPUは、種類や型番が少し異なるだけで、今まで動いていたソフトウェアが動かなくなることが珍しくありません。また、LLMの技術は進化が激しく、日々、新しいライブラリが出てアップデートされるため、環境構築が非常に難しいのが現実です。しかし、NVIDIAさんのテクノロジにはコンテナの基となるイメージが提供されているものが多く、環境が異なってもほぼ動作します。そこも採用における重要なポイントでした」（西口氏）

回答精度「10％向上」と「副産物の効果」

　今回、NVIDIAのソリューションを活用した成果について、西口氏は次のように述べる。

「既存のデータをそのまま学習させた場合と、Nemotronで合成・クリーニングしたデータを学習させた場合を比較したところ、独自に作成した社内評価データセットにおいて、回答精度は約10％向上しました。半導体製造装置の保守・トラブル対応における非常に高度なナレッジが要求されるデータセットですので、10％の精度向上は、非常に価値があると思います」（西口氏）

　さらに西口氏は、「自社環境で実現できた意義が大きい」と、次のように続ける。

「今回はあくまで検証でしたが、それでも我々自身で生成AIのモデルをトレーニングできることを社内に示せたことは大きいと思います。自分たちのデータでトレーニングしたモデルを活用できることで、今後のAI戦略における選択肢が広がったと考えています」（西口氏）

　半導体市場は、2026年に1兆ドル（約150兆円）に達すると試算されている。市場の成長にともなって半導体工場が建設され、同社のエンジニアが派遣される。その流れを止めないためにも、AIを活用したエンジニアの支援は不可欠だ。今回の取り組みは、その可能性を大きく広げたといえるだろう。

　今回の取り組みに関連して、2026年2月にNVIDIAがリリースした日本語ファインチューニング済みモデル「Nemotron-Nano-9B-v2-Japanese」も試用している。現状試験段階のため、正確な評価を出しにくい状況にはあるというが、一方で、こうした日本語に特化したモデルへの期待は高い。

「日本語のデータでチューニングするときは、ベースになったモデルの日本語能力が高いほうがスコアの伸びがいいということはあり得ます」という見立ての下、今後のデータ生成フェーズでNemotron-Nano-9B-v2-Japaneseを活用することを現在検討中だという。日本語に強いベースモデルを起点にすることで、東京エレクトロンのドメイン知識を学習させた際の品質向上効果がより大きくなることが期待される。

　なお、今回の取り組みで活用されたNVIDIAのソリューションは、インターネット接続のないクローズドな環境で利用できるのも大きな特徴だ。非常に機密性の高い環境での利用はもちろん、PoCから本格運用に移行する際にコストを抑えるために導入されることも多いという。同様の課題を抱えている企業にとっては、ぜひ注目したい最新テクノロジーといえるだろう。

【回答目安1分】本記事をご覧いただきアンケートにご協力ください。

※回答者の中から抽選で20名様にAmazonギフト券500円をプレゼント。
※お一人につき1回のみ回答が可能です。複数回の回答されますと以降のサービスご利用をお断りすることがございますので、ご注意ください。

西口氏がエヌビディアのフラッグシップイベント「GTC」に登壇しました
その際の動画はこちら
https://www.nvidia.com/ja-jp/on-demand/session/gtc26-s81827/

関連タグタグをフォローすると最新情報が表示されます