• 会員限定
  • 2024/04/01 掲載

いよいよ登場「秒読み」のアップル生成AI、他社と差別化のカギ「戦略2本柱」とは

  • icon-mail
  • icon-print
  • icon-hatena
  • icon-line
  • icon-close-snsbtns
記事をお気に入りリストに登録することができます。
ChatGPTが公開されて以降、世界を席巻している生成AI。世界のテック企業が生成AI関連のサービス開発に力を入れる中、アップルも生成AIへの取り組みに注力している。iPhoneをはじめとする強力なプロダクトを抱えている強みを持つ同社は、その強みを生かした「2本柱」の戦略で生成AI分野における成功を狙う。一体その戦略とはどのようなものか。最新動向と併せて解説する。

執筆:細谷 元、構成:ビジネス+IT編集部

執筆:細谷 元、構成:ビジネス+IT編集部

バークリー音大提携校で2年間ジャズ/音楽理論を学ぶ。その後、通訳・翻訳者を経て24歳で大学入学。学部では国際関係、修士では英大学院で経済・政治・哲学を専攻。国内コンサルティング会社、シンガポールの日系通信社を経てLivit参画。興味分野は、メディアテクノロジーの進化と社会変化。2014〜15年頃テックメディアの立ち上げにあたり、ドローンの可能性を模索。ドローンレース・ドバイ世界大会に選手として出場。現在、音楽制作ソフト、3Dソフト、ゲームエンジンを活用した「リアルタイム・プロダクション」の実験的取り組みでVRコンテンツを制作、英語圏の視聴者向けに配信。YouTubeではVR動画単体で再生150万回以上を達成。最近購入したSony a7s3を活用した映像制作も実施中。
http://livit.media/

photo
アップルが進める生成AIの取り組みについて解説する
(Photo:Koshiro K / Shutterstock.com)

アップルのAI戦略の「カギ」とは



生成AIで1分にまとめた動画
 アップルの生成AI戦略のカギとなるのが、メモリ制約のあるデバイスでも大規模言語モデル(LLM)を高速に動作させることができる独自技術の開発だ。

 同社は2023年12月に「LLM in a flash」と題した論文を公開。この論文は、iPhoneやMacBookなどメモリが限られたデバイス上でLLMを動作させるためのアプローチを示した内容だ。具体的には、モデルの一部をDRAMに、残りをフラッシュメモリに格納することで最適化を図る手法について言及されている。フラッシュメモリとDRAM間でモデルの重みを動的にスワップすることで、メモリ消費を大幅に削減しつつ、推論レイテンシー(遅延)を最小限に抑えることができる。特にアップルシリコンで動作させた場合に高いパフォーマンスを発揮するという。

 ちなみにアップルは、この論文に先立ち「パフォーマンスをほとんど犠牲にすること無く、推論の計算量を最大3倍削減できる」というLLMのアーキテクチャーに関する論文も2023年10月に公開している。

 消費者向けデバイス上で、小規模LLMを活用するアプリ開発の動きが活発化する中で、このようなLLMの最適化技術は、ますます重要性を増している。数十ミリ秒のレイテンシーの違いがユーザー体験に大きな影響を与えるとの実験結果もある。アップルはデバイスの能力を最大限引き出し、生成AIの高速性と品質のバランスを取ることに注力していることが伺える。

オープンソース戦略の「ある狙い」

 アップルは2023年後半から、独自開発したいくつかの生成AIモデルをオープンソース化してきた。

 たとえば、昨年10月にひっそりとリリースされたのが「Ferret」だ。70億と130億の2つのバージョンが用意されたマルチモーダルのLLMで、オープンソースのLLMであるVicunaとビジョン・ランゲージモデル(VLM)のLLaVAをベースに構築されている。

 通常のマルチモーダルモデルは入力画像を全体として解析するのに対し、Ferretは画像の特定の領域に基づいて応答を生成する特別なメカニズムを備えているのが特徴で、細部やオブジェクトを扱うことに長けているという。将来的には、iPhone上でカメラを通して見たオブジェクトとのインタラクションを可能にするモデルのベースになる可能性を秘めている。

画像
アップルはすでに、独自開発したいくつかの生成AIモデルをオープンソース化している
(Photo:dmitro2009 / Shutterstock.com)

 さらに、今年2月に同社からリリースされたのが、自然言語の指示に基づいて画像を編集することができるモデル「MLLM-Guided Image Editing(MGIE)」だ。MGIEの機能は、明るさやコントラストなどの画像全体の編集から、「空をより青くする」といった特定領域の編集、オブジェクトに対する操作など幅広い。次世代のiOSデバイスに搭載される可能性があるとして、その開発動向に注目が集まっている。

 アップルと言えば、これまでオープンソースにはあまり積極的でなかったが、機械学習開発者向けのライブラリ「MLX」を2023年12月に公開するなど、メタと同じオープンソース戦略に打って出る構えも見せている。MLXでは、NumPyやPyTorchに似たインターフェースを採用、機械学習エンジニアにとって使いやすいものとなっており、M2、M3などのアップルプロセッサに最適化されているのが特徴だ。

 冒頭で紹介したFerretのライセンスは研究目的での利用に限定されているなど、完全なオープンソースとは言い難い部分はあるものの、モデルを一般公開することで、将来的なアップル製品への関心を高め、開発者コミュニティーを巻き込む狙いがあると見られている。 【次ページ】ティム・クックCEOが語った「現状」

関連タグ

関連コンテンツ

あなたの投稿

    PR

    PR

    PR

処理に失敗しました

人気のタグ

投稿したコメントを
削除しますか?

あなたの投稿コメント編集

機能制限のお知らせ

現在、コメントの違反報告があったため一部機能が利用できなくなっています。

そのため、この機能はご利用いただけません。
詳しくはこちらにお問い合わせください。

通報

このコメントについて、
問題の詳細をお知らせください。

ビジネス+ITルール違反についてはこちらをご覧ください。

通報

報告が完了しました

コメントを投稿することにより自身の基本情報
本メディアサイトに公開されます

必要な会員情報が不足しています。

必要な会員情報をすべてご登録いただくまでは、以下のサービスがご利用いただけません。

  • 記事閲覧数の制限なし

  • [お気に入り]ボタンでの記事取り置き

  • タグフォロー

  • おすすめコンテンツの表示

詳細情報を入力して
会員限定機能を使いこなしましょう!

詳細はこちら 詳細情報の入力へ進む
報告が完了しました

」さんのブロックを解除しますか?

ブロックを解除するとお互いにフォローすることができるようになります。

ブロック

さんはあなたをフォローしたりあなたのコメントにいいねできなくなります。また、さんからの通知は表示されなくなります。

さんをブロックしますか?

ブロック

ブロックが完了しました

ブロック解除

ブロック解除が完了しました

機能制限のお知らせ

現在、コメントの違反報告があったため一部機能が利用できなくなっています。

そのため、この機能はご利用いただけません。
詳しくはこちらにお問い合わせください。

ユーザーをフォローすることにより自身の基本情報
お相手に公開されます