細谷元 | 著者ページ

ビットコインが大暴騰、「儲けまくった」国は今後どうなるのか

2024/11/30

10

ビットコイン価格が大暴騰している。これに伴って、国家レベルでのビットコインを保有している国々が新たな局面を迎えている。たとえば、豊富な水力発電を活用したマイニング戦略により、ブータン王国のビットコイン保有額が11億ドルを突破し、同国のGDPの35％以上に相当する規模となった。一方、世界で初めてビットコインを法定通貨として採用したエルサルバドルは、5億ドル超の保有額を達成。さらに米国では、トランプ次期大統領がビットコインを「恒久的な国家資産」として位置づける方針を打ち出すなど、国家によるビットコイン保有をめぐる動きは活発化の様相だ。

OpenAI o1（ChatGPT o1）とは何かをやさしく解説、従来と何が違う？特徴や使い方とは

2024/11/25

21

OpenAIの最新AIモデル「o1（オーワン）」は「推論トークン」という新しい仕組みを活用した、従来のGPTとは一線を画す言語モデルだ。特にコーディングや数学で高い精度を実現し、あるベンチマークテストでは博士課程の学生を上回る成績を記録したとされる。この最新モデルo1とは、どのような特徴を持つモデルなのか、どんな場面で利用すると有効なのか、その実力や使い方をわかりやすく解説する。

Mistral AIの「Pixtral 12B」「Pixtral Large」とは何か？手書きからWeb制作も可能に

2024/11/20

17

テキストだけでなく、画像認識能力も持つ、いわゆるマルチモーダルモデルとして、OpenAIのGPT-4o、アンソロピックのClaude3.5 Sonnet、またオープンソースではマイクロソフトのPhi-3.5などが人気を博している。これに対し、Mistralが2024年9月と11月にリリースしたマルチモーダルモデル「Pixtral 12B」「Pixtral Large」がその人気リストの上位に食い込むかもしれない。強みは、画像認識能力に加え、テキスト処理能力も高い点にある。Pixtralとはどのようなモデルなのか、その詳細を解説したい。

爆速生成AI「Llama 3.1 405B」をクラウド利用する、初心者向けステップガイド

2024/11/17

15

メタがリリースした4050億パラメータの超大規模言語モデル「Llama 3.1 405B」は、オープンソースであり、個人のパソコンにインストールして利用することができる。しかし実際の運用には、高スペックハードウェアが必須となるため、誰もが簡単に利用できるわけではない。これに対して、SambaNovaがリリースした新クラウドサービスでは、このLlama 3.1 405BをAPI経由で利用することができる。最大の利点は、秒間100トークン以上のスピードだ。この爆速モデルを利用するためのステップを詳細に解説したい。

メタが注目するLLM開発の次のステージ、自己改善ループを可能にする仕組みとは

2024/11/13

17

大規模言語モデルの開発において、アウトプットの質をチェックする「エバリュエーション（評価）」プロセスは非常に重要だ。ChatGPTが人間らしい回答を生成できるのも、このプロセスがあってこそといわれている。しかし、このプロセスには大量の人的資源・時間・資金が必要となるだけでなく、バイアス問題などの課題が多数存在しており、現在その課題解決に向けた動きが活発化している。そんな中、メタが2024年8月に発表した「Self-Taught Evaluator」は、LLMに自己改善ループの能力を与えるアプローチとして注目を集める存在に。どのようなアプローチなのか、評価プロセスの現状に触れつつ、その詳細を解説したい。

メタのARグラス「Orion」がヤバすぎる。生成AI×メタバースで何が変わるのか？

2024/11/11

22

この1年、メタは同社の大規模言語モデルLlama（ラマ）の開発に注力しており、メタバース関連の大きな動きは聞かれなかった。VRヘッドセット市場の低迷も相まって、メタバース構想は頓挫したかのように思われたが、AIとAR技術を融合した次世代スマートグラス「Orion」の登場により、同社のメタバース構想に対する見方は大きく変わりつつある。Orionとはどのようなプロダクトなのか、またメタバース構想でどのような位置づけとなるのか、その詳細を探ってみたい。

生成AIのプロンプトを最適化できる「たった1つ」のこと、理解すべきは強みと弱み

2024/11/07

33

ChatGPTなどで活用される大規模言語モデル（LLM）は依然ブラックボックスであり、その挙動や傾向の全容は明らかになっていない。アマゾンとカリフォルニア大学による最新研究により、ようやく、LLMの強みと弱みが判明した。今回の発見により、プロンプト最適化の方向性も示唆された。その「極意」を紹介したい。

Phi-3.5とは何かを解説、マイクロソフトの「GPT-4o miniとほぼ互角」AIの真価

2024/10/31

24

マイクロソフトが発表したAIモデルである「Phi-3.5」シリーズが話題を呼んでいる。3つのモデルから構成される同シリーズだが、わずか66億の有効パラメータでGPT-4o miniに匹敵する性能を示し、多くのベンチマークでトップクラスの結果を達成するモデルもある。これらはオープンソースで無料提供されており、オープンソースプラットフォームOllamaを通じて個人のPCでも簡単に利用可能だ。Phi-3.5の特徴を解説とともに、Ollama経由でインストール・利用する方法も紹介する。

自動運転の「覇者」はテスラかNVIDIAか？まったく異なる両者の戦略のポイント

2024/10/29

31

自動運転テクノロジーの開発で市場をリードするテスラだが、最近になって、この分野でもNVIDIAが頭角を現しており、2社の自動運転開発競争に注目が集まっている。テスラはハードウェアからソフトウェアまで、すべて自社で開発する垂直統合かつビジョンベースのアプローチを採用。一方、NVIDIAはAIプラットフォームとハードウェアを自動車メーカーに提供しつつ、データを収集するなど、対照的なアプローチを取っており、どちらのアプローチがより良い自動運転技術を生み出すのかが業界の大きな関心事になっている。2社のアプローチの特徴と最新動向を探ってみたい。

Hugging Faceとは何か？ 5行のPythonで始める基本的な使い方からAIモデル一覧まで

2024/10/16

39

Hugging Faceとは、「AI分野のGitHub」とも呼ばれ、現在90万近いAIモデルがアップロードされているAI開発プラットフォームだ。Hugging Faceが提供するPythonライブラリにより、これまで複雑だったプロセスが大幅に簡素化し、数行のPythonコードで、AIモデルを自身のPCにダウンロードして実践で使えるようになる。ここではHugging Face初心者向けに、5行のPythonコードでHugging FaceのAIモデルを使う方法を紹介したい。

エッジAI半導体に注目集まるワケ、日本発のEdgeCortixなどスタートアップも存在感

2024/10/07

23

数年前まで、データの大半はクラウド上で発生していたが、モバイル・エッジデバイスの普及に伴い、エッジ環境でのデータが急速に増えている。そんな中、関心が高まっているのがデータをその場で処理できるエッジAI向けの半導体だ。最新のエッジAI向けの半導体は、生成AIモデルの運用にも対応しており、LlamaモデルやStable Diffusionなどを動かすこともできるという。同市場ではNVIDIA、インテル、AMD、クアルコムといった大手プレイヤーに加えて、日本発のEdgeCortixやHailoなどのスタートアップも存在感を出しつつある。

グーグル「Gemma」は何がすごい？試してわかる小型言語モデルで「GPT-3.5超え」の実力

2024/10/04

13

オープンソース言語モデルや小型言語モデル（SLM）の精度は従来、それほど高いものではなく、実際に活用することは難しかった。しかし、現在はローカル環境でも十分に利用できる小型モデルが続々登場しており、その様相は大きく変わってきている。グーグルが7月末にリリースした「Gemma 2」は、その好例といえるだろう。20億パラメータという非常に小さなモデルでありながら、GPT-3.5を超えるパフォーマンスを示したのだ。さらに、グーグルは「日本語版 Gemma 2 2B」を発表、髙い日本語性能を発揮したという。パラメータ数に関わらず、Gemma 2が高いパフォーマンスを発揮できる理由はどこにあるのか、その理由を探りつつ、実際にローカル環境で動作させる方法と必要なマシンスペックについてもわかりやすく解説する。