- 2025/11/30 掲載
Microsoft ローカル動作の超小型オンデバイスAIエージェント「Fara-7B」を発表
デバイス上で動作し、PC上の操作を自動化、高速かつプライバシー保護にも対応
ビジネス+IT
Fara-7Bには70 億パラメータがあり、その軽さから一般的なPCでも動作可能。これにより、クラウドを経由せずにデバイス上で推論が完結するため、応答の高速化(低レイテンシ化)やプライバシー保護という利点がある。
特徴的な点として、Fara-7Bは画面のスクリーンショットを「見る」ことで、クリックやタイピング、スクロールなどの操作を、座標ベースで予測・実行する。このため、ウェブページの構造(DOM やアクセシビリティツリー)に依存せず、コードが難読化されたサイトや複雑な UI にも対応可能だ。
トレーニングには、同社が新たに開発した合成データ生成パイプライン「FaraGen」を用いており、実世界のウェブサイトおよび人間ユーザーによるタスクをもとに、多段階のマルチステップ操作データ(trajectory)を生成した。最終的に約 145,000 件の成功例を学習に使ったという。
パフォーマンス面では、Fara-7Bは複数のウェブ操作ベンチマークで優秀な結果を示している。たとえば、ウェブナビゲーション用ベンチマーク「WebVoyager」では成功率 73.5% を記録し、同じ条件で評価された大規模モデルであるGPT-4o(65.1%)を上回った。
また、多くの従来型7Bモデルに比べ、実行ステップ数が少なく高速である点も強みとされる。
MicrosoftはFara-7Bをオープンウェイトで公開し、ライセンスはMIT。開発者や研究者は、同社のプラットフォーム(Microsoft Foundry)や、パブリックなモデル配布サービス(Hugging Face)などから入手可能だという。加えて、Windows 11搭載の Copilot+ PC 向けに量子化・シリコン最適化されたバージョンも提供され、手軽に試せる環境が整えられている。
一方で、Fara-7Bはあくまで実験的リリースであり、「精度」「指示遵守」「幻覚(hallucination)」など、従来の大規模言語モデルが抱えていた課題をいくつか共有していると、Microsoft側も説明している。複雑なタスクでは誤動作が起こる可能性があるため、同社はサンドボックス環境での実験・モニタリングを推奨している。
今回の発表は、従来のクラウド依存・テキスト応答型AIではなく、ユーザーのデバイス上で「実際のPC操作」を自動化するという、AIの使われ方における大きな転換を示すものだ。特に、機密データを扱う企業や、低遅延でのUI操作が求められる業務にとっては、今後の注目技術になる可能性が高い。
最新ニュースのおすすめコンテンツ
PR
PR
PR