• 2026/03/01 掲載

【猫と会話できる日が来るかも】グーグルが動物の鳴き声を学習したAIモデル「Perch 2.0」発表

鳥類の鳴き声で事前学習、クジラやイルカといった海洋哺乳類の音声分類でも高い精度

1
会員(無料)になると、いいね!でマイページに保存できます。
Google DeepMindが開発した生物音声AIモデル「Perch 2.0」が、主に鳥類の鳴き声で事前学習されたにもかかわらず、学習データにほぼ含まれないクジラやイルカといった海洋哺乳類の音声分類でも高い精度を示したことが明らかになった。研究チームは、鳥類の微細な鳴き声を識別する高難度な学習が、未知の水中音響の解析にも有効に働いたと分析している。モデルは現在オープンソースとして公開されている。
photo
(画像:ビジネス+IT)
 Google DeepMindが開発した次世代の生物音声基盤モデル「Perch 2.0」は、鳥類を中心に1万4597種の生物音声を事前学習している。未査読論文プラットフォームのarXivで公開された研究報告によると、同モデルは学習データに海洋哺乳類の音声がほぼ含まれていないにもかかわらず、クジラやイルカといった水中環境の音声分類タスクにおいて、専用の海洋モデルを上回る高いパフォーマンスを発揮した。

画像
【画像付き記事はこちら】動物の鳴き声を学習、Google DeepMind 生物音響モデル「Perch2.0」発表(図版:ビジネス+IT)

 Perch 2.0は、前身である鳥類識別に特化した初期モデルから対象を拡張し、両生類、哺乳類、昆虫類などを含む多分類群対応モデルとして2025年8月に発表された。約154万件の録音データを学習しており、その大半にあたる約136万件が鳥類の音声で構成されている。

 研究チームは、鳥類音声を中心に学習したAIが未知の水中音響に対しても高い汎化能力を示した理由として、主に2つの仮説を提示している。一つ目は、大規模なトレーニングデータと巨大なモデルサイズによる「ニューラルスケーリング則」の恩恵だ。データとモデルの規模が一定ラインを超えたことで、学習していない未知の領域に対しても適応力を獲得したとしている。

 二つ目は「Bittern Lesson」と呼ばれる、鳥類特有の高難度な分類タスクによる精緻な特徴抽出効果だ。鳥類は数千種が存在し、種間の鳴き声の差異が極めて小さい。北米に生息する14種のハトの鳴き声を区別するなど、微細な音のテクスチャを識別する訓練を積んだ結果、AIは高度な聴覚機能を獲得した。これが結果として、クジラなど他の音響クラスを分離するための特徴抽出にも有効に働いたと分析している。

 Perch 2.0は、自動録音装置などで収集された膨大な音声データから生態系の健全性を評価する生物多様性保全への応用が期待されている。現在、モデルやデータセットはKaggleやHugging Faceなどで公開され、外部の研究者や開発者が利用できる状態となっている。

評価する

いいね!でぜひ著者を応援してください

  • 1

会員(無料)になると、いいね!でマイページに保存できます。

共有する

  • 0

  • 0

  • 0

  • 0

  • 1

  • 0

関連タグ タグをフォローすると最新情報が表示されます
あなたの投稿

    PR

    PR

    PR

処理に失敗しました

人気のタグ

投稿したコメントを
削除しますか?

あなたの投稿コメント編集

通報

このコメントについて、
問題の詳細をお知らせください。

ビジネス+ITルール違反についてはこちらをご覧ください。

通報

報告が完了しました

コメントを投稿することにより自身の基本情報
本メディアサイトに公開されます

基本情報公開時のサンプル画像
報告が完了しました

」さんのブロックを解除しますか?

ブロックを解除するとお互いにフォローすることができるようになります。

ブロック

さんはあなたをフォローしたりあなたのコメントにいいねできなくなります。また、さんからの通知は表示されなくなります。

さんをブロックしますか?

ブロック

ブロックが完了しました

ブロック解除

ブロック解除が完了しました

機能制限のお知らせ

現在、コメントの違反報告があったため一部機能が利用できなくなっています。

そのため、この機能はご利用いただけません。
詳しくはこちらにお問い合わせください。

ユーザーをフォローすることにより自身の基本情報
お相手に公開されます

基本情報公開時のサンプル画像