- 2026/03/01 掲載
【猫と会話できる日が来るかも】グーグルが動物の鳴き声を学習したAIモデル「Perch 2.0」発表
鳥類の鳴き声で事前学習、クジラやイルカといった海洋哺乳類の音声分類でも高い精度
Perch 2.0は、前身である鳥類識別に特化した初期モデルから対象を拡張し、両生類、哺乳類、昆虫類などを含む多分類群対応モデルとして2025年8月に発表された。約154万件の録音データを学習しており、その大半にあたる約136万件が鳥類の音声で構成されている。
研究チームは、鳥類音声を中心に学習したAIが未知の水中音響に対しても高い汎化能力を示した理由として、主に2つの仮説を提示している。一つ目は、大規模なトレーニングデータと巨大なモデルサイズによる「ニューラルスケーリング則」の恩恵だ。データとモデルの規模が一定ラインを超えたことで、学習していない未知の領域に対しても適応力を獲得したとしている。
二つ目は「Bittern Lesson」と呼ばれる、鳥類特有の高難度な分類タスクによる精緻な特徴抽出効果だ。鳥類は数千種が存在し、種間の鳴き声の差異が極めて小さい。北米に生息する14種のハトの鳴き声を区別するなど、微細な音のテクスチャを識別する訓練を積んだ結果、AIは高度な聴覚機能を獲得した。これが結果として、クジラなど他の音響クラスを分離するための特徴抽出にも有効に働いたと分析している。
Perch 2.0は、自動録音装置などで収集された膨大な音声データから生態系の健全性を評価する生物多様性保全への応用が期待されている。現在、モデルやデータセットはKaggleやHugging Faceなどで公開され、外部の研究者や開発者が利用できる状態となっている。
AI・生成AIのおすすめコンテンツ
AI・生成AIの関連コンテンツ
PR
PR
PR