• 会員限定
  • 2021/08/16 掲載

AIの「画像・音声・動画認識」のカラクリ、機械学習のプロセスを解説

連載:図でわかる3分間AIキソ講座

  • icon-mail
  • icon-print
  • icon-hatena
  • icon-line
  • icon-close-snsbtns
記事をお気に入りリストに登録することができます。
機械学習の進歩によって画像認識や音声認識のツールが当たり前のように使われるようになりました。しかし、その仕組みをきちんと理解して利用している人は少ないのではないでしょうか。今回は、画像認識や音声認識のAI(人工知能)がどのように作られているのかを簡単に解説していきます。

執筆:フリーライター 三津村直貴

執筆:フリーライター 三津村直貴

合同会社Noteip代表。ライター。米国の大学でコンピューターサイエンスを専攻し、卒業後は国内の一部上場企業でIT関連製品の企画・マーケティングなどに従事。退職後はライターとして書籍や記事の執筆、WEBコンテンツの制作に関わっている。人工知能の他に科学・IT・軍事・医療関連のトピックを扱っており、研究機関・大学における研究支援活動も行っている。著書『近未来のコア・テクノロジー(翔泳社)』『図解これだけは知っておきたいAIビジネス入門(成美堂)』、執筆協力『マンガでわかる人工知能(池田書店)』など。

画像
画像や音声認識のAIは、大きく分けて4つのステップによって作られています(後ほど詳しく解説します)


画像・音声認識のAI、開発の流れとは

 画像や音声をベースにしたAIが作られる際のプロセスは、基本的に下記ようになります。

  1. 「データを集める」
  2. 「正解となるラベルを付ける」
  3. 「学習させる」
  4. 「学習の成果を評価して改善する」

 この流れは多かれ少なかれAIが完成した後も続けられます。ここからは、それぞれのプロセスを簡単に解説していきます。

(1)データを集める

 「画像・音声データの収集」は、学習用データを集めるプロセスです。

 基本的に画像や音声認識に用いる機械学習プロセスでは膨大な量の学習データが必要になるため、このプロセスの自動化は必要不可欠なものとなります。このプロセスを効率的に行うために学習用データを集めるツールやプログラムが作られ、それ自体が自律的に動作するAIのような機能を持っている場合もあるほどです。

 人間による手作業でデータ収集・生成される場合でも、不特定多数の人間が参加できる工夫がなされていたり、人間の自然な情報活動の中でデータが作成されるようになっていたりする場合が多いです。SNSなどにアップロードされる画像・音声データがその好例でしょう。

 また、購買データのようにすでにデータが集まっているという場合には、学習に使うデータの分類と整理が行われます。

(2)ラベルを付ける

 「ラベル付け」の作業は場合によっては人間による手作業が多く含まれるプロセスです。

 この「ラベル」とは、いわゆる「教師データ」にあたるもので、そのデータが「何」なのか、画像・音声としてどんな「答え」が正しいのか、といった情報をデータに付与します。

 SNSなどでよく使われる「タグ」のような形でデータの収集段階で簡易のラベルが付くこともありますが、質の良い学習データを作る際には人間によるチェックが必要不可欠です。

 また、高度な画像・音声認識AIになるほど、このラベル付けが難しくなります。動物の画像など、誰でも知っているようなモノに関するラベル付けであれば誰でもできますが、医療画像のラベル付けは「医師」や「検査技師」にしかできないなど、専門知識が要求されます。

 また、膨大なデータに1つひとつラベルを付けていかなければならないのでコストのかかる作業になります。そのため、ラベル付けそのものが少なくても学習できるような研究開発が進んでいます。

(3)学習させる

 次に「学習」です。実はこの学習プロセスが人間にとっては一番簡単です。というのも、この前の段階で学習用のアルゴリズムやプログラムは完成しているので、学習時にはデータを流し込むだけだからです。学習方法は機械学習の手法にもよりますが、データを用いた学習自体は自動的に行われます。

 この学習に使うデータは「ラベル付き」だけに限らず、学習方法によっては「ラベルなし」のものや「ハズレのデータ」がノイズとして混ぜられることがあります。学習時に「ランダムなノイズ」を混ぜることは意外と重要で、過学習と呼ばれる学習のさせ過ぎで起こる不具合を防ぎ、学習効率を向上させる効果があります。

 このプロセスで人間がやることは少ないものの、1つひとつのデータが大きい「気象」「天体」「交通」などの画像データを扱う場合には学習そのものに時間がかかることもあります。場合によってはスーパーコンピューターを使って学習することもあります。

(4)学習の成果を評価・改善する

 最後に「評価と改善」です。これは実際にAIを使ってみて問題点をあぶり出し、プログラムやデータを修正したり、新しくデータを集め直したりと、次につなげていくプロセスとなります。

 学習が終わったプログラムを「使う」のは簡単です。ただ、それによって得られた結果を評価して改善することが難しく、評価によって問題の「原因」を見つけ出し「解決策」を考え、実際に改善するための「行動」をするまでにかなりのコストがかかります。

 このプロセスも人間が手動で行うことになります。一方で、AIによって「評価と改善」を自動化する試みも進んでいます。しかし、その場合にも「評価改善自動化システム」の評価と改善を人間が行うことになるので、AI開発ではどこかに必ず人間の手が入るというのが現状です。

【次ページ】「画像・音声認識」の発展形、動画認識の仕組みとは

関連タグ

関連コンテンツ

オンライン

Slack AI Day

Slack AI の日本語ローンチを祝し、革新の軌跡を振り返り、未来への一歩を踏み出す特別なイベントを開催します。 「コミュニケーションの先の未来を再定義する」というテーマのもと、Slack はメッセージングツールから AI を活用した強力なプラットフォームへと進化しました。 私たちの働き方を根本から変えるこのプラットフォームでは、CRM やアプリケーションの複数同時活用が可能で、 あらゆるデジタル業務が Slack を通じて円滑に進行します。 また、AI の強化により、過去の会話や見落としていた情報を活用して、ワンクリックで最適なコミュニケーションを実現することができます。 この記念すべきイベントでは、「新しい働き方」と業務における生成 AI の活用に焦点を当てます。 Slack AI を通じて、私たちは日常の業務プロセスを根本から変革し、生産性の飛躍的な向上を目指します。 AI とオートメーションの融合が、時間を要する従来のプロセスを一新。 Salesforce の Customer 360 と連携した Slack で働き方が劇的に変わります。 Slack を愛用し続けてくださる皆さま、そしてこれから Slack をご利用してくださる皆さまと共に、AI による業務効率化の新時代を創ります。 進化を遂げた Slackと一緒に、未来の働き方を再定義し、その可能性を探求しませんか? 【このような方におすすめです】 ・業務における生成 AI の活用を模索している方 ・より効率的な働き方・チームコミュニケーションを模索している方 ・Slack でできることを知りたい方、Slack の利用を検討している方 ・Slack を使っているけど、"コミュニケーション" 以外の新しい利用価値を知りたい方 ・部門・プロジェクトごとの部分的な Slack 利用から組織全体へ広げていきたい方 ・Slack 無償版から有償版へ切り替えたい方

あなたの投稿

    PR

    PR

    PR

処理に失敗しました

人気のタグ

投稿したコメントを
削除しますか?

あなたの投稿コメント編集

機能制限のお知らせ

現在、コメントの違反報告があったため一部機能が利用できなくなっています。

そのため、この機能はご利用いただけません。
詳しくはこちらにお問い合わせください。

通報

このコメントについて、
問題の詳細をお知らせください。

ビジネス+ITルール違反についてはこちらをご覧ください。

通報

報告が完了しました

コメントを投稿することにより自身の基本情報
本メディアサイトに公開されます

必要な会員情報が不足しています。

必要な会員情報をすべてご登録いただくまでは、以下のサービスがご利用いただけません。

  • 記事閲覧数の制限なし

  • [お気に入り]ボタンでの記事取り置き

  • タグフォロー

  • おすすめコンテンツの表示

詳細情報を入力して
会員限定機能を使いこなしましょう!

詳細はこちら 詳細情報の入力へ進む
報告が完了しました

」さんのブロックを解除しますか?

ブロックを解除するとお互いにフォローすることができるようになります。

ブロック

さんはあなたをフォローしたりあなたのコメントにいいねできなくなります。また、さんからの通知は表示されなくなります。

さんをブロックしますか?

ブロック

ブロックが完了しました

ブロック解除

ブロック解除が完了しました

機能制限のお知らせ

現在、コメントの違反報告があったため一部機能が利用できなくなっています。

そのため、この機能はご利用いただけません。
詳しくはこちらにお問い合わせください。

ユーザーをフォローすることにより自身の基本情報
お相手に公開されます