• 会員限定
  • 2017/08/15 掲載

「手軽に自作で」ディープラーニングの衝撃、動画から説明文や音声合成を組み合わせ

  • icon-mail
  • icon-print
  • icon-hatena
  • icon-line
  • icon-close-snsbtns
記事をお気に入りリストに登録することができます。
ディープラーニングの活用が加速してきた。写真や動画から自動で説明文(キャプション)を作成したり、その説明文を音声合成する技術が成熟化してきたからだ。さらに、こうした技術を組み合わせて、自作で「自動キャプション生成スピーチ装置」(Video-to-Speech装置)を製作した“つわもの”も登場。NVIDIA プロダクトマーケティング・マネージャー 矢戸知得氏が個人で製作した同装置は、交通量の把握や観光案内などにも応用できるものになったという。

フリーライター 井上 猛雄

フリーライター 井上 猛雄

1962年東京生まれ。東京電機大学工学部卒業。産業用ロボットメーカーの研究所にて、サーボモーターやセンサーなどの研究開発に4年ほど携わる。その後、アスキー入社。週刊アスキー編集部、副編集長などを経て、2002年にフリーランスライターとして独立。おもにロボット、ネットワーク、エンタープライズ分野を中心として、Webや雑誌で記事を執筆。主な著書に『キカイはどこまで人の代わりができるか?』など。

画像
矢戸氏がDIYで製作した「自動キャプション生成スピーチ装置」。Webカメラから映像データを取り込み、その状況を認識して、テキストと音声合成でアウトプットする

AIによりロボットや機械の知能化も進展

photo
NVIDIA
プロダクトマーケティング・マネージャー
矢戸 知得 氏
 ディープラーニングの技術はもともと、画像処理や自然言語処理を中心に使われていたものだが、近年さまざまなアプリケーションに応用され、具体的な成果を出すようになった。

 Maker Faire Tokyo 2017(主催:オライリー・ジャパン)のセミナーに登壇したNVIDIA プロダクトマーケティング・マネージャー 矢戸知得氏は「たとえば、グーグルのAlphaGoが人間のプロ棋士を負せたことは記憶に新しいだろう。碁の打ち手の組み合わせは天文学的な数になり、コンピュータ処理は難しいとされていたが、その課題を解決した。またDOOMのような複雑なダンジョンゲームをプレイしたり、モネやゴッホの画風を学んで、そのスタイルで絵を描けるようになった。自然な会話ができる音声合成技術や、写真から説明文を生成する技術も発展した」と説明する。

 AIによって、ロボットや機械の知能化も進んだ。

「ロボットで運動技能を習得できるようになったことは大きな進展だ。複雑な関節を組み合わせて、何らかのタスクを実行できる。これをAIによってトライ&エラーで学べる。さらに難しい2足歩行技術も習得できるようになった。これは歩行に加え、時間的な制約の要素も入る。また自動車の自動運転にもAIが大きな威力を発揮している」(矢戸氏)

ディープラーニングによる3つの恩恵

関連記事
 矢戸氏によれば、ディープラーニングの恩恵は「ロバスト性」「一般性」「スケーラブル」の3つがあるという。

「人が指示するのではなく、コンピュータが自動的にデータから特徴を学びとる。人間が気づかなかった外乱(通信系などに外から加わる不要な信号)に対しても影響を受けずに性能を発揮できるロバスト性を持つ。また同じニューラルネットワークのアプローチを別のタスクや動作に対して適用できる一般性がある。さらに多くのデータを使って並列処理を行うことで、パフォーマンスが向上するスケーラブル性を有する」(矢戸氏)

 GPUディープラーニングによる新しいコンピューティングモデルでは、未学習のニューラルネットワークモデルを用意し、そこに既存データを流し込んで答え合わせをする。その結果をもとに、ニューラルネットワーク自体の重み付けを調整。何度も繰り返すことで、十分な能力を発揮する学習済みのモデルが生まれる。このモデルに未知のデータを適用し、推論処理をするという流れだ。

画像
GPUディープラーニングの仕組み。未学習のモデルに大量データを流し込む。ニューラルネットワークの重みを調整しながら学習済みのモデルを生成し、未知データから推論する

【次ページ】自作できる「自動キャプション生成スピーチ装置」

関連タグ

関連コンテンツ

オンライン

Slack AI Day

Slack AI の日本語ローンチを祝し、革新の軌跡を振り返り、未来への一歩を踏み出す特別なイベントを開催します。 「コミュニケーションの先の未来を再定義する」というテーマのもと、Slack はメッセージングツールから AI を活用した強力なプラットフォームへと進化しました。 私たちの働き方を根本から変えるこのプラットフォームでは、CRM やアプリケーションの複数同時活用が可能で、 あらゆるデジタル業務が Slack を通じて円滑に進行します。 また、AI の強化により、過去の会話や見落としていた情報を活用して、ワンクリックで最適なコミュニケーションを実現することができます。 この記念すべきイベントでは、「新しい働き方」と業務における生成 AI の活用に焦点を当てます。 Slack AI を通じて、私たちは日常の業務プロセスを根本から変革し、生産性の飛躍的な向上を目指します。 AI とオートメーションの融合が、時間を要する従来のプロセスを一新。 Salesforce の Customer 360 と連携した Slack で働き方が劇的に変わります。 Slack を愛用し続けてくださる皆さま、そしてこれから Slack をご利用してくださる皆さまと共に、AI による業務効率化の新時代を創ります。 進化を遂げた Slackと一緒に、未来の働き方を再定義し、その可能性を探求しませんか? 【このような方におすすめです】 ・業務における生成 AI の活用を模索している方 ・より効率的な働き方・チームコミュニケーションを模索している方 ・Slack でできることを知りたい方、Slack の利用を検討している方 ・Slack を使っているけど、"コミュニケーション" 以外の新しい利用価値を知りたい方 ・部門・プロジェクトごとの部分的な Slack 利用から組織全体へ広げていきたい方 ・Slack 無償版から有償版へ切り替えたい方

あなたの投稿

    PR

    PR

    PR

処理に失敗しました

人気のタグ

投稿したコメントを
削除しますか?

あなたの投稿コメント編集

機能制限のお知らせ

現在、コメントの違反報告があったため一部機能が利用できなくなっています。

そのため、この機能はご利用いただけません。
詳しくはこちらにお問い合わせください。

通報

このコメントについて、
問題の詳細をお知らせください。

ビジネス+ITルール違反についてはこちらをご覧ください。

通報

報告が完了しました

コメントを投稿することにより自身の基本情報
本メディアサイトに公開されます

必要な会員情報が不足しています。

必要な会員情報をすべてご登録いただくまでは、以下のサービスがご利用いただけません。

  • 記事閲覧数の制限なし

  • [お気に入り]ボタンでの記事取り置き

  • タグフォロー

  • おすすめコンテンツの表示

詳細情報を入力して
会員限定機能を使いこなしましょう!

詳細はこちら 詳細情報の入力へ進む
報告が完了しました

」さんのブロックを解除しますか?

ブロックを解除するとお互いにフォローすることができるようになります。

ブロック

さんはあなたをフォローしたりあなたのコメントにいいねできなくなります。また、さんからの通知は表示されなくなります。

さんをブロックしますか?

ブロック

ブロックが完了しました

ブロック解除

ブロック解除が完了しました

機能制限のお知らせ

現在、コメントの違反報告があったため一部機能が利用できなくなっています。

そのため、この機能はご利用いただけません。
詳しくはこちらにお問い合わせください。

ユーザーをフォローすることにより自身の基本情報
お相手に公開されます