会員限定
2019/05/13 07:10 掲載

5分でわかる自然言語処理：人工知能の「文字認識」の仕組みとは

手書き文字を認識するカギはディープラーニング

ありがとうございます！
いいね！した記事一覧をみる

会員（無料）になると、いいね！でマイページに保存できます。

AI・生成AI

|

タグをもっとみる

人工知能関連技術の中でも特に関心が高く応用範囲の広い技術が、文字認識や文章理解に関する「自然言語処理」に関する技術です。この技術は単に人間と機械がコミュニケーションを取る手助けをするだけにとどまらず、情報の収集や検索、書類のデータ化にも役立ちます。事務的な「データ入力」「コールセンター」といったサポート業務から「マーケティング」「経営戦略」にまで幅広く生かせる人工知能による文字認識や文章理解について数学的な用語は一切使わず、2回にわたってやさしく解説していきます。

執筆：フリーライター三津村直貴

フリーライター三津村直貴

合同会社Noteip代表。ライター。米国の大学でコンピューターサイエンスを専攻し、卒業後は国内の一部上場企業でIT関連製品の企画・マーケティングなどに従事。退職後はライターとして書籍や記事の執筆、WEBコンテンツの制作に関わっている。人工知能の他に科学・IT・軍事・医療関連のトピックを扱っており、研究機関・大学における研究支援活動も行っている。著書『近未来のコア・テクノロジー（翔泳社）』『図解これだけは知っておきたいAIビジネス入門（成美堂）』、執筆協力『マンガでわかる人工知能（池田書店）』など。

人工知能は「文字」をどのように認識しているのか？やさしく解説

（©Elnur - Fotolia）

人工知能はどうやって文字を認識している？

マス目をルールにしたがって塗るだけで文字や図が現れる

　まず、人工知能はどうやって文字を認識しているのでしょうか。コンピューターはモニター上に文字を表示することができるので、「書けるなら読めるだろう」と思いたくなりますが、実際にはコンピューターの中では文字を数値に変換し、数値に合わせた「点の集合」に変え、モニタ上に光の情報として表現しているだけです。

　原理的にはマスを黒く塗って絵を作る「ピクロス」と同じで、コンピューターが「A」を「A」、もしくは「あ」は「あ」であると認識して表示しているわけではありません。この時点での文字は、コンピューターにとっては黒点の集まりに過ぎません。

連載一覧

▲ 閉じる ▼ すべて表示

　また、ここでいう「文字認識」はいわゆる「光学文字認識」（OCR：Optical Character Recognition）のことです。紙や印刷物に書かれた文字をスキャンしてテキスト化する技術といえばピンと来るのではないでしょうか。

　私たち人間が紙などに書かれた情報を理解できるのは、紙に反射した光の情報を見て「文字」「背景」「インクの染み」を認識しているわけで、実質的には光の情報です。それゆえに、光学文字認識が手書き文字を含めさまざまな文字認識技術の基礎になっています。

　この光学文字認識では、文字の持つ「直線」「曲線」「交点」などの特徴を数学的な比率で表して理想的な文字と比較したり、ディープラーニングを応用したり、さまざまな形で捉えていきます。

コンピューターと文字認識技術の違い

　簡単そうに聞こえますが、同じ文字であっても「インクの色」「紙の色」「電灯の色」で受け取る光が違います。光から得られる情報というのは0と1で扱えるデジタルデータではありません。それぞれにわずかな違いの存在するアナログデータなのです。

　顔認証システムなどが明かりによって顔が認識できたりできなかったりするのはその典型です。さらにそれが、手書き文字ともなる厄介です。「文字の形」「文字の角度」はもちろんのこと、「インクの染み」「書き間違い」のほか、筆記体や行書体で見られる「線のつながり」が当たり前のように発生するため、簡単には行きません。

【次ページ】人工知能が文字の特徴を見つける方法

AI・生成AI

AI・生成AIの関連コンテンツ

記事

AI・生成AI

5分でわかる自然言語処理：人工知能の「文字認識」の仕組みとは

人工知能はどうやって文字を認識している？

AI・生成AIのおすすめコンテンツ

ニューラルネットワークの基礎解説：仕組みや機械学習・ディープラーニングとの関係は

機械翻訳の仕組みを図解、直訳タイプと意訳タイプの違いは？

汎用人工知能（AGI）とは何か？全脳アーキテクチャ・イニシアティブが目指すもの

AI（人工知能）スタートアップ33社まとめ、第3次AIブーム牽引する注目ベンチャーリスト

ピーター・ティールとテック右派生んだシリコンバレーの変質…成功し過ぎた“反体制”

AI・生成AIの関連コンテンツ

【最強入門】Claude Codeだけでは大損…Codexで“地味作業”が消える神プロンプト7選

「AIの回答、広告に寄ってない…？」ついに始まったChatGPT広告、ユーザーに残る3懸念

“伝える業務”が激変、動画AI「Seedance」が簡単すぎ…撮影ゼロで完成「神ワザ10選」

なぜ日本はAIで米中に勝てないのか？「世界11位」でも喜べない「教育の致命的欠陥」

「AI×ERP」の威力が凄すぎる、データ未整備でも「AI先進企業」に一気に飛躍する方法

「AIをとにかく活用せよ」が頓挫するワケ、“PoC死”防ぐパーソルクロステクノロジーの共創AIサービス開発

迫る2027年…S/4HANA移行にAIはどう使う？「AI前提」の基幹システム刷新が本質的すぎた

イチからわかる!GPT Codex入門講座

イチからわかる!GPT Codex入門講座

CAIO（Chief AI Officer）養成講座

CAIO（Chief AI Officer）養成講座

DX&AI Forum Online 2026 夏

DX&AI Forum Online 2026 夏

5分でわかる自然言語処理：人工知能の「文字認識」の仕組みとは

人工知能はどうやって文字を認識している？

AI・生成AIのおすすめコンテンツ

ニューラルネットワークの基礎解説：仕組みや機械学習・ディープラーニングとの関係は

機械翻訳の仕組みを図解、直訳タイプと意訳タイプの違いは？

汎用人工知能（AGI）とは何か？ 全脳アーキテクチャ・イニシアティブが目指すもの

AI（人工知能）スタートアップ33社まとめ、第3次AIブーム牽引する注目ベンチャーリスト

ピーター・ティールとテック右派生んだシリコンバレーの変質…成功し過ぎた“反体制”

AI・生成AIの関連コンテンツ

【最強入門】Claude Codeだけでは大損…Codexで“地味作業”が消える神プロンプト7選

「AIの回答、広告に寄ってない…？」ついに始まったChatGPT広告、ユーザーに残る3懸念

“伝える業務”が激変、動画AI「Seedance」が簡単すぎ…撮影ゼロで完成「神ワザ10選」

なぜ日本はAIで米中に勝てないのか？「世界11位」でも喜べない「教育の致命的欠陥」

「AI×ERP」の威力が凄すぎる、データ未整備でも「AI先進企業」に一気に飛躍する方法

「AIをとにかく活用せよ」が頓挫するワケ、“PoC死”防ぐパーソルクロステクノロジーの共創AIサービス開発

迫る2027年…S/4HANA移行にAIはどう使う？「AI前提」の基幹システム刷新が本質的すぎた

イチからわかる!GPT Codex入門講座

イチからわかる!GPT Codex入門講座

CAIO（Chief AI Officer）養成講座

CAIO（Chief AI Officer）養成講座

DX&AI Forum Online 2026 夏

DX&AI Forum Online 2026 夏

汎用人工知能（AGI）とは何か？全脳アーキテクチャ・イニシアティブが目指すもの