OCR

OCRの画像

OCR(おーしーあーる)はOptical Character Recognition(光学文字認識)の略称で、データ上に表示されている文字・数字にコンピューターで使用できるよう文字情報を付与する技術・処理を指します。通常本をカメラやスキャナーで撮影しても、その中身である文字をPC上でコピー&ペーストすることは出来ません。これはその他の部分と同じく単なる「画像」として認識されている為です。OCRでは、この画像の中から“文字や数字と思わしき形”を探し出し、抽出することで「文字」として使えるようにすることが出来ます。OCRはパッケージのソフトとして一般販売されている他、近年ではクラウドタイプも浸透しています。また、AIによる機械学習を実装したAI-OCRの進化も目まぐるしく、その誕生から100年以上経つ今でも新しいOCRが開発・活用されています。

用語集に戻る