ドキュメントイメージスキャナQ&A 第5回
月刊 IM(Journal of Image& Information Management) 2002年5月号( 第41巻 第5号)26頁に掲載されたものを許可を得て転載したものです。 http://www.jiima.or.jp |
ドキュメントイメージスキャナQ&A 町田政彦 キヤノン電子(株) |
<第5回> |
QOCRの認識率を決定する要因について教えて下さい。 |
AOCRはOptical Character Recognitionの頭文字をとったもので、画像を光学的に読み取り、文字部分の画像データ(ビットマップ)をテキストデータに変換するものです。テキストデータ化することにより、データベース活用などが可能になります。スキャンした画像のどの部分をOCRするか指定することも可能です。OCRはバーのパターンを読み取って数字に変換するバーコード認識と共に、自動インデックス付けのツールとしても、ドキュメントスキャナでは非常に多く利用されています。 ドキュメントスキャナのカラー化が進んでいますが、カラー画像からのOCRが可能なソフトも一般的になりつつあります。また、辞書機能をもつことにより認識率を向上させているOCRソフトもあります。 認識率の決定にはいくつかの要因があります。もちろん、スキャンする原稿の文字サイズ、字体、あるいはその原稿がオリジナルか、あるいはコピーされたものか。コピーされたものであれば何世代目のコピーかにより、認識率は異なりますが、ここでは、スキャンする原稿以外の条件についてご説明します。 まずは、OCRソフトウエアそのものの認識率です。各ソフトウエアは、ある条件下での認識率をうたっております。様々なアルゴリズムを使い、高速で、かつ正確なOCR処理実現のため、各社しのぎを削っております。 ハード(スキャナ)側では、以下の要素が認識率を左右します。 解像力:通常は300-400dpiで処理されます。OCRソフトそれぞれに最適な解像度が指定されていますので、指定の解像度でスキャンすることをお薦めします。必ずしも解像度が高ければ良いというものではないことにご注意下さい。 コントラスト:コントラストの振り方によって、認識率が変化します。原稿の文字部と背景部のコントラスト差を調整します。 斜行:スキャンした際に斜行すると、当然認識率が低下します。スキャナには斜行補正機能を有するものも多く、多少の斜行であれば斜行した画像をソフト的にまっすぐに直します。もちろん、ごくわずかの斜行であれば、その補正を行なわなくてもソフトの認識率に影響がない場合もあります。 |
孤立点除去:スキャンした画像には、その背景に不要な黒い点が記録されてしまう場合があります。“ゴミ”と表現することもあるのですが、この点をOCRが読み取ろうとすることがある為、認識率に影響します。そこでドライバーソフト、あるいはOCRアプリケーションソフトでこういった孤立した点を除去して認識率を上げます。 エッジ強調:スキャンした文字のエッジ部を強調して再現することにより、文字をくっきりと浮かび上がらせ、OCRの認識率を高めます。但し、エッジ強調が強過ぎると逆に認識率が低下することがあります。 フォームズプロセッシング/カラードロップアウト:申込書等、帳票の桝目に文字を記入し、その帳票をスキャンしてOCRした文字を、それぞれ対応するデータベースに登録するのがフォームズプロセッシングです。通常スキャンの際に桝目をドロップアウトし、罫線を文字と誤認識することを防ぎ、OCRの認識率を高めます。罫線の色をドロップアウトするには、その色をスキャナの光源の色に合わせて帳票を作成することが必要です。 最近では更に一歩進んで、文字領域、絵、直線等の各領域の種類や要素をブロック毎に認識し、それぞれテキストデータ、ビットマップ画像、ベクトルデータに変換するような技術も開発され、原稿の構成をそのままに文字部をOCRできるものも商品化されております。(上図参照) |