フリーの高機能画像認識 SmartOCR Lite
・SmartOCR Lite
http://www.smartread.biz/index.htm
フリーソフトでは珍しい高機能な画像認識ソフト(OCR)。スキャナで読み取った文書データや、デジカメの画像、Web上の画像ファイルなどから、文字列を自動検出し、テキストデータとして抽出することができる。ルビや表組など複雑な背景も解析するのが特徴。
機能を強化した商用版もあるのだが、フリーのLite版でも一般的な利用者にとって必要十分な仕様になっている。読み取ったデータは、画像と一緒もしくはテキストのみのデータとして、PDF、ワード、エクセル、HTML、CSV、テキスト形式でのファイル保存が可能だ。
装飾が多い新聞の折込みチラシの画像を読み込ませてみたら、想像以上にうまくテキストを拾い上げることができた。ニューラルネットワーク、遺伝的アルゴリズムを使った高精度な認識が特徴。誤認識した場合にも、レイアウトを調整するなどして、読み取り精度を調整する機能がたくさん搭載されている。
ふだん、あまりOCRは使わないのだけれども、ブログで活用するとしたら、どんなものがあるだろうと考えてみた。
・プロジェクター投影された講演スライドの写真からデータを抽出する
・製品の紙の説明書からテキストを抽出してデジタルで再利用する
・マンガの吹き出しからテキストを抽出してブログネタにする
画像認識、音声認識、自動翻訳など、従来精度が問題とされたソフトウェアも、近年、精度が高くなってきたようで、動向を常にチェックしている。特にアナログ→デジタル変換を行うツールをうまく使いこなせれば、相当のPC作業の効率化、差をつけること、につながりそうである。
トラックバック(0)
このブログ記事を参照しているブログ一覧: フリーの高機能画像認識 SmartOCR Lite
このブログ記事に対するトラックバックURL: http://www.ringolab.com/mt/mt-tb.cgi/1883