2005年12月29日

フリーの高機能画像認識 SmartOCR Liteこのエントリーを含むはてなブックマークこのエントリーをはてなブックマークに追加


スポンサード リンク

・SmartOCR Lite
http://www.smartread.biz/index.htm
SmartOCRLite104.jpg

フリーソフトでは珍しい高機能な画像認識ソフト(OCR)。スキャナで読み取った文書データや、デジカメの画像、Web上の画像ファイルなどから、文字列を自動検出し、テキストデータとして抽出することができる。ルビや表組など複雑な背景も解析するのが特徴。
機能を強化した商用版もあるのだが、フリーのLite版でも一般的な利用者にとって必要十分な仕様になっている。読み取ったデータは、画像と一緒もしくはテキストのみのデータとして、PDF、ワード、エクセル、HTML、CSV、テキスト形式でのファイル保存が可能だ。
装飾が多い新聞の折込みチラシの画像を読み込ませてみたら、想像以上にうまくテキストを拾い上げることができた。ニューラルネットワーク、遺伝的アルゴリズムを使った高精度な認識が特徴。誤認識した場合にも、レイアウトを調整するなどして、読み取り精度を調整する機能がたくさん搭載されている。

ふだん、あまりOCRは使わないのだけれども、ブログで活用するとしたら、どんなものがあるだろうと考えてみた。

・プロジェクター投影された講演スライドの写真からデータを抽出する
・製品の紙の説明書からテキストを抽出してデジタルで再利用する
・マンガの吹き出しからテキストを抽出してブログネタにする

画像認識、音声認識、自動翻訳など、従来精度が問題とされたソフトウェアも、近年、精度が高くなってきたようで、動向を常にチェックしている。特にアナログ→デジタル変換を行うツールをうまく使いこなせれば、相当のPC作業の効率化、差をつけること、につながりそうである。


スポンサード リンク

Posted by daiya at 2005年12月29日 23:59 | TrackBack このエントリーを含むはてなブックマークこのエントリーをはてなブックマークに追加
Daiya Hashimoto. Get yours at bighugelabs.com/flickr
Comments
Post a comment









Remember personal info?