サーバサイドで日本語OCRしたい
サーバサイドで日本語OCR処理をしたら面白いかもと思い調査。
GoogleのTesseract OCRが性能いいとのことだけど日本語処理ができない。
WeOCRというプロジェクトは東北大学の方が研究されているようなのだが、
Develop a Japanese OCR and release it as a WeOCR server. (midterm)
と、日本語対応はまだ先になる模様。
WEB上のサービスではhttp://www.web-ocr.net/というのがあったけど有料。(月500円から)
API等は公開されてないので、外部プログラムから呼び出すことはできなさそう。
アプライアンスとしても販売しているみたいだけどWindowsサーバ。
Linux上で動くOSSな日本語OCRエンジンはまだ存在しないのかな?
しかしMOONGIFTはよく調べてあるなー。いつもお世話になってます。