低いDPIで小さな数字を認識するためにtesseractを訓練する方法は?

ビデオからデータを取得するので、画像を再スキャンする方法はありませんが、必要に応じて拡大/縮小できます。

文字数は限られていますが、 1234567890:ですが、元の画像やフォントのdpiは制御できません。

私はtesseractを訓練しようとしましたが、目に見える効果はなく、テストプロジェクトは https://github.com/ssbarnea/tesseract-sample しかし、現在の結果は本当に悪いです。

キャプチャされている元の画像の例:

enter image description here

OCRの後処理画像の例:

enter image description here

この場合、どのようにOCR処理を改善できますか?

3

1 答え

イメージの端に余分なスペースを追加しようとすることもできますが、時にはテッセラクトに役立ちます。しかし、オープンソースのOCRエンジンはソースイメージDPIに対して非常に敏感です。

1
追加された
ありがとう、Nokolai。実際、私はtesseractを試していました。今はAbbyyをベースにしたサードパーティーのソリューションを使用していますが、彼らはトレーニングを提供していません。この場合、良い結果を得るためにはトレーニングが必須です。 100%の精度、可能な文字がわずか11であることを考慮して可能なもの。
追加された 著者 sorin,
はい、それはケースの90%で動作しており、出力の手動修復では最大98%の精度を得ることができます。それでも100%の解決策が必要です。
追加された 著者 sorin,
@nikolay私はscipyを使って画像比較を使って自分のOCRを実装することでこの問題を解決しました。数字に対して100%の精度を得ることができました。
追加された 著者 sorin,
私はABBYY FineReader 10であなたの画像をOCRしようとしましたが、それは100%正確に機能しました。おそらく、このサードパーティのソリューションは、旧バージョンのABBYY製品に基づいているのでしょうか?あなたは何を使っていますか?
追加された 著者 Nikolay,