vikos писал(а):
Личного опыта не имею,
А я имею (эпизодически, от года к году, изредка) такой опыт...
И могу советовать желающим распознавать скан (а это делается обычно изредка, эпизодически):
- не парьтесь, берите из нелюбого Windows
- FineReader, тот который Portable, не требующий инсталляции:
Код: Выделить всё
$ ls -l F*
-rwxrwxr-x 1 olej olej 160972031 Апр 1 2009 FineReaderPortable_v9.0.exe
- и запускайте его под Wine, только это тот случай, когда Wine должен быть достаточно свежий:
- под тем Wine, который идёт в репозитариях дистрибутивов ~ весны прошлого года или ранее (Fedora 14, напр.) - FineReader будет сваливаться
, так что Wine, возможно, придётся собрать из исходников, но там не большая проблема, всё замечательно собирается...
Cuneiform ... да и по отзывам другие tools Linux, перечисленные на подсказанной странице
http://linsoft.info/soft/category/98 - пока всё это в смысле распознавания годится бегло распознать только а). пару страниц и + б). хорошего качества скана текста.
А у меня чуть меньше года назад стояла задача распознать 3 тома по ~150 стр. "слепого" машинописного текста (отпечатанного в 50-х годах)
- Cuneiform и пару других OCR попробованных - просто сошли с ума!
Windows у меня просто нет инсталляций, чтоб сделать работу, но FineReader под Wine - замечательно всё отработало: в марте 2011 OpenOffice тексты переданы заказчику, и сейчас вовсю печатаются типографией...