Страница 1 из 1

Нужно распознать текст

Добавлено: 02 мар 2010, 14:00
Joyer
Пара страниц текста, есть таблицы и несколько картинок. Чем это можно быстро и качественно сделать под Линукс?

Кто что может посоветовать из личного опыта?

Re: Нужно распознать текст

Добавлено: 13 июл 2011, 12:29
vikos
Личного опыта не имею, зато могу подсказать, где найти нужную программу. Вот на странице http://linsoft.info/soft/category/98 перечислены такие программы и к каждой программе даны ссылки на ее описания на русском языке. Выбирайте. Потом можете отзыв оставить о том, какая программа вам понравилась.

Re: Нужно распознать текст

Добавлено: 02 окт 2011, 18:29
Olej
vikos писал(а): Личного опыта не имею,
А я имею (эпизодически, от года к году, изредка) такой опыт...
И могу советовать желающим распознавать скан (а это делается обычно изредка, эпизодически):
- не парьтесь, берите из нелюбого Windows :lol: - FineReader, тот который Portable, не требующий инсталляции:

Код: Выделить всё

$ ls -l F*
-rwxrwxr-x 1 olej olej 160972031 Апр  1  2009 FineReaderPortable_v9.0.exe
- и запускайте его под Wine, только это тот случай, когда Wine должен быть достаточно свежий:

Код: Выделить всё

$ wine --version
wine-1.3.1
- под тем Wine, который идёт в репозитариях дистрибутивов ~ весны прошлого года или ранее (Fedora 14, напр.) - FineReader будет сваливаться :evil: , так что Wine, возможно, придётся собрать из исходников, но там не большая проблема, всё замечательно собирается...

Cuneiform ... да и по отзывам другие tools Linux, перечисленные на подсказанной странице http://linsoft.info/soft/category/98 - пока всё это в смысле распознавания годится бегло распознать только а). пару страниц и + б). хорошего качества скана текста.
А у меня чуть меньше года назад стояла задача распознать 3 тома по ~150 стр. "слепого" машинописного текста (отпечатанного в 50-х годах) :twisted: - Cuneiform и пару других OCR попробованных - просто сошли с ума! :-o
Windows у меня просто нет инсталляций, чтоб сделать работу, но FineReader под Wine - замечательно всё отработало: в марте 2011 OpenOffice тексты переданы заказчику, и сейчас вовсю печатаются типографией... 8-)