Нужно распознать текст

Мысли и размышления о развитии ОС Linux, открытого софта в целом, его общих свойствах, обсуждения всяких околопингвиньих новостей и баек.

Модераторы: Olej, adminn

Правила форума
Все сообщения не по теме форума будут, без каких либо уведомлений, удаляться, а их авторы - убираться из регистрации.
Язык сообщений - исключительно русский.
Joyer

Нужно распознать текст

Непрочитанное сообщение Joyer » 02 мар 2010, 14:00

Пара страниц текста, есть таблицы и несколько картинок. Чем это можно быстро и качественно сделать под Линукс?

Кто что может посоветовать из личного опыта?

vikos
Писатель
Сообщения: 110
Зарегистрирован: 07 янв 2009, 21:47
Откуда: г.Казань
Контактная информация:

Re: Нужно распознать текст

Непрочитанное сообщение vikos » 13 июл 2011, 12:29

Личного опыта не имею, зато могу подсказать, где найти нужную программу. Вот на странице http://linsoft.info/soft/category/98 перечислены такие программы и к каждой программе даны ссылки на ее описания на русском языке. Выбирайте. Потом можете отзыв оставить о том, какая программа вам понравилась.

Аватара пользователя
Olej
Писатель
Сообщения: 21338
Зарегистрирован: 24 сен 2011, 14:22
Откуда: Харьков
Контактная информация:

Re: Нужно распознать текст

Непрочитанное сообщение Olej » 02 окт 2011, 18:29

vikos писал(а): Личного опыта не имею,
А я имею (эпизодически, от года к году, изредка) такой опыт...
И могу советовать желающим распознавать скан (а это делается обычно изредка, эпизодически):
- не парьтесь, берите из нелюбого Windows :lol: - FineReader, тот который Portable, не требующий инсталляции:

Код: Выделить всё

$ ls -l F*
-rwxrwxr-x 1 olej olej 160972031 Апр  1  2009 FineReaderPortable_v9.0.exe
- и запускайте его под Wine, только это тот случай, когда Wine должен быть достаточно свежий:

Код: Выделить всё

$ wine --version
wine-1.3.1
- под тем Wine, который идёт в репозитариях дистрибутивов ~ весны прошлого года или ранее (Fedora 14, напр.) - FineReader будет сваливаться :evil: , так что Wine, возможно, придётся собрать из исходников, но там не большая проблема, всё замечательно собирается...

Cuneiform ... да и по отзывам другие tools Linux, перечисленные на подсказанной странице http://linsoft.info/soft/category/98 - пока всё это в смысле распознавания годится бегло распознать только а). пару страниц и + б). хорошего качества скана текста.
А у меня чуть меньше года назад стояла задача распознать 3 тома по ~150 стр. "слепого" машинописного текста (отпечатанного в 50-х годах) :twisted: - Cuneiform и пару других OCR попробованных - просто сошли с ума! :-o
Windows у меня просто нет инсталляций, чтоб сделать работу, но FineReader под Wine - замечательно всё отработало: в марте 2011 OpenOffice тексты переданы заказчику, и сейчас вовсю печатаются типографией... 8-)

Ответить

Вернуться в «Общий по Linux и открытому софту»

Кто сейчас на конференции

Сейчас этот форум просматривают: нет зарегистрированных пользователей и 6 гостей