сканирование и распознавание текста

Обработка документов, издательская деятельность

Модераторы: Olej, vikos

Аватара пользователя
Olej
Писатель
Сообщения: 21338
Зарегистрирован: 24 сен 2011, 14:22
Откуда: Харьков
Контактная информация:

сканирование и распознавание текста

Непрочитанное сообщение Olej » 13 апр 2015, 19:54

В Linux есть уже практически во всех областей применения "заменители" программ Windows (как более привычных широкому кругу пользователей).

Область сканирования и распознавание текста оставалась чуть ли не последней, где таких альтернатив не было...
Из задач, очень часто требуемых в офисной работе (назовём так укрупнённо)

Проблем тут здесь сразу 2:
1. Установка сканера и конфигурация под него программы сканирования.
2. Программы OCR (оптического распознавания).

Замечания по п.1:
- производители сканеров практически никогда не заморачиваются с поддержкой в Linux;
- для сканирования есть несколько проектов ... самый развитый из них (IMHO) Xsane, который устанавливается даже по умолчанию в большинстве дистрибуивов;
- но и он поддерживает только ограниченно число "родовых" моделей ... а китайские производители лупят те же модели (с теми же названиями), но с другим чипом, и они просто не распознаются Xsane - наша задача его научить ;-)
- для расширения номенклатуры был (кажется он завершён) проект SANE GT68xx Backend (здесь даже русскоязычная страница проекта ... но повозиться сильно придётся).
Как победить сканер (с 5-й попытки ;-) ) мне удалось описывается здесь: сканер Mustec 1200 UB Plus
Предполагаю (и начитан из разных мест), что подобным способом можно победить почти любую модель.
Поэтому, если об аппаратной проблеме сканера ещё и будет повод что-то добавить (лучше нет ;-) ), то это будет по указанной ссылке в разделе "Железо".

Замечания по п.2:
- меня (IMHO)интересовали бы только те OCR, которые удовлетворительно распознавали русский текст ... а не "в принципе";
- мои опыты 2-х годичной давности (и попытки раньше) показали, что все OCR на то время удовлетворительно не распознавали даже английский текст...
- на то время я успешно использовал (восстановлена из машинописи низкого качества книга ~500-600 страниц) под Wine работающий общеизвестный FneReader ... и даже его "портабле" версию...
- но о Wine мы здесь говорить не будем...

Аватара пользователя
Olej
Писатель
Сообщения: 21338
Зарегистрирован: 24 сен 2011, 14:22
Откуда: Харьков
Контактная информация:

Re: сканирование и распознавание текста

Непрочитанное сообщение Olej » 14 апр 2015, 11:02

Olej писал(а):2. Программы OCR (оптического распознавания).
Лучшее, что мне удалось почитать по этому поводу, это: OCR в Linux
Размещено 23/10/2014 автором alv

Алексей Федорчук
Fedoriada, 04.04.2011

Первый вариант этого материала, в виде серии заметок, сочинялся весной 2011 года. Стех пор кое-что улучшилось, в частности, tesseract. С тех пор я с распознаванием текстов имел дело только от случая к случаю -- это не то, чем хочется заниматься без практического повода, а таковые, хвала Ахурамазде, были очень редко. Но принципиальных изменений и каких-либо прорывов, насколько я знаю, не произошло. Материал размещается as were, с некоторыми модификациями, отражающими реалии сего дня.
Как видите, материал в меру свежий: первоначально написан в 2011г. и подчищался в 2014г.
И весьма (даже излишне ;-) ) обстоятельный.

Реальными экспериментами я ничего нового (пока) не нашёл, поэтому только краткие выводы по итогам публикации + свои наблюдения:

1. Сканирование делаем Xsane.
Здесь я расхожусь с текстом: се простые сканирующие программы просто не распознают мой сканер (говорят: нет сканера) в отличие от Xsane:
Изображение

2. Сканирование делаем с разрешением 600dpi, а не какие-то 50dpi (как по умолчанию на картине) или ещё что...
Изображение
Сканировать с большим разрешением - 1200dpi, 2400dpi - результат не улучшает, а время сканирования увеличивает квадратично.

3. Распознавание прямо сканированного текста к хорошему не приведёт! :lol:
Изображение нужно чистить.

4. Для чистки есть 2 (на выбор) реально работающих инструмента: Scan Tailor & YAGF.
Всё упоминаемое в этом сообщении есть в репозитариях и не нужно ничего искать.

Код: Выделить всё

olej@nvidia ~/2015_WORK/HISTORY.nvidia/04/13 $ apt search scantailor
p   scantailor                      - Интерактивный инструмент постобработки для
olej@nvidia ~/2015_WORK/HISTORY.nvidia/04/13 $ apt install scantailor
...
Необходимо скачать 2 095 kБ архивов.
После данной операции, объём занятого дискового пространства возрастёт на 4 956 kB.
...
Настраивается пакет scantailor (0.9.11.1-0ubuntu2) …

Код: Выделить всё

olej@nvidia ~/2015_WORK/HISTORY.nvidia/04/14/out $ apt search yagf
p   yagf                            - Графический интерфейс для cuneiform и tess
olej@nvidia ~/2015_WORK/HISTORY.nvidia/04/14/out $ apt install yagf
...
Необходимо скачать 320 kБ архивов.
После данной операции, объём занятого дискового пространства возрастёт на 841 kB.
...
Настраивается пакет yagf (0.9.2.1-1) …

Аватара пользователя
Olej
Писатель
Сообщения: 21338
Зарегистрирован: 24 сен 2011, 14:22
Откуда: Харьков
Контактная информация:

Re: сканирование и распознавание текста

Непрочитанное сообщение Olej » 14 апр 2015, 11:12

5. Для распознавания русского текста существуют 2 инструмента - Cuneiform & tesseract.

6. Cuneiform :

Код: Выделить всё

olej@nvidia ~/2015_WORK/HISTORY.nvidia/04/13 $ sudo apt-get install cuneiform
...
Необходимо скачать 24,2 MБ архивов.
После данной операции, объём занятого дискового пространства возрастёт на 60,1 MB.
...
Настраивается пакет cuneiform (1.1.0+dfsg-4) …
Работа Cuneiform :

Код: Выделить всё

olej@nvidia ~/2015_WORK/HISTORY.nvidia/04/14/out $ cuneiform -l rus -f text -o ocr20_600.txt ocr20_600.tif
Cuneiform for Linux 1.1.0
7. tesseract :

Код: Выделить всё

olej@nvidia ~/2015_WORK/HISTORY.nvidia/04/14/out $ sudo apt-get install tesseract-ocr
...
Необходимо скачать 28,9 MБ архивов.
После данной операции, объём занятого дискового пространства возрастёт на 78,6 MB.
...
Настраивается пакет tesseract-ocr (3.03.02-3) …
Запускаем...

Код: Выделить всё

olej@nvidia ~/2015_WORK/HISTORY.nvidia/04/14/out $ tesseract ocr20_600.tif ocr20_600t.txt -l rus
Tesseract Open Source OCR Engine v3.03 with Leptonica
Error opening data file /usr/share/tesseract-ocr/tessdata/rus.traineddata
Please make sure the TESSDATA_PREFIX environment variable is set to the parent directory of your "tessdata" directory.
Failed loading language 'rus'
Tesseract couldn't load any languages!
Could not initialize tesseract.
Не тут то было! Не знает он такого языка...

Код: Выделить всё

olej@nvidia ~/2015_WORK/HISTORY.nvidia/04/14/out $ apt search tesseract
p   libtesseract-dev                - Development files for the tesseract comman
i A libtesseract3                   - консольная утилита распознавания текста   
i   tesseract-ocr                   - консольная утилита распознавания текста   
p   tesseract-ocr-afr               - Языковые файлы tesseract-ocr для языка афр
p   tesseract-ocr-ara               - Языковые файлы tesseract-ocr для арабского
p   tesseract-ocr-aze               - Языковые файлы tesseract-ocr для азербайдж
p   tesseract-ocr-bel               - Языковые файлы tesseract-ocr для беларусск
p   tesseract-ocr-ben               - Языковые файлы tesseract-ocr для языка бен
p   tesseract-ocr-bul               - Языковые файлы tesseract-ocr для болгарско
p   tesseract-ocr-cat               - Языковые файлы tesseract-ocr для каталанск
p   tesseract-ocr-ces               - Языковые файлы tesseract-ocr для чешского 
p   tesseract-ocr-chi-sim           - Языковые файлы tesseract-ocr для упрощённо
p   tesseract-ocr-chi-tra           - Языковые файлы tesseract-ocr для традицион
p   tesseract-ocr-chr               - Языковые файлы tesseract-ocr для языка пле
p   tesseract-ocr-dan               - Языковые файлы tesseract-ocr для датского 
p   tesseract-ocr-deu               - Языковые файлы tesseract-ocr для немецкого
p   tesseract-ocr-deu-frak          - tesseract-ocr language files for German Fr
p   tesseract-ocr-dev               - фиктивный пакет для обновления            
p   tesseract-ocr-ell               - Языковые файлы tesseract-ocr для греческог
i A tesseract-ocr-eng               - Языковые файлы tesseract-ocr для английско
p   tesseract-ocr-enm               - tesseract-ocr language files for Middle En
p   tesseract-ocr-epo               - Языковые файлы tesseract-ocr для языка эсп
i A tesseract-ocr-equ               - tesseract-ocr language files for equations
p   tesseract-ocr-est               - Языковые файлы tesseract-ocr для эстонског
p   tesseract-ocr-eus               - Языковые файлы tesseract-ocr для баскского
p   tesseract-ocr-fin               - Языковые файлы tesseract-ocr для финского 
p   tesseract-ocr-fra               - Языковые файлы tesseract-ocr для французск
p   tesseract-ocr-frk               - Языковые файлы tesseract-ocr для франкског
p   tesseract-ocr-frm               - tesseract-ocr language files for Middle Fr
p   tesseract-ocr-glg               - Языковые файлы tesseract-ocr для галисийск
p   tesseract-ocr-grc               - Языковые файлы tesseract-ocr для древнегре
p   tesseract-ocr-heb               - Языковые файлы tesseract-ocr для иврита   
p   tesseract-ocr-hin               - Языковые файлы tesseract-ocr для языка хин
p   tesseract-ocr-hrv               - Языковые файлы tesseract-ocr для хорватско
p   tesseract-ocr-hun               - Языковые файлы tesseract-ocr для венгерско
p   tesseract-ocr-ind               - Языковые файлы tesseract-ocr для индонезий
p   tesseract-ocr-isl               - Языковые файлы tesseract-ocr для исландско
p   tesseract-ocr-ita               - Языковые файлы tesseract-ocr для итальянск
p   tesseract-ocr-ita-old           - tesseract-ocr language files for Old Itali
p   tesseract-ocr-jpn               - tesseract-ocr language files for Japanese 
p   tesseract-ocr-kan               - tesseract-ocr language files for Kannada  
p   tesseract-ocr-kor               - tesseract-ocr language files for Korean   
p   tesseract-ocr-lav               - tesseract-ocr language files for Latvian  
p   tesseract-ocr-lit               - tesseract-ocr language files for Lithuania
p   tesseract-ocr-mal               - tesseract-ocr language files for Malayalam
p   tesseract-ocr-mkd               - tesseract-ocr language files for Macedonia
p   tesseract-ocr-mlt               - tesseract-ocr language files for Maltese  
p   tesseract-ocr-msa               - tesseract-ocr language files for Malay    
p   tesseract-ocr-nld               - tesseract-ocr language files for Dutch    
p   tesseract-ocr-nor               - tesseract-ocr language files for Norwegian
i A tesseract-ocr-osd               - tesseract-ocr language files for script an
p   tesseract-ocr-pol               - tesseract-ocr language files for Polish   
p   tesseract-ocr-por               - tesseract-ocr language files for Portugues
p   tesseract-ocr-ron               - tesseract-ocr language files for Romanain 
p   tesseract-ocr-rus               - tesseract-ocr language files for Russian  
p   tesseract-ocr-slk               - tesseract-ocr language files for Slovak   
p   tesseract-ocr-slk-frak          - tesseract-ocr language files for Slovak Fr
p   tesseract-ocr-slv               - tesseract-ocr language files for Slovenian
p   tesseract-ocr-spa               - tesseract-ocr language files for Spanish  
p   tesseract-ocr-spa-old           - tesseract-ocr language files for Old Spani
p   tesseract-ocr-sqi               - tesseract-ocr language files for Albanian 
p   tesseract-ocr-srp               - tesseract-ocr language files for Serbian  
p   tesseract-ocr-swa               - tesseract-ocr language files for Swahili  
p   tesseract-ocr-swe               - tesseract-ocr language files for Swedish  
p   tesseract-ocr-tam               - tesseract-ocr language files for Tamil    
p   tesseract-ocr-tel               - tesseract-ocr language files for Telugu   
p   tesseract-ocr-tgl               - tesseract-ocr language files for Tagalog  
p   tesseract-ocr-tha               - tesseract-ocr language files for Thai     
p   tesseract-ocr-tur               - tesseract-ocr language files for Turkish  
p   tesseract-ocr-ukr               - tesseract-ocr language files for Ukranian 
p   tesseract-ocr-vie               - tesseract-ocr language files for Vietnames
Устанавливаем языковый пакет:

Код: Выделить всё

olej@nvidia ~/2015_WORK/HISTORY.nvidia/04/14/out $ apt install tesseract-ocr-rus
...
Необходимо скачать 9 121 kБ архивов.
После данной операции, объём занятого дискового пространства возрастёт на 38,9 MB.
Получено:1 http://ftp.tu-chemnitz.de/pub/linux/ubuntu/ trusty/universe tesseract-ocr-rus all 3.02.02-1 [9 121 kB]
...
Настраивается пакет tesseract-ocr-rus (3.02.02-1) …
И снова:

Код: Выделить всё

olej@nvidia ~/2015_WORK/HISTORY.nvidia/04/14/out $ tesseract ocr20_600.tif ocr20_600t.txt -l rus
Tesseract Open Source OCR Engine v3.03 with Leptonica

Аватара пользователя
Olej
Писатель
Сообщения: 21338
Зарегистрирован: 24 сен 2011, 14:22
Откуда: Харьков
Контактная информация:

Re: сканирование и распознавание текста

Непрочитанное сообщение Olej » 14 апр 2015, 11:27

8.

Код: Выделить всё

olej@nvidia ~/2015_WORK/HISTORY.nvidia/04/14/out $ ls -l ocr20_600*.* 
-rw-r--r-- 1 olej olej 67274 апр.  14 01:21 ocr20_600.tif
-rw-r--r-- 1 olej olej   525 апр.  14 10:37 ocr20_600t.txt
-rw-r--r-- 1 olej olej   527 апр.  14 01:24 ocr20_600.txt
Оба результата распознавания в точности (100%) соответствуют исходному оригиналу (фрагмент стихотворения Иосифа Бродского "Конец прекрасной эпохи" - текст там сложный для того, чтобы интуитивно что-то подправить ;-) ). Различия в длине на 2 байта - это пробелы перед (вокруг) тире.

Но такой отличный результат ещё и потому, что текст был первоначально крупным кеглем размером 20p.
Нужно то же повторить (на том же разрешении) с самыми малыми кеглями.
Вложения
ocr20_600.tif
ocr20_600.txt
(527 байт) 281 скачивание
ocr20_600t.txt
(525 байт) 281 скачивание

ganny
Сообщения: 1
Зарегистрирован: 14 апр 2015, 15:42
Контактная информация:

Re: сканирование и распознавание текста

Непрочитанное сообщение ganny » 14 апр 2015, 15:48

Cuneiform не очень нравится. Не обладает всеми инструментами для работы.

Аватара пользователя
Olej
Писатель
Сообщения: 21338
Зарегистрирован: 24 сен 2011, 14:22
Откуда: Харьков
Контактная информация:

Re: сканирование и распознавание текста

Непрочитанное сообщение Olej » 14 апр 2015, 16:08

ganny писал(а):Cuneiform не очень нравится. Не обладает всеми инструментами для работы.
Cuneiform, может и не обладает всеми инструментами для работы... А какими инструментами? ;-) ... если он (в Linux) - консольная программа, CLI, и все инструменты определяются опциями запуска...

Cuneiform, в отличие от tesseract, имеет ещё один существенный недостаток: он имеет зашитый образ литер русского языка, а tesseract имеет файлы образов для каждого языка, может обучаться и совершенствовать файл образов ... только сказки это всё, и никто не станет этим заниматься.
Вы станете? :lol:

Но я уже писал, повторю:
Для распознавания русского текста существуют 2 инструмента - Cuneiform & tesseract.
Программы зарубежного производства вообще не представляют интереса для обработки русскоязычных текстов...
Всё, что попадалось мне помимо этих 2-х - времянки и однодневки: появляются и через полгода исчезают.

И развиваться эта отрасль ПО, судя по всему, уже не будет ... и некому, и незчем ;-) .
Так что придётся пользоваться (научиться ;-) ) тем что есть!

Аватара пользователя
Olej
Писатель
Сообщения: 21338
Зарегистрирован: 24 сен 2011, 14:22
Откуда: Харьков
Контактная информация:

Re: сканирование и распознавание текста

Непрочитанное сообщение Olej » 14 апр 2015, 16:27

ganny писал(а):Cuneiform не очень нравится. Не обладает всеми инструментами для работы.
Вот любопытная и свежая публикация: Бесплатные программы для распознавания текста (OCR) под Linux
Собственно, со множественным числом ("программы") автор погорячился - он описывает одну программу, tesseract.
Но по ней любопытные сведения:
Почему tesseract-ocr и почему на нём сошёлся свет клином? tesseract-ocr — это бесплатный, с открытым исходным кодом движок, который когда-то давно показывал хорошие результаты, потом долго, до 2006 года его никто не развивал. А с 2006 года за него взялась Гугл. Проект не заброшен, в настоящее время примерно раз в год происходят обновления версии. Гугл некачественно не делает, и сейчас можно констатировать, tesseract-ocr — это хороший бесплатный движок для распознавания текста. Дело в том, что разработать собственную систему OCR, пожалуй, под силу только большим корпорациями и распространяться эта система может, следовательно, только как коммерческий продукт. В результате бесплатные программы для распознавания текста являются, фактически, оболочкой (надстройкой, графическим интерфейсом) для одного или нескольких бесплатных движков распознавания текста. tesseract-ocr — вещь хорошая и распознаёт хорошо (на уровне коммерческих продуктов), но кому интересно работать в командной строке, чтобы её использовать? Кому интересное распознавать по одному изображению? Кто бы отказался от возможности пакетной обработки графических файлов, в том числе PDF, в качественном пользовательском интерфейсе?
А дальше в качестве "программы" рассматриваются фронтэнды к tesseract, обёрки ... которые делают работу с ним комфортной и не такой трудозатратной (для тех кто не умеет или не любит возиться с командной строко ;-) ).

В любом случае, это любопытная статья.

Аватара пользователя
Olej
Писатель
Сообщения: 21338
Зарегистрирован: 24 сен 2011, 14:22
Откуда: Харьков
Контактная информация:

Re: сканирование и распознавание текста

Непрочитанное сообщение Olej » 14 апр 2015, 17:01

Olej писал(а): А дальше в качестве "программы" рассматриваются фронтэнды к tesseract, обёрки ... которые делают работу с ним комфортной и не такой трудозатратной (для тех кто не умеет или не любит возиться с командной строко ;-) ).
Кстати, вот описание одной из самых известных таких интегрирующих оболочек YAGF, от её автора Андрея Боровского: YAGF - графическая оболочка для cuneiform и tesseract.
Краткое описание работы
YAGF как-раз умеет выбирать для работы из тех 2-х OCR распознавалок, о которых говорилось выше.

Аватара пользователя
Lepton
Писатель
Сообщения: 73
Зарегистрирован: 18 окт 2011, 20:26
Контактная информация:

Re: сканирование и распознавание текста

Непрочитанное сообщение Lepton » 26 фев 2016, 10:20

Оптическое распознавание символов с помощью OpenCV-Python :lol:

Аватара пользователя
Olej
Писатель
Сообщения: 21338
Зарегистрирован: 24 сен 2011, 14:22
Откуда: Харьков
Контактная информация:

Re: сканирование и распознавание текста

Непрочитанное сообщение Olej » 02 июн 2016, 18:06

Olej писал(а):5. Для распознавания русского текста существуют 2 инструмента - Cuneiform & tesseract.
Смотрю что там поменялось за год, да ещё в RPM дистрибутиве (Fedora 23), что будет пригодно для распознавания графических страниц из книги DJVU...

Код: Выделить всё

[olej@dell tasks]$ dnf list tesseract*
Последняя проверка окончания срока действия метаданных: 0:23:36 назад, Thu Jun  2 16:43:33 2016.
Доступные пакеты
tesseract.i686                                                              3.04.01-1.fc23                                          updates
tesseract.x86_64                                                            3.04.01-1.fc23                                          updates
tesseract-devel.i686                                                        3.04.01-1.fc23                                          updates
tesseract-devel.x86_64                                                      3.04.01-1.fc23                                          updates
tesseract-langpack-afr.noarch                                               3.04.01-1.fc23                                          updates
tesseract-langpack-amh.noarch                                               3.04.01-1.fc23                                          updates
...
tesseract-langpack-rus.noarch                                               3.04.01-1.fc23                                          updates
...
tesseract-langpack-ukr.noarch                                               3.04.01-1.fc23                                          updates
...
tesseract-langpack-yid.noarch                                               3.04.01-1.fc23                                          updates
tesseract-osd.x86_64                                                        3.04.01-1.fc23                                          updates

[olej@dell tasks]$ sudo dnf install tesseract tesseract-osd tesseract-langpack-rus
[sudo] пароль для olej: 
Последняя проверка окончания срока действия метаданных: 1:21:56 назад, Thu Jun  2 15:49:03 2016.
Зависимости разрешены.
===========================================================================================================================================
 Package                                   Архитектура               Версия                               Репозиторий                Размер
===========================================================================================================================================
Установка:
 leptonica                                 x86_64                    1.72-2.fc23                          fedora                     924 k
 tesseract                                 x86_64                    3.04.01-1.fc23                       updates                     11 M
 tesseract-langpack-rus                    noarch                    3.04.01-1.fc23                       updates                    7.2 M
 tesseract-osd                             x86_64                    3.04.01-1.fc23                       updates                    3.4 M

Результат операции
===========================================================================================================================================
Установка  4 Пакеты

Объем загрузки: 22 M
Объем изменений: 90 M
Продолжить? [д/Н]: y
Загрузка пакетов:
(1/4): leptonica-1.72-2.fc23.x86_64.rpm                                                                    472 kB/s | 924 kB     00:01    
(2/4): tesseract-osd-3.04.01-1.fc23.x86_64.rpm                                                             650 kB/s | 3.4 MB     00:05    
(3/4): tesseract-langpack-rus-3.04.01-1.fc23.noarch.rpm                                                    903 kB/s | 7.2 MB     00:08    
(4/4): tesseract-3.04.01-1.fc23.x86_64.rpm                                                                 1.1 MB/s |  11 MB     00:10    
-------------------------------------------------------------------------------------------------------------------------------------------
Общий размер                                                                                               1.7 MB/s |  22 MB     00:13     
...
Установлено:
  leptonica.x86_64 1.72-2.fc23                tesseract.x86_64 3.04.01-1.fc23         tesseract-langpack-rus.noarch 3.04.01-1.fc23        
  tesseract-osd.x86_64 3.04.01-1.fc23        
Выполнено!

Код: Выделить всё

[olej@dell tasks]$ sudo dnf list cuneiform
[sudo] пароль для olej: 
Последняя проверка окончания срока действия метаданных: 2:11:28 назад, Thu Jun  2 15:49:03 2016.
Доступные пакеты
cuneiform.i686                                                        1.1.0-20.fc23                                                       fedora
cuneiform.x86_64                                                      1.1.0-20.fc23                                                       fedora

[olej@dell tasks]$ sudo dnf install cuneiform
Последняя проверка окончания срока действия метаданных: 2:11:42 назад, Thu Jun  2 15:49:03 2016.
Зависимости разрешены.
================================================================================================================================================
 Package                               Архитектура                  Версия                                  Репозиторий                   Размер
================================================================================================================================================
Установка:
 ImageMagick-c++                       x86_64                       6.9.2.7-1.fc23                          updates                       176 k
 cuneiform                             x86_64                       1.1.0-20.fc23                           fedora                         24 M

Результат операции
================================================================================================================================================
Установка  2 Пакеты

Объем загрузки: 25 M
Объем изменений: 54 M
Продолжить? [д/Н]: y
Загрузка пакетов:
(1/2): ImageMagick-c++-6.9.2.7-1.fc23.x86_64.rpm                                                                644 kB/s | 176 kB     00:00    
(2/2): cuneiform-1.1.0-20.fc23.x86_64.rpm                                                                       943 kB/s |  24 MB     00:26    
------------------------------------------------------------------------------------------------------------------------------------------------
Общий размер                                                                                                    862 kB/s |  25 MB     00:29     
Проверка транзакции
Проверка транзакции успешно завершена.
Идет проверка транзакции
Тест транзакции проведен успешно
Выполнение транзакции
  Установка    : ImageMagick-c++-6.9.2.7-1.fc23.x86_64                                                                                      1/2 
  Установка    : cuneiform-1.1.0-20.fc23.x86_64                                                                                             2/2 
  Проверка     : cuneiform-1.1.0-20.fc23.x86_64                                                                                             1/2 
  Проверка     : ImageMagick-c++-6.9.2.7-1.fc23.x86_64                                                                                      2/2 

Установлено:
  ImageMagick-c++.x86_64 6.9.2.7-1.fc23                                      cuneiform.x86_64 1.1.0-20.fc23                                     

Выполнено!

Код: Выделить всё

[olej@dell vector]$ which tesseract 
/usr/bin/tesseract
[olej@dell vector]$ which cuneiform
/usr/bin/cuneiform

Ответить

Вернуться в «Офисное ПО»

Кто сейчас на конференции

Сейчас этот форум просматривают: нет зарегистрированных пользователей и 1 гость