Olej писал(а): ↑27 авг 2020, 21:01
Ожил
Но зачастую, в 90%, сканирование нужно дальше для целей распознавания текста...
О чём у нас есть отдельная тема:
сканирование и распознавание текста
Но при непосредственно использования из страницы, полученной Xsane, нажатием 2-й слева кнопки "ABCDEF", оно орёт что не может найти gocr!
Код: Выделить всё
olej@nvidia:~$ aptitude search gocr
p gocr - Система оптического распознавания символов (OCR) для командной строки
p gocr-dev - Header files for OCR
p gocr-tk - tcl/tk-обёртка вокруг gocr
p gocryptfs - Encrypted overlay filesystem written in Go
Код: Выделить всё
olej@nvidia:~$ sudo apt install gocr
[sudo] пароль для olej:
Попробуйте ещё раз.
[sudo] пароль для olej:
Чтение списков пакетов… Готово
Построение дерева зависимостей
Чтение информации о состоянии… Готово
Рекомендуемые пакеты:
transfig
Следующие НОВЫЕ пакеты будут установлены:
gocr
Обновлено 0 пакетов, установлено 1 новых пакетов, для удаления отмечено 0 пакетов, и 7 пакетов не обновлено.
Необходимо скачать 228 kB архивов.
После данной операции объём занятого дискового пространства возрастёт на 543 kB.
Пол:1 http://mirror.mirohost.net/ubuntu focal/universe amd64 gocr amd64 0.52-3 [228 kB]
Получено 228 kB за 5с (44,1 kB/s)
Выбор ранее не выбранного пакета gocr.
(Чтение базы данных … на данный момент установлено 414597 файлов и каталогов.)
Подготовка к распаковке …/archives/gocr_0.52-3_amd64.deb …
Распаковывается gocr (0.52-3) …
Настраивается пакет gocr (0.52-3) …
Обрабатываются триггеры для man-db (2.9.1-1) …
Если запустить эту рампознавалку (кнопкой "ABCDEF" в меню на картинке ... откуда мне упал этот текст и что там написано - не важно, это только зафиксировать где меню), файл out1.pnm => out1.txt, то в out1.txt найдём что-то типа:
Код: Выделить всё
...
Mb_, xnrTeJInc _oMayb_ _Ieco4nrHcKoro r_oce_KoBoro coBeTa, KpaY[_He
o6ecr_oKoeHb_ TeM, 4To Ha 6JIyxa__Ju_x Bbr6opax B rpoMa_y T_eco4yHa,
6_JroTMpoBaTbc_ Heo6xo_ncMo oT KaKo_-JrM6o r_oJrMTyr__ecKo_ r_apTMM.
...
Это связано, как я понимаю, либо в а). языком распознавания установленном для OCR gocr, либо б). я кодировкой просмотра результирующего файла out1.txt