Настройка сервера Linux и Windows
ITShaman - Сайт для АЙТИшников!
"Машины должны работать. Люди должны думать."
(девиз компании IBM)

Распознавание текста в Linux Ubuntu с помощью CuneiForm + YAGF

Распознавание текста в ОС Linux доступно любому пользователю. Чтобы с легкостью распознать текст в операционной системе Linux есть OCR-система CuneiForm, которая служит для преобразования графических файлов в редактируемый текст. CuneiForm работает только из консоли, что существенно ограничивает круг людей, которые могут использовать данную программу.

Чтобы это исправить была разработана, на данный момент, лучшая графическая оболочка — YAGF. YAGF полностью раскрывает все возможности OCR-системы CuneiForm.

Скриншоты


Распознавание текста в Linux Ubuntu с помощью CuneiForm + YAGF

Описание


Сильные стороны CuneiForm + YAGF:

Слабые стороны CuneiForm + YAGF:

Установка


  1. Скачать CuneiForm для Windows: http://www.cuneiform.ru/downloads/
    Скачать YAGF для Windows: http://symmetrica.net/cuneiform-linux/yagf-ru.html
  2. Установка CuneiForm и YAGF в Ubuntu / Kubuntu / Xubuntu:
    # echo "deb http://notesalexp.org/debian/`lsb_release -cs`/ `lsb_release -cs` main contrib non-free" | sudo tee -a /etc/apt/sources.list
    # Подключение дополнительного репозитория
    # wget -O - http://notesalexp.org/debian/alexp_key.asc | sudo apt-key add - && sudo apt-get update
    # Установка ключа авторизации и обновление списка пакетов
    # sudo apt-get install libmagick++1 aspell aspell-ru sane xsane sane-utils quiteinsane cuneiform-linux yagf
    # Устанавливаем CuneiForm + YAGF
Статья опубликована 09.08.2009 · Автор статьи: Зюзгин Иван
Статья относится к linux, софт, сканер, ubuntu, репозиторий, cuneiform, YAGF, ocr, sane
Похожие 7 программ:
  1. Распознавание текста в Linux Ubuntu с помощью CuneiForm + YAGF
  2. XSane - сканирование изображений в Linux
Комментарии [25]
  1. Mitoshi #
    10 Август, 01:04

    Во, отличная программа, под виндой был, помню, только ABBYY FineReader и то платный… =)

  2. Tavork #
    30 Август, 04:46

    А вместо этого # sudo apt-get install libmagick++1 aspell aspell-ru sane xsane sane-utils quiteinsane можно ссылки дать на оффлайн deb пакеты. Буду признателен.

  3. Mut@NT #
    30 Август, 15:58

    >Tavork
    Все эти пакеты доступны в официальных репозиториев Ubuntu.
    Если нет возможности скачать с них, то воспользуйтесь сайтом:
    http://packages.ubuntu.com/
    Там поиск. На нем можно найти все пакеты, входящие в официальную поставку дистрибутива Ubuntu

  4. Андрей #
    14 Сентябрь, 18:58

    Помоему правильная строчка вот такая (либмэджик не ++1, а ++10):

    sudo apt-get install libmagick++10 aspell aspell-ru sane xsane sane-utils quiteinsane

    Кстати кто-нибудь знает, где можно найти deb-пакеты cuneiform и YAGF под hardy?

  5. Mut@NT #
    15 Сентябрь, 00:53

    >Андрей
    Вы ошибаетесь ))) именно libmagick++1
    Про hardy к сожалению не подскажу

  6. despicere #
    15 Октябрь, 01:51

    Андрей не ошибается, просто они разные: libmagick++10 – squeeze, sid(karmic) ++2, для убунту 8.10-9.04 ++1 – тут уж если я не ошибаюсь :-)

  7. Randomize #
    7 Ноябрь, 02:25

    При попытке распознать пишет:
    Ответ системы:cuneiform: error while loading shared libraries: libGraphicsMagick++.so.1: cannot open shared object file: No such file or directory
    при:
    sudo apt-get install libmagick++10 aspell aspell-ru sane xsane sane-utils quiteinsane
    Не удалось найти пакет libmagick++10
    при:
    libmagick++1 не найдены кандидаты на установку
    Я поставил libMagick++2 и libMagick++-dev
    Вот только не лечит
    Я мало понимаю что делаю может кто подскажет?

  8. Mut@NT #
    7 Ноябрь, 08:34

    Скорее всего Вы не подключили доп. репозитории.
    Зайдите в АДМИНИСТРИРОВАНИЕ/ИСТОЧНИКИ ПРИЛОЖЕНИЙ там поставте везде галки и обновите списки пакетов. Потом попробуйте по новому установить. Если у Вас ОС Ubuntu, то sudo apt-get install libmagick++1 aspell aspell-ru

  9. Randomize #
    7 Ноябрь, 19:20

    Да у меня Ubuntu 9.10 и дело видно в репозиториях так как при обновлении их пишет
    http://ppa.launchpad.net jaunty Release:
    Следующие подписи не могут быть проверены, так как недоступен открытый ключ:NO_PUBKEY 7D2C7A23BF810CD5 Ошибка: http://ppa.launchpad.net intrepid Release:Следующие подписи не могут быть проверены, так как недоступен открытый ключ: NO_PUBKEY FE8956A73C5EE1C9Не удалось
    получить cdrom://Ubuntu 9.04 Jaunty Jackalope – Release i386 (20090420.1)/dists/jaunty/main/binary-i386/Packages.gz
    Пожалуйста, используйте apt-cdrom, чтобы APT смог распознать данный CD. apt-get update не используется для добавления нового CD
    Не удалось получить cdrom://Ubuntu 9.04 Jaunty Jackalope – Release i386 (20090420.1)/dists/jaunty/restricted/binary-i386/Packages.gz Пожалуйста, используйте apt-cdrom, чтобы APT смог распознать данный CD. apt-get update не используется для добавления нового CD Некоторые индексные файлы не скачались, они были проигнорированы или вместо них были использованы старые версии
    А на сайте http://packages.ubuntu.com эта библиотека какраз в репах Jaunty я от туда ручками скачал 3 файла так как libmagick++1 требует libmagickcore1 тот в свою очередь libmagickwand1 а этот снова требует libmagickcore1 и как поставить теперь я их незнаю
    несмотря что deb-файлы – ведь получается что зависимости не удовлетворены.
    Может есть способ добыть ключи от неработающих репозиторий?

  10. Mut@NT #
    8 Ноябрь, 03:42

    Ключ можно найти вот так:
    http://itshaman.ru/articles/26/kak-naiti-klyuch-repozitoriya-v-ubuntu

  11. Randomize #
    8 Ноябрь, 19:09

    Спасибо за ссылку, ключи найдены и список обновлен теперь на:
    sudo apt-get install libmagick++1 aspell aspell-ru sane xsane sane-utils quiteinsane
    Пишет:
    Пакет libmagick++1 недоступен, но упомянут в списке зависимостей другого пакета. Это может означать, что пакет отсутствует, устарел, или доступен из источников, не упомянутых в sources.list
    Может ссылку создать с именем libGraphicsMagick++.so.1 на какой нить файл из пакета libMagick++2 только вот на какой и где создать?
    ЗЫ
    прошу прощения за флуд ну раз уж тема поднята….

  12. Randomize #
    8 Ноябрь, 20:20

    Проблему решил следующим образом
    В папке /usr/lib были найдены вот такие файлы:
    libGraphicsMagick++.so.3
    libGraphicsMagick.so.3
    Там же создал их копии и переименовал те в:
    libGraphicsMagick++.so.1
    libGraphicsMagick.so.1
    Все заработало вроде как без ошибок…

  13. Mut@NT #
    8 Ноябрь, 20:25

    Если что, пакет libmagick++1 тянется с оф. репа Ubuntu
    http://archive.ubuntu.com jaunty-updates/main

  14. TALmud #
    21 Ноябрь, 19:26

    Ребята я чайник) так что не судите строго. Подскажите как установить http://www.cuneiform.ru/downloads/(cuneiform) читал на форуме , но не нашел ( может проглядел, незнаю. ubuntu 9.04

  15. Mut@NT #
    22 Ноябрь, 00:58

    В статье же вроде написано.
    Качайте DEB-пакет cuneiform от сюда http://www.mediafire.com/alexp
    или с приведенной Вами ссылки, но там собирать руками придется

  16. TALmud #
    23 Ноябрь, 04:56

    Все разобрался)) Спасибо! Извините за глупость плохо посмотрел)))

  17. Meison #
    22 Январь, 15:48

    у меня при попытке установить yagf выдает ошибку: “Ошибка: Зависимость не может быть удовлетворена: cuneiform-linux|cuneiform” Что я опять не так сделал?

  18. Mut@NT #
    22 Январь, 17:14

    Meison: у меня при попытке установить yagf выдает ошибку: “Ошибка: Зависимость не может быть удовлетворена: cuneiform-linux|cuneiform”

    Можете полный вывод команды.

    p.s. Можно попробовать установить с параметром -f

  19. Alexey #
    12 Февраль, 09:56

    Randomize: Проблему решил следующим образом
    В папке /usr/lib были найдены вот такие файлы:
    libGraphicsMagick++.so.3
    libGraphicsMagick.so.3
    Там же создал их копии и переименовал те в:
    libGraphicsMagick++.so.1
    libGraphicsMagick.so.1
    Все заработало вроде как без ошибок…

    Переименовал.
    А вот с таким результатом что делать :
    sudo apt-get install libmagick++1 aspell aspell-ru sane xsane sane-utils quiteinsane

  20. Draco #
    18 Февраль, 15:54

    как можно распознать PDF не подскажете?

  21. Mut@NT #
    20 Февраль, 06:12

    Draco: как можно распознать PDF не подскажете?

    Сам это никогда не делал, но вроде есть конверторы в текст. Или копировать можно текст.

  22. мммм #
    30 Сентябрь, 10:32

    а можно просто указать в менеджере загрузки ubuntu
    прогу --CuneiForm.и все загрузится.

  23. Mut@NT #
    6 Октябрь, 12:05

    мммм: а можно просто указать в менеджере загрузки ubuntu прогу --CuneiForm.и все загрузится.

    Да Вы правы, но в оф. репозитории лежит не совсем последняя версия CuneiForm. Все же целесообразнее использовать последнюю доступную версию OCR-системы

  24. N2 #
    11 Октябрь, 02:33

    Люди хелп! Использую Ubuntu 9.10, при установке deb пакета пишет неверная архитектура! Программа очень нужна. Предлагать самому скомпилить или собрать не предлагать. С линуксом только вторую неделю общаюсь.

  25. Mut@NT #
    15 Октябрь, 06:14

    N2: Люди хелп! Использую Ubuntu 9.10, при установке deb пакета пишет неверная архитектура! Программа очень нужна. Предлагать самому скомпилить или собрать не предлагать. С линуксом только вторую неделю общаюсь.

    Это скорее всего значит, что Вы скачали DEB пакет не для той архитектуры которую используете.
    Наберите в консоли:
    uname -a
    В выводе этой команды посмотрите упоминания о архитектуре: i386, i686, amd64 и так далее
    Если команда показала у Вас 2 первых значения, то у вас установлена 32-разрядная ОС и нужно качать пакеты где есть i386. amd64 – это 64-разряда и пакет должен быть соответственный.

Имя (обязательное поле)
e-mail (обязательное поле) Сайт
Текст комментария:
IT-новости
Популярное
Облако тегов
При цитировании документа активная ссылка на сайт обязательна.
Администрирование и настройка серверов, рабочих станций на базе ОС Linux и Windows. www.itshaman.ru - Настройка Linux и Windows © 2009 - 2016