Настройка сервера Linux и Windows
ITShaman - Сайт для АЙТИшников!
"Машины должны работать. Люди должны думать."
(девиз компании IBM)
Облако тегов
Реклама
www.popularsite.ru

Распознавание текста в Linux Ubuntu с помощью CuneiForm + YAGF

Распознавание текста в Linux Ubuntu с помощью CuneiForm + YAGF

Распознавание текста в ОС Linux доступно любому пользователю. Чтобы с легкостью распознать текст в операционной системе Linux есть OCR-система CuneiForm, которая служит для преобразования графических файлов в редактируемый текст. CuneiForm работает только из консоли, что существенно ограничивает круг людей, которые могут использовать данную программу.

Чтобы это исправить была разработана, на данный момент, лучшая графическая оболочка — YAGF. YAGF полностью раскрывает все возможности OCR-системы CuneiForm.

Скриншоты


Распознавание текста в Linux Ubuntu с помощью CuneiForm + YAGF

Описание


Сильные стороны CuneiForm + YAGF:

  • Комплекс программ абсолютно бесплатен.
  • Довольно неплохие результаты распознования текста.
  • Результаты распознавания текста можно сохранить в формат html или text.
  • Есть возможность автоматической проверки орфографии при установленоном пакете aspell.
  • Большое количество поддерживаемых языков.
  • Красивый и эргономичный интерфейс.
  • Работа со сканером организована посредством Sane + XSane.

Слабые стороны CuneiForm + YAGF:

  • Нельзя сохранить результаты работы в текстовом документе, формат которого поддерживает сохранение форматирования текста: doc, odt, rtf и т. д.
  • Распознование текста, в некоторых случаях, еще далеко от идеального.

Установка


  1. Скачать CuneiForm для Windows: http://www.cuneiform.ru/downloads/
    Скачать YAGF для Windows: http://symmetrica.net/cuneiform-linux/yagf-ru.html
  2. Установка CuneiForm и YAGF в Ubuntu / Kubuntu / Xubuntu:
    # echo "deb http://notesalexp.org/debian/`lsb_release -cs`/ `lsb_release -cs` main contrib non-free" | sudo tee -a /etc/apt/sources.list
    # Подключение дополнительного репозитория
    # wget -O - http://notesalexp.org/debian/alexp_key.asc | sudo apt-key add - && sudo apt-get update
    # Установка ключа авторизации и обновление списка пакетов
    # sudo apt-get install libmagick++1 aspell aspell-ru sane xsane sane-utils quiteinsane cuneiform-linux yagf
    # Устанавливаем CuneiForm + YAGF

Добавить закладку на статью

Случайные 7 статей:

  1. Геораспределенный кластер на Windows 2008 Server
  2. GoogleEarth — 3D-модель планеты Земля
  3. Работа с системными службами из консоли в Windows: создание, удаление, запуск, остановка и изменение параметров
  4. Blueman - bluetooth-менеджер для Linux
  5. Для чего нужен каждый каталог в Linux или структура директорий ОС Линукс
  6. GPicView - просмотрщик изображений похожий на стандартный Windows-инструмент
  7. VLC — плеер мультимедиа

Комментарии

  1. Mitoshi
    10 Августа, 14:04 #

    Во, отличная программа, под виндой был, помню, только ABBYY FineReader и то платный… =)

  2. Tavork
    30 Августа, 17:46 #

    А вместо этого # sudo apt-get install libmagick++1 aspell aspell-ru sane xsane sane-utils quiteinsane можно ссылки дать на оффлайн deb пакеты. Буду признателен.

  3. Mut@NT
    31 Августа, 04:58 # (Комментарий автора)

    >Tavork
    Все эти пакеты доступны в официальных репозиториев Ubuntu.
    Если нет возможности скачать с них, то воспользуйтесь сайтом:
    http://packages.ubuntu.com/
    Там поиск. На нем можно найти все пакеты, входящие в официальную поставку дистрибутива Ubuntu

  4. Андрей
    15 Сентября, 07:58 #

    Помоему правильная строчка вот такая (либмэджик не ++1, а ++10):

    sudo apt-get install libmagick++10 aspell aspell-ru sane xsane sane-utils quiteinsane

    Кстати кто-нибудь знает, где можно найти deb-пакеты cuneiform и YAGF под hardy?

  5. Mut@NT
    15 Сентября, 13:53 # (Комментарий автора)

    >Андрей
    Вы ошибаетесь ))) именно libmagick++1
    Про hardy к сожалению не подскажу

  6. despicere
    15 Октября, 14:51 #

    Андрей не ошибается, просто они разные: libmagick++10 – squeeze, sid(karmic) ++2, для убунту 8.10-9.04 ++1 – тут уж если я не ошибаюсь :-)

  7. Randomize
    7 Ноября, 14:25 #

    При попытке распознать пишет:
    Ответ системы:cuneiform: error while loading shared libraries: libGraphicsMagick++.so.1: cannot open shared object file: No such file or directory
    при:
    sudo apt-get install libmagick++10 aspell aspell-ru sane xsane sane-utils quiteinsane
    Не удалось найти пакет libmagick++10
    при:
    libmagick++1 не найдены кандидаты на установку
    Я поставил libMagick++2 и libMagick++-dev
    Вот только не лечит
    Я мало понимаю что делаю может кто подскажет?

  8. Mut@NT
    7 Ноября, 20:34 # (Комментарий автора)

    Скорее всего Вы не подключили доп. репозитории.
    Зайдите в АДМИНИСТРИРОВАНИЕ/ИСТОЧНИКИ ПРИЛОЖЕНИЙ там поставте везде галки и обновите списки пакетов. Потом попробуйте по новому установить. Если у Вас ОС Ubuntu, то sudo apt-get install libmagick++1 aspell aspell-ru

  9. Randomize
    8 Ноября, 07:20 #

    Да у меня Ubuntu 9.10 и дело видно в репозиториях так как при обновлении их пишет
    http://ppa.launchpad.net jaunty Release:
    Следующие подписи не могут быть проверены, так как недоступен открытый ключ:NO_PUBKEY 7D2C7A23BF810CD5 Ошибка: http://ppa.launchpad.net intrepid Release:Следующие подписи не могут быть проверены, так как недоступен открытый ключ: NO_PUBKEY FE8956A73C5EE1C9Не удалось
    получить cdrom://Ubuntu 9.04 Jaunty Jackalope – Release i386 (20090420.1)/dists/jaunty/main/binary-i386/Packages.gz
    Пожалуйста, используйте apt-cdrom, чтобы APT смог распознать данный CD. apt-get update не используется для добавления нового CD
    Не удалось получить cdrom://Ubuntu 9.04 Jaunty Jackalope – Release i386 (20090420.1)/dists/jaunty/restricted/binary-i386/Packages.gz Пожалуйста, используйте apt-cdrom, чтобы APT смог распознать данный CD. apt-get update не используется для добавления нового CD Некоторые индексные файлы не скачались, они были проигнорированы или вместо них были использованы старые версии
    А на сайте http://packages.ubuntu.com эта библиотека какраз в репах Jaunty я от туда ручками скачал 3 файла так как libmagick++1 требует libmagickcore1 тот в свою очередь libmagickwand1 а этот снова требует libmagickcore1 и как поставить теперь я их незнаю
    несмотря что deb-файлы – ведь получается что зависимости не удовлетворены.
    Может есть способ добыть ключи от неработающих репозиторий?

  10. Mut@NT
    8 Ноября, 15:42 # (Комментарий автора)

    Ключ можно найти вот так:
    http://itshaman.ru/articles/26/kak-naiti-klyuch-repozitoriya-v-ubuntu

  11. Randomize
    9 Ноября, 07:09 #

    Спасибо за ссылку, ключи найдены и список обновлен теперь на:
    sudo apt-get install libmagick++1 aspell aspell-ru sane xsane sane-utils quiteinsane
    Пишет:
    Пакет libmagick++1 недоступен, но упомянут в списке зависимостей другого пакета. Это может означать, что пакет отсутствует, устарел, или доступен из источников, не упомянутых в sources.list
    Может ссылку создать с именем libGraphicsMagick++.so.1 на какой нить файл из пакета libMagick++2 только вот на какой и где создать?
    ЗЫ
    прошу прощения за флуд ну раз уж тема поднята….

  12. Randomize
    9 Ноября, 08:20 #

    Проблему решил следующим образом
    В папке /usr/lib были найдены вот такие файлы:
    libGraphicsMagick++.so.3
    libGraphicsMagick.so.3
    Там же создал их копии и переименовал те в:
    libGraphicsMagick++.so.1
    libGraphicsMagick.so.1
    Все заработало вроде как без ошибок…

  13. Mut@NT
    9 Ноября, 08:25 # (Комментарий автора)

    Если что, пакет libmagick++1 тянется с оф. репа Ubuntu
    http://archive.ubuntu.com jaunty-updates/main

  14. TALmud
    22 Ноября, 07:26 #

    Ребята я чайник) так что не судите строго. Подскажите как установить http://www.cuneiform.ru/downloads/(cuneiform) читал на форуме , но не нашел ( может проглядел, незнаю. ubuntu 9.04

  15. Mut@NT
    22 Ноября, 12:58 # (Комментарий автора)

    В статье же вроде написано.
    Качайте DEB-пакет cuneiform от сюда http://www.mediafire.com/alexp
    или с приведенной Вами ссылки, но там собирать руками придется

  16. TALmud
    23 Ноября, 16:56 #

    Все разобрался)) Спасибо! Извините за глупость плохо посмотрел)))

  17. Meison
    23 Января, 03:48 #

    у меня при попытке установить yagf выдает ошибку: “Ошибка: Зависимость не может быть удовлетворена: cuneiform-linux|cuneiform” Что я опять не так сделал?

  18. Mut@NT
    23 Января, 05:14 # (Комментарий автора)

    Meison: у меня при попытке установить yagf выдает ошибку: “Ошибка: Зависимость не может быть удовлетворена: cuneiform-linux|cuneiform”

    Можете полный вывод команды.

    p.s. Можно попробовать установить с параметром -f

  19. Alexey
    12 Февраля, 21:56 #

    Randomize: Проблему решил следующим образом
    В папке /usr/lib были найдены вот такие файлы:
    libGraphicsMagick++.so.3
    libGraphicsMagick.so.3
    Там же создал их копии и переименовал те в:
    libGraphicsMagick++.so.1
    libGraphicsMagick.so.1
    Все заработало вроде как без ошибок…

    Переименовал.
    А вот с таким результатом что делать :
    sudo apt-get install libmagick++1 aspell aspell-ru sane xsane sane-utils quiteinsane

  20. Draco
    19 Февраля, 03:54 #

    как можно распознать PDF не подскажете?

  21. Mut@NT
    20 Февраля, 18:12 # (Комментарий автора)

    Draco: как можно распознать PDF не подскажете?

    Сам это никогда не делал, но вроде есть конверторы в текст. Или копировать можно текст.

Имя (обязательное поле)
e-mail (обязательное поле)
Сайт
Текст комментария:
Случайное
Популярное
Спонсоры статьи
При цитировании документа ссылка на сайт обязательна.
Администрирование и настройка серверов, рабочих станций на базе ОС Linux и Windows.
Это баннер хостинга, на котором размещается этот сайт!
Рейтинг@Mail.ru