Распознавание текста в Linux Ubuntu с помощью CuneiForm + YAGF

Распознавание текста в ОС Linux доступно любому пользователю. Чтобы с легкостью распознать текст в операционной системе Linux есть OCR-система CuneiForm, которая служит для преобразования графических файлов в редактируемый текст. CuneiForm работает только из консоли, что существенно ограничивает круг людей, которые могут использовать данную программу.

Чтобы это исправить была разработана, на данный момент, лучшая графическая оболочка — YAGF. YAGF полностью раскрывает все возможности OCR-системы CuneiForm.

Скриншоты

Распознавание текста в Linux Ubuntu с помощью CuneiForm + YAGF

Описание

Сильные стороны CuneiForm + YAGF:

  • Комплекс программ абсолютно бесплатен.
  • Довольно неплохие результаты распознования текста.
  • Результаты распознавания текста можно сохранить в формат html или text.
  • Есть возможность автоматической проверки орфографии при установленоном пакете aspell.
  • Большое количество поддерживаемых языков.
  • Красивый и эргономичный интерфейс.
  • Работа со сканером организована посредством Sane + XSane.

Слабые стороны CuneiForm + YAGF:

  • Нельзя сохранить результаты работы в текстовом документе, формат которого поддерживает сохранение форматирования текста: doc, odt, rtf и т. д.
  • Распознование текста, в некоторых случаях, еще далеко от идеального.

Установка

  1. Скачать CuneiForm для Windows: http://www.cuneiform.ru/downloads/
    Скачать YAGF для Windows: http://symmetrica.net/cuneiform-linux/yagf-ru.html
  2. Установка CuneiForm и YAGF в Ubuntu / Kubuntu / Xubuntu:
    echo "deb http://notesalexp.org/debian/`lsb_release -cs`/ `lsb_release -cs` main contrib non-free" | sudo tee -a /etc/apt/sources.list
    wget -O - http://notesalexp.org/debian/alexp_key.asc | sudo apt-key add - && sudo apt-get update
    sudo apt-get install libmagick++1 aspell aspell-ru sane xsane sane-utils quiteinsane cuneiform-linux yagf