Настройка сервера Linux и Windows
ITShaman - Сайт для АЙТИшников!
"Машины должны работать. Люди должны думать."
(девиз компании IBM)

20 дек
2011
Графическая оболочка YAGF для системы распознавания текста, "доросла" до версии 0.8.9

Сравнительно недавно вышла новая версия программы, которая является оболочкой к OCR-системам: Cuneiform и Tesseract - YAGF.

Эта графическая оболочка на протяжении уже нескольких лет разрабатывается одним человеком. Этот человек русский и зовут его Андрей Боровский.

Благодаря YAGF, у большого количество пользователей компьютеров появилась возможность абсолютно бесплатно распознавать печатнный текст с изображений и PDF-файлов. Конечно же YAGF+Tesseract или YAGF+Cuneiform не cмогут соперничать с таким "софтверным" гигантом, как FineReader, но составить ему альтернативу в тех областях, где требуется распознавать документы, соблюдая юридическую "чистоту", вполне может быть.

Уже сейчас в возможности YAGF входит:

  • распознавание как одного документа, так и нескольких;
  • распознавать можно как из уже отсканированного изображения, так и непосредственно со сканера (для этого должно быть установлено ПО xSane);
  • распознавать можно из PDF-файла;
  • до запуска процесса распознавания, можно выполнить простые действия по редактированию изображения: повороты, наклоны и выделение части изображения;
  • совместная работа с двумя OCR-системами по переменно, выбирая систему в настройках вручную. Две OCR-системы: Tesseract и Cuneiform;
  • результат распознавания можно подвергнуть процессу проверки орфографии;
  • результат распознавания может быть сохранен либо в HTML, либо скопирован в буфер обмена.

Изменения в версии YAGF 0.8.9:

  • увеличена стабильность работы приложения, при наклоне страницы;
  • добавлена вставка изображений в буфер обмена;
  • немного доработан интерфейс пользователя;
  • добавлено автоматическое выделение предполагаемой "полезной" области изображения.

Современный бизнес в России наконец-то становится хоть немного похожим на зарубежный, цивилизованный. Об этом может говорить то, что бизнес постепенно осваивает пространство Интернета для набора дополнительной аудитории. Сейчас большинство российских компаний используют свои интернет-сайты и заказывают поисковое продвижение. Такие понятия как реклама Вконтакте, контекстная реклама для них уже стали совсем не чужды. Наконец-то пришло озарение того, что Интернет - это такой же мир, который вокруг нас, только немного в другой плоскости.

Автор: Зюзгин Иван
Комментарии
Имя (обязательное поле)
e-mail (обязательное поле) Сайт
Текст комментария:
IT-новости
Популярное
Облако тегов
При цитировании документа активная ссылка на сайт обязательна.
Администрирование и настройка серверов, рабочих станций на базе ОС Linux и Windows. www.itshaman.ru - Настройка Linux и Windows © 2009 - 2016