ABBYY Fine Reader Engine: теперь и для Linux

08.11.2003, 12:12

Компания ABBYY ( http://www.abbyy.ru) объявляет о начале продаж в России системы ABBYY FineReader Engine - инструментария разработчика, позволяющего встроить систему оптического распознавания текстов в любое ПО. FineReader Engine будет доступен сразу для двух платформ: для Windows предлагается новая версия ABBYY FineReader Engine 7.0, для Linux впервые выпущена версия ABBYY FineReader Engine 6.0.

Дополнительно доступно большое количество модулей, включая экспорт в PDF и XML, распознавание рукописного текста, меток, двумерных штрих-кодов, распознавание китайского и японского языков. Модуль FineReader XIX позволяет осуществлять распознавание старо-европейских документов на пяти европейских языках (английский, немецкий, французский, испанский, итальянский) с фрактурными шрифтами прошлого столетия, популярными в Германии и Испании.

FineReader Engine имеет две специальные технологии, направленные на решение задачи, связанной с распознаванием документов с текстом, напечатанным поверх картинки, с цветным текстом на цветном фоне, с низкой контрастностью: адаптивная бинаризация (преобразование исходного изображения в черно-белое) и интеллектуальные алгоритмы фильтрации текстур. Интеллектуальные алгоритмы фильтрации текстур позволяют эффективно отделять текст от фона в процессе бинаризации. Метод адаптивной бинаризации позволяет на каждом фрагменте изображения размером в слово подбирать индивидуальные параметры яркости.

Система ABBYY FineReader поддерживает распознавание символов, написанных шрифтами OCR-A, OCR-B и MICR (E13B), которые часто используются на различных финансовых документах, паспортах, кредитных карточках.

Помимо этого, ABBYY FineReader Engine обладает следующими особенностями: Режим ускоренного распознавания специально разработан для потокового ввода документов, где точность распознавания не играет основной роли. В этом режиме скорость ввода в среднем возрастает в 2-2,5 раза. Сохранение исходного оформления документа при передаче результатов распознавания в форматы RTF, PDF и HTML. Автоматическое определение ориентации страницы, расположения текстовых блоков, таблиц и картинок, а также ориентации вертикального текста в таблицах. Возможность манипулирования/редактирования блоков (удаление) Сохранение результатов распознавания во множество форматов для Windows: RTF, PDF, XML, HTML, PPT, XLS, TXT, CSV и DBF; для LINUX: RTF, PDF, HTML, TXT и CSV. Различные режимы и уровни сохранения форматирования от "простого текста" без какого-либо форматирования до полного сохранения форматирования, включая таблицы, абзацы, разбиение на колонки, сохранение типов и начертаний шрифта, обрамлений и т.д.

ABBYY предлагает гибкую систему лицензирования: для разработчиков и для использования/распространения. Цена лицензии на комплект разработчика фиксированная - $4500 для Windows и $9000 для Linux. Цена на дополнительный комплект распознавания китайского и японского языков - $2200. Цены на лицензии для использования/распространения полностью зависят от сложности проекта, объема предполагаемой обрабатываемой документации, и могут варьироваться от нескольких долларов до нескольких десятков тысяч долларов. Об этом пишет "CNews.ru".

Читайте також