Новый ABBYY FineReader Engine 7.1 – три в одном
Компания ABBYY выпустила новую версию ABBYY FineReader Engine 7.1 – инструмента разработчика, позволяющего встроить технологии распознавания ABBYY в любую программу. В FineReader Engine 7.1 вошли сразу три технологии: FineReader – технология распознавания печатных документов; FormReader – технология ввода форм, заполненных от руки; FlexiCapture - технология обработки гибких форм.
FineReader Engine включает в себя все основные функции системы распознавания и при этом не имеет графического пользовательского интерфейса. Он представляет собой ядро технологии распознавания, с помощью которого можно интегрировать функции преобразования, распознавания документов и потокового ввода данных в любое приложение. Кроме того, новый FineReader Engine позволяет выполнять распознавание меток (OMR), рукописных символов (ICR), а также анализ документа для ввода счетов (Document Analysis for Invoices).
ABBYY FineReader Engine 7.1 содержит все функции и возможности, имеющиеся в FineReader Engine 7.0. Также, в версии 7.1. появились новые уникальные возможности:
- Новый "Менеджер лицензий" - гибкий и простой инструмент для управления лицензиями и распределением нагрузки между рабочими станциями, объединенными в локальную сеть. Например, появилась возможность использовать для нескольких рабочих станций всего одну лицензию с разделяемым счетчиком страниц, который будет использоваться всеми станциями.
- FineReader Engine 7.1, кроме технологии FineReader, включает все возможности технологии распознавания рукопечатного текста FormReader. Теперь Engine можно использовать для решения задач обработки форм, т.е. большого количества сходных документов, таких как анкеты, бюллетени, и т.п. Engine также позволяет распознавать документы, содержащие сходные данные, но имеющие различное расположение элементов - так называемые «гибкие» формы, - такие как счета, заявления о страховом возмещении, резюме, контракты, таблицы и др., с помощью новой технологии ABBYY FlexiCapture.
- В группе восточно-азиатских языков ABBYY FineReader Engine 7.1 добавился новый язык распознавания печатных текстов – корейский. Теперь модуль распознавания восточно-азиатских языков включает три языка (китайский, японский и корейский). Данный модуль поставляется по отдельному запросу.
- Новая версия Engine 7.1 поддерживает распознавание написанных от руки индийских цифр, используемых в современном арабском мире.
Основные возможности системы FineReader Engine:
- ABBYY FineReader Engine обладает беспрецедентной точностью распознавания и сохранения оформления исходного документа при экспорте в различные форматы, что подтверждается более 100 наградами и результатами сравнительных тестов ведущих IT-издательств по всему миру.
- Настоящим испытанием для современных OCR-систем являются “трудные для чтения” документы, такие как документы с текстом, напечатанным поверх картинки, с цветным текстом на цветном фоне, с низкой контрастностью и т.п. Благодаря специальным алгоритмам FineReader Engine отлично справляется с документами такого рода. Технология FineReader обеспечивает наивысшую точность, распознаёт больше вариантов написания символов и даже может восстановить отсутствующие или закрытые пятном части букв.
- Система имеет возможность распознавания двумерного (2D) штрих-кода PDF417 и большинства типов одномерных (1D) штрих-кодов, используемых в современной индустрии. Система также имеет специальную функцию для быстрого автоматического определения положения штрих-кодов на документе, расположенных под любым углом, что, например, может использоваться в системах быстрой сортировки документов по штрих-кодам.
- Система ABBYY FineReader поддерживает распознавание символов, написанных шрифтами OCR-A, OCR-B и MICR (E13B), которые часто используются на различных финансовых документах, паспортах, кредитных карточках.
- Превосходное качество сохранения исходного оформления документа при передаче результатов распознавания в форматы RTF, PDF и HTML. В частности, сохраняются такие элементы форматирования, как сложные таблицы. в том числе не имеющие явных разделителей, включая таблицы с цветными ячейками, непрямоугольные картинки и обтекание текста вокруг них, ненумерованные списки.
- Автоматическое определение ориентации страницы, расположения текстовых блоков, таблиц и картинок, а также ориентации вертикального текста в таблицах.
- Возможность манипулирования/редактирования блоков (удаление)
- Сохранение результатов распознавания во множество форматов: RTF, PDF, XML, HTML, PPT, XLS, TXT, CSV и DBF.
- Различные режимы и уровни сохранения форматирования от «простого текста» без какого-либо форматирования до полного сохранения форматирования, включая таблицы, абзацы, разбиение на колонки, сохранение типов и начертаний шрифта, обрамлений и т.д.
- FormReader содержит редактор шаблонов, позволяющий создавать шаблоны для различных типов форм. Если же вам нужно создать форму «с нуля», вы можете использовать для этого ABBYY FormDesigner.
- Возможность создавать многострочные поля.
- Пользовательские типы данных.
- Для поля данных можно задать пользовательский тип данных: с помощью регулярного выражения, набора символов, словаря из текстового файла или использовать любую комбинацию перечисленных способов.
- В FormReader имеются специализированные типы данных для 21 языка, которые используются при распознавании полей данных «имя», «фамилия», «город», «е-mail», «адрес», «телефон», «страна» и т.п. А также есть возможность создавать свои типы данных, описывающие содержание полей. Использование заданных типов позволяет OCR/ICR Engine добиться наивысшего качества распознавания.
- Автоматическая идентификация шаблона.
- При обработке в одном потоке форм различных типов программа будет автоматически выбирать нужный шаблон.
- Возможность обработки гибких форм с помощью технологии ABBYY FlexiCapture.
FineReader Engine включает в себя все основные функции системы распознавания и при этом не имеет графического пользовательского интерфейса. Он представляет собой ядро технологии распознавания, с помощью которого можно интегрировать функции преобразования, распознавания документов и потокового ввода данных в любое приложение. Кроме того, новый FineReader Engine позволяет выполнять распознавание меток (OMR), рукописных символов (ICR), а также анализ документа для ввода счетов (Document Analysis for Invoices).
ABBYY FineReader Engine 7.1 содержит все функции и возможности, имеющиеся в FineReader Engine 7.0. Также, в версии 7.1. появились новые уникальные возможности:
- Новый "Менеджер лицензий" - гибкий и простой инструмент для управления лицензиями и распределением нагрузки между рабочими станциями, объединенными в локальную сеть. Например, появилась возможность использовать для нескольких рабочих станций всего одну лицензию с разделяемым счетчиком страниц, который будет использоваться всеми станциями.
- FineReader Engine 7.1, кроме технологии FineReader, включает все возможности технологии распознавания рукопечатного текста FormReader. Теперь Engine можно использовать для решения задач обработки форм, т.е. большого количества сходных документов, таких как анкеты, бюллетени, и т.п. Engine также позволяет распознавать документы, содержащие сходные данные, но имеющие различное расположение элементов - так называемые «гибкие» формы, - такие как счета, заявления о страховом возмещении, резюме, контракты, таблицы и др., с помощью новой технологии ABBYY FlexiCapture.
- В группе восточно-азиатских языков ABBYY FineReader Engine 7.1 добавился новый язык распознавания печатных текстов – корейский. Теперь модуль распознавания восточно-азиатских языков включает три языка (китайский, японский и корейский). Данный модуль поставляется по отдельному запросу.
- Новая версия Engine 7.1 поддерживает распознавание написанных от руки индийских цифр, используемых в современном арабском мире.
Основные возможности системы FineReader Engine:
- ABBYY FineReader Engine обладает беспрецедентной точностью распознавания и сохранения оформления исходного документа при экспорте в различные форматы, что подтверждается более 100 наградами и результатами сравнительных тестов ведущих IT-издательств по всему миру.
- Настоящим испытанием для современных OCR-систем являются “трудные для чтения” документы, такие как документы с текстом, напечатанным поверх картинки, с цветным текстом на цветном фоне, с низкой контрастностью и т.п. Благодаря специальным алгоритмам FineReader Engine отлично справляется с документами такого рода. Технология FineReader обеспечивает наивысшую точность, распознаёт больше вариантов написания символов и даже может восстановить отсутствующие или закрытые пятном части букв.
- Система имеет возможность распознавания двумерного (2D) штрих-кода PDF417 и большинства типов одномерных (1D) штрих-кодов, используемых в современной индустрии. Система также имеет специальную функцию для быстрого автоматического определения положения штрих-кодов на документе, расположенных под любым углом, что, например, может использоваться в системах быстрой сортировки документов по штрих-кодам.
- Система ABBYY FineReader поддерживает распознавание символов, написанных шрифтами OCR-A, OCR-B и MICR (E13B), которые часто используются на различных финансовых документах, паспортах, кредитных карточках.
- Превосходное качество сохранения исходного оформления документа при передаче результатов распознавания в форматы RTF, PDF и HTML. В частности, сохраняются такие элементы форматирования, как сложные таблицы. в том числе не имеющие явных разделителей, включая таблицы с цветными ячейками, непрямоугольные картинки и обтекание текста вокруг них, ненумерованные списки.
- Автоматическое определение ориентации страницы, расположения текстовых блоков, таблиц и картинок, а также ориентации вертикального текста в таблицах.
- Возможность манипулирования/редактирования блоков (удаление)
- Сохранение результатов распознавания во множество форматов: RTF, PDF, XML, HTML, PPT, XLS, TXT, CSV и DBF.
- Различные режимы и уровни сохранения форматирования от «простого текста» без какого-либо форматирования до полного сохранения форматирования, включая таблицы, абзацы, разбиение на колонки, сохранение типов и начертаний шрифта, обрамлений и т.д.
- FormReader содержит редактор шаблонов, позволяющий создавать шаблоны для различных типов форм. Если же вам нужно создать форму «с нуля», вы можете использовать для этого ABBYY FormDesigner.
- Возможность создавать многострочные поля.
- Пользовательские типы данных.
- Для поля данных можно задать пользовательский тип данных: с помощью регулярного выражения, набора символов, словаря из текстового файла или использовать любую комбинацию перечисленных способов.
- В FormReader имеются специализированные типы данных для 21 языка, которые используются при распознавании полей данных «имя», «фамилия», «город», «е-mail», «адрес», «телефон», «страна» и т.п. А также есть возможность создавать свои типы данных, описывающие содержание полей. Использование заданных типов позволяет OCR/ICR Engine добиться наивысшего качества распознавания.
- Автоматическая идентификация шаблона.
- При обработке в одном потоке форм различных типов программа будет автоматически выбирать нужный шаблон.
- Возможность обработки гибких форм с помощью технологии ABBYY FlexiCapture.