ABBYY делает шаг на восток
Компания ABBYY объявляет о выпуске новой версии инструментария разработчиков — ABBYY FineReader Engine 8.1. В новой версии реализовано распознавание документов на тайском языке и иврите. ABBYY FineReader Engine 8.1 - продукт, реализующий в рамках одного SDK распознавание текстов на 191 языке на базе латиницы, кириллицы, армянского, греческого, еврейского и тайского алфавитов, а также японских, корейских и китайских иероглифов.
Поддержка иврита и тайского - важный технологический этап в развитии продукта. В частности, и тайский язык, и иврит используют собственные знаковые системы. Причем в тайском тексте слова пишутся слитно, без пробелов, а буквы и диакритические (дополнительные) знаки могут располагаться в строке на четырех различных уровнях. В иврите используется «обратное» направление письма (справа налево), но в тех случаях, когда в тексте попадаются слова на другом языке, например, на английском, они пишутся слева направо.
В ABBYY FineReader Engine 8.1 также добавлена поддержка формата PDF/A. PDF/A (PDF/Archive) – это новый формат для электронных архивов, разработанный корпорацией Adobe. Он рекомендован в качестве стандартного (ISO 19005-1:2005) для задач длительного хранения документов. Документ в формате PDF/A полностью сохранит свой первоначальный вид независимо от условий просмотра - операционной системы и приложения, с помощью которого он будет открыт. Кроме того, появились возможности сохранять в форматах PDF и RTF документы на японском, китайском и корейском языках с вертикальным расположением текста и сложной версткой; внесен ряд других значимых усовершенствований.
Поддержка иврита и тайского - важный технологический этап в развитии продукта. В частности, и тайский язык, и иврит используют собственные знаковые системы. Причем в тайском тексте слова пишутся слитно, без пробелов, а буквы и диакритические (дополнительные) знаки могут располагаться в строке на четырех различных уровнях. В иврите используется «обратное» направление письма (справа налево), но в тех случаях, когда в тексте попадаются слова на другом языке, например, на английском, они пишутся слева направо.
В ABBYY FineReader Engine 8.1 также добавлена поддержка формата PDF/A. PDF/A (PDF/Archive) – это новый формат для электронных архивов, разработанный корпорацией Adobe. Он рекомендован в качестве стандартного (ISO 19005-1:2005) для задач длительного хранения документов. Документ в формате PDF/A полностью сохранит свой первоначальный вид независимо от условий просмотра - операционной системы и приложения, с помощью которого он будет открыт. Кроме того, появились возможности сохранять в форматах PDF и RTF документы на японском, китайском и корейском языках с вертикальным расположением текста и сложной версткой; внесен ряд других значимых усовершенствований.