Система распознавания речи ДИКТАНТ 2.5

В
озможность управления компьютером при помощи голоса волнует очень и очень многих. Если даже не обращать внимание на то, как эта процедура предстает в современных фантастических и не очень фантастических кинофильмах, тем не менее практически каждому пользователю очевидны все достоинства подобного варианта управления. А если указанная система позволяет еще и надиктовывать текст в какой-нибудь популярный текстовый редактор, например Microsoft Word, то ей цены не будет.

Одной из самых популярных программ указанного назначения является интегрированный пакет DRAGON DICTATE американской компании Dragon System Inc. Адаптированный русскоязычный вариант данной программы получил наименование ДИКТАНТ и уже выпущен в версии 2.5.

ДИКТАНТ 2.5 представляет собой автоматическую самонастраиваемую систему, поддерживаемую практически всеми приложениями для операционной системы Microsoft Windows 95/98. ДИКТАНТ 2.5 "помнит" около двух сотен базовых команд и распознает их произнесение в микрофон, что позволяет заменить ручное выполнение какой-либо команды, например выбор конкретного пункта меню, на простую отдачу голосом распоряжения на выполнение той или иной команды.

Встроенный модуль самонастройки обеспечивает подгонку ДИКТАНТ 2.5 даже под те приложения, которые пакет самостоятельно не подхватывает.

Самонастройка заключается в наборе с клавиатуры в специальном окне наименования новой команды и ее произнесении в микрофон для того, чтобы ДИКТАНТ 2.5 "запомнил" и в дальнейшем не путался. При помощи некоторого набора кодовых слов программу можно переводить из режима управления в режим набора и обратно.

То есть в одно и то же время пользователь может и надиктовывать любой текст, и тут же переключаться на управление самим текстовым редактором для выполнения каких-либо его сервисных функций, например, поиск синонима, поиск и замена сокращения, отдельного слова или даже целого предложения.

К несомненным достоинствам как оригинальной версии программы, так и ДИКТАНТ 2.5 следует отнести чрезвычайно высокую стойкость к внешнему шуму.

Эксперименты показали, что при корректной настройке программа весьма эффективно "слушается голоса", даже в очень зашумленном помещении и при работающей посторонней технике, например такой, как телевизор и радиоприемник. При этом оператор может говорить в обычной манере, не повышая голоса и тем более не крича.

Кстати говоря, ДИКТАНТ 2.5 обеспечивает еще и достаточно точную подгонку системы распознавания под индивидуальные характеристики произношения каждого конкретного человека, что также значительно повышает результативность ДИКТАНТ 2.5. Среди всего прочего, например, пакет позволяет варьировать восприятие длительности пауз между словами в предложении, между предложениями и даже автоматически выделять в тексте то, что диктор выделяет при помощи интонаций. Между прочим, этот же механизма настроек крайне высоко зарекомендовал себя и при распознавании слитной речи, ранее считавшейся неподходящей для машинных алгоритмов распознавания. В ДИКТАНТ 2.5 оператор может чуть ли ни монотонно читать достаточно сложный текст и быть уверенным, что программа распознает все достаточно корректно.

В своей работе ДИКТАНТ 2.5 опирается на набор подключаемых библиотек, большая часть которых поставляется вместе с программной. Есть библиотеки общего назначения: как тематические, так и языковые (они поставляются в базовом комплекте программного обеспечения); а есть - специализированные.

Некоторые из них имеются на компакт-диске и нуждаются лишь в дополнительном подключении уже после инсталляции пакета, а некоторые приобретаются отдельно. Любая из библиотек в любой момент может быть отредактирована или дополнена по желанию пользователя.

Единственным "узким" местом пакета ДИКТАНТ 2.5 является его повышенная требовательность к аппаратной части компьютера. Формально, программа требует для себя Pentium 100, 16 Мб оперативной памяти, операционную систему Microsoft Windows 95/98 и звуковую плату с микрофонным входом.

На практике эти системные требования действительно являются минимальными, но проблемы не редко возникают при распознавании ДИКТАНТ 2.5 звуковой платы и в особенности возможности записи с микрофона.

Довольно часто программа распознавания заявляет о каких-либо проблемах с микрофоном даже тогда, когда другие приложения этот микрофон вполне нормально "видят" и работают с ним без каких-либо сбоев.

В целом ДИКТАНТ 2.5 является доведенным продуктом и может стать по-настоящему действенным инструментом для тех, кому по роду деятельности приходится много и подолгу печатать на компьютере или чья работа связана с большой необходимостью часто обращаться к системным меню того или иного приложения.


Компьютерная газета. Статья была опубликована в номере 27 за 1999 год в рубрике дискотека :: разное

©1997-2024 Компьютерная газета