VoiceXML: о чем идет речь?
Переход инфраструктуры вашей организации к среде, основанной на IP – совсем не простое дело, особенно в случаях, когда затрагиваются сервисы по работе с клиентами. До той поры, пока вам для работы с потребителями не требуется крупный центр обработки звонков, способный обеспечить все возможные аспекты работы с ними, вам необходима определенная степень автоматизации такой работы.
VoiceXML способен оказать помощь в осуществлении этой автоматизации. Несмотря на то, что технология VoiceXML не нова, она набирает обороты, и все больше корпораций переходят на инфраструктуру, базирующуюся на IP. В своей основе VoiceXML является не специфическим языком, а XML-грамматикой, которая позволяет создавать приложения, способные сделать информацию, основанную на веб-технологиях, доступной пользователям посредством голоса и телефона.
VoiceXML не является проприетарной технологией, принадлежащей какой-либо одной корпорации. Напротив, им управляет VoiceXML Forum (www.voicexml.org), среди участников которого можно назвать AT&T, IBM, Lucent и Motorola. Поскольку VoiceXML позиционируется как веб-стандарт, он был предложен на одобрение World Wide Web Consortium (W3C): версия 1.0 была одобрена в марте 2000-го года, а версия 2.0 - в апреле 2004 года. Если вы заинтересовались VoiceXML, то можете отыскать спецификации наhttp://www.w3.org/TR/2003/CR-voicexml20-20030128.
соединяя точки
Предпринималось множество попыток наладить мостик между компьютером и клиентами, использующими телефон. Наибольшая дистанция пролегает между основанной на тексте технологией WAP (Wireless Application Protocol) и VoiceXML, использующем голосовую технологию. В некоторых случаях названные технологии сходны в условиях своего осуществления, но в то время, когда WAP – это чистый текст, пригодный для КПК или сотовых телефонов, VoiceXML основан на фундаменте, уже используемым в сфере работы с клиентами – голосе. Имеются проприетарные системы распознавания голоса (или, как их иногда называли, Interactive Voice Response System), которые использовались на протяжении десятилетий, и с которыми потребители уже знакомы. VoiceXML объединяет эту узнаваемость с инструментами доставки веб-контента непосредственно потребителю.
Представим ситуацию: вы звоните в Delta Airlines по их линии низкого тарифа Song и хотите зарезервировать или поменять билет. С помощью линии 800/FlySong пользователь может подобрать рейсы, проверить расписание полетов, сравнить затраты и отследить путь багажа. Большинство авиакомпаний будут нуждаться в содействии людей-служащих на некоторых этапах названного процесса, но TellMe Networks (www.tellme.com/) поставляет практически всю требуемую информацию с помощью VoiceXML.
Похоже на то, что мы наблюдаем развитие голосовых порталов в качестве бизнес-модели. Большинство таких голосовых порталов в той или иной степени используют VoiceXML. Эти порталы предоставляют возможность доступа к веб-данным (например, спискам, биржевым котировкам, телефонным номерам и различным указаниям) с помощью интерфейса, построенного на естественном языке. Вот цифры, свидетельствующие в пользу голосовых порталов: в мире более миллиарда телефонов, в то время как число подключенных к Internet персональных компьютеров ограниченно примерно 250 миллионами. И если КПК, возможно, когда-нибудь смогут вытеснить сотовые телефоны, трудно представить себе сценарий более удобный для пользователя, чем возможность обратиться с вопросом по телефону к системе, построенной на VoiceXML.
как работает VoiceXML
VoiceXML обманчиво прост. Как правило, когда вы разрабатываете VoiceXML-приложение, вы создаете дерево, которое проводит пользователя через серии вопросов, в большинстве требующих простого ответа. Приложение, используя технологию распознавания голоса, конвертирует ответы в текст, ведущий к следующему уровню дерева.
Структура VoiceXML-приложения довольно проста. При открытии сессии пользователь находится в диалоговом режиме и перемещение от раздела к разделу означает навигацию по меню. Обратная связь с сервером осуществляется через формы (подобно тому, как пользователь вносит данные в поля HTML-форм), которые заполняются данными, сообщаемыми голосом или, иногда, нажатиями клавиш (посылка тонов DTMF). Ввод более сложных данных может быть облегчен с помощью ECMAScript.
Поскольку VoiceXML – это XML, приспособленный для специфических задач, вы можете писать код напрямую, с использованием XML-редактора или же в комбинации с Java-оболочкой. Например, имеется ряд инструментов разработки VoiceXML-приложений, включающих Café от BeVocal (cafe.bevocal.com).
будущее VoiceXML
VoiceXML Forum продолжает работы по совершенствованию VoiceXML. На протяжении нескольких месяцев ведутся работы над версией 3.0. Следующий этап для VoiceXML-приложений – это сервисы, использующие определение местоположения пользователя. TellMe предлагает сейчас такие варианты, базирующиеся на Caller ID звонящего. В будущем информация будут передаваться исходя из данных GPS- или E9111-позиционирования.
Однако настоящие проблемы VoiceXML относятся не к аспектам дальнейшей разработки языка, а скорее исходят из отношения общества к передаче информации машине по телефону. Много людей все еще ощущает неудобство при телефонном «разговоре» с неким анонимным голосом, эти люди хотят взаимодействовать только с другим человеком. В итоге, VoiceXML-приложения вряд ли способны полностью заменить центры обработки звонков, но они определенно способны стать важной частью работы с клиентами.
Kevin Reichard, перевод Алексея Кутовенко.
Сетевые решения. Статья была опубликована в номере 06 за 2004 год в рубрике технологии