Решения для голосовых порталов

определение

Первоначальное значение голосового портала можно определить как «возможность голосового доступа к сетевой информации». Другими словами, голосовой портал предоставляет возможность абонентам телефонной сети с интерфейсом на естественном языке получать доступ к содержимому сети.

сетевые службы нового поколения

Что же собой представляют сети следующего поколения? Это следующий шаг в сфере мировых коммуникаций, традиционно обеспечиваемых тремя отдельными сетями: общая телефонная, беспроводная (голосовая) сеть и сеть передачи данных (Интернет). Сети нового поколения объединяют все три вида сетей в один общий пакет инфраструктуры. Эта интеллектуальная, очень эффективная инфраструктура предоставляет универсальный доступ и массу новых технологий, приложений и возможностей обслуживания.

Три типа услуг управляют сетями нового поколения: коммуникационные службы в режиме реального времени и в защищенном режиме, ассоциативное обслуживание и операционные услуги. Эти службы предоставляют поставщикам услуг больше контроля, защиты и надежности, в то время как их эксплуатационные расходы сокращаются. И провайдеры могут быстро и рентабельно формировать новый доход.

Построенные на основе открытых модульных элементов, стандартные протоколы и открытые интерфейсы в сетях следующего поколения удовлетворяют специфическим потребностям любых единичных пользователей или предприятий, удаленных офисов, дистанционных пользователей, а также малых офисов или офисов на дому (SOHO). Это объединяет традиционную проводную линию связи и беспроводную голосовую, использующую основанный на пакетах способ передачи данных и видео файлов. Новый класс услуг, который это допускает, является более гибким, масштабируемым и дешевым, чем услуги, которые предлагались в прошлом.

Один из видов сетей следующего поколения – голосовой портал, предоставляющий пользователям в любом месте, в любое время доступ к информации подобно новостям, погоде, биржевым ценам и остаткам на счете, используя простые голосовые команды и телефон. Голосовые порталы находятся на пороге становления, следующим большим шагом в сфере коммуникаций. Организации, использующие их, будут иметь реальную возможность в дифференциации своего рынка от конкурентов, привлекая лояльных клиентов, увеличивая их доходы.

развертывание сетевых служб следующего поколения

Разрешение коммуникационных проблем следующего поколения основано на открытых, гибких блоках со стандартной базой. Причины ясны – с открытыми алгоритмами нет необходимости с нуля создавать службы электронной коммерции с поддержкой голоса в сетях нового поколения. Использование модульных стандартных блоков облегчит и сделает возможным добавление новых особенностей, услуг, и увеличит ценность существующих систем. Это все составляет в целом мощные, допустимые алгоритмы, которые защищают ваши инвестиции и инвестиции ваших клиентов. Сети следующего поколения основаны на серверах средств массовой информации, которые предоставляют исключительные возможности обработки этой информации. Ценность такого сервера СМИ заключается в его гибкости в предоставлении услуг, таких как голосовые объявления, интерактивный автоответчик (IVR), конференц- связь, обмен сообщениями, речевое воспроизведение текста (TTS), и распознавание речи. Основанные на открытых, стандартных компонентах и обрабатывающих голос надстройках, серверы СМИ могут быть организованы различными способами. Например, платформа голосового портала – это сервер СМИ, предоставляющий управляемый голосом пользовательский интерфейс с простым распознаванием речи и возможностью TTS, обеспечивающий доступ клиента к информации в сети Internet, возможность обмена сообщениями, или все вместе.

Сегодня голосовые порталы - это лишь вершина айсберга, первый шаг в изменении способа общения человека с Интернетом, и, в конечном итоге, ведения бизнесменами и потребителями коммерческой деятельности через Интернет. За следующие несколько лет, голосовые порталы (а также и основные технологии, на которых они основаны) смогут в корне изменить способ использования людьми их телефонов, способ коммерческой деятельности между людьми, общения предпринимателей с их клиентами.
Голосовые порталы изменяют взаимодействие между абонентами телефонной сети от центральных поставщиков к основным клиентам, увеличивают опыт, удовлетворяя требованиям клиентов, снижая цены и повышая эффективность для улучшения условий коммерческой деятельности. Голосовой портал обеспечивает абонентов телефонной сети интерфейсом на естественном языке, и как следствие, доступом к данным сети. Интернет – браузер может предоставлять доступ к сети через компьютер, но не через телефон! Голосовой портал – путь к решению этой проблемы. Конечно, простой доступ и поиск информации – это только начало. Голосовой портал может также предоставить пользователю доступ к виртуальным личным помощникам и объединенным сетевым службам передачи сообщений.
Голосовые порталы могут также сократить эксплуатационные расходы, заменяя людей – операторов удобными в использовании автоматизированными системами. Они также обеспечивают новые виды дохода, открывая возможность для подписных новых услуг или доход за счет рекламы.

Порталы - это новый предел мечтаний в конвергенции, слияния Интернета и телекоммуникаций, стирая границы между голосом и данными, компьютерами и телефонами. И, как для любого предела, награда огромна.

Система связи голосовых порталов основана на передаче пакетов, сочетание аппаратных средств ЭВМ и системы программного обеспечения для создания устойчивой электронной коммерческой среды и решения проблемы голосового общения посредством голосовых порталов. Объединение мощи серверов данных и телефонии сосредотачивают управление в единой, интегрированной системе связи, находящейся под контролем лидера в области поставки услуг и оборудования, основанного на речевых технологиях.

почему сейчас?

Когда Александр Грэм Белл (Alexander Graham Bell) сказал, " Уотсон, подойдите; Вы мне нужны, " вместо, " Уотсон, который час? " он невольно сообщил о потребности в мощном новом способе связи. В последующее столетие, и позже, ученые обещали появление системы телефонного доступа к простым информационным услугам подобно времени - или более продвинутым услугам, как, например, торговля акциями или управление счетами. Но тот огромный потенциал полностью никогда не раскрывался.

Было несколько причин. Например, телефонная клавиатура ограничивает пользователя в выборе. Также телефон не прост в отношении навигации, например переход от одного источника информации к другому не возможен без возврата в основное меню. В области беспроводных коммуникаций эту проблему решили с помощью стандарта, легкого браузера и протокола для телефонов, как прикладной протокол передачи данных через Интернет для мобильных телефонов (WAP). Однако, этот интерфейс в наше время может быть еще недоступен пользователям находящимся в движении.

Также не было коммерческой заинтересованности в Интернете на крупные поставки. Большинство информационных поставщиков в телефонных сетях берут с пользователей плату за информацию о спортивных результатах или даже погоде. Но есть пределы той сумме, которую абоненты готовы заплатить за подобные услуги.

Почему же теперь пришло время предоставить пользователям мобильных телефонов доступ к обширным информационным ресурсам? Да потому, что очень многое изменилось за последние несколько лет, структура коммуникационной индустрии, технологии и ожидания пользователей.

Сначала отмена госконтроля на телекоммуникации дала мощный толчок появлению нового класса поставщиков услуг, которым требовалось обособиться от конкурентов на жестком рынке связи. Службы на основе голосовых порталов - путь к этому. Они предоставляют исключительные возможности, тем самым, обеспечивая себе место в конкурентоспособной среде. И каждый такой поставщик хочет стать новым Yahoo или AOL.
Голосовые порталы дают возможность поставщикам услуг возможность расширения числа их клиентов. В тоже время существующие каналы и операторы Интернет – сайтов располагают огромными базами данных. Также они могут поддерживать телефонные приложения с минимальными затратами. И коммерческие модели, имеющие успех в сети – основанные на рекламе, нежели оплате – могут быть легко приспособлены для доступа в Интернет с помощью телефона.

Технологии также совершенствовались. Технология распознавания речи сыграла особенно драматическую роль, сопровождаясь сильным увеличением сложности обработки. TTS технологии также улучшились. Принятие стандартного языка подготовки сценариев, как голосовой XML, сможет поддерживать развитие голосовых порталов, так же, как HTML поддерживает развитие Интернета. Стоимость создания платформы для голосовых порталов продолжает снижаться. Увеличение плотности и уменьшение цен на обработку голоса и аппаратных средств ЭВМ интерфейса сети позволяет поставщикам служб обслуживать больше пользователей с меньшими затратами.

Интернет, в конце концов, оправдал ожидания публики. Пользователи Интернета привыкли получать информацию одним лишь нажатием кнопки. И раз люди уже ожидают мгновенного доступа к информации в Интернете - возьмем, например, электронную коммерцию, курсы акций и продаж, платежные чеки, трансферные фонды, - то следующим логическим шагом будет доступ к такого рода информации по телефону.

Для тех, у кого нет компьютера, телефон является наиболее естественным способом пересечения цифрового барьера и дверью в новый мир возможностей доступа к информации. По сути, число людей, имеющих доступ к телефону, приблизится в 2004 году к 4,9 миллиардам, в то время как количество людей, обладающих доступом в Интернет, составит приблизительно 800 миллионов. (Источник: Telsurf Networks.) И так как все больше людей будут пользоваться сотовыми телефонами, то им потребуется постоянный доступ к информации, даже если они находятся вне своего дома или офиса. Все вместе эти факты сходятся к следующему. Интернет, разработанный как информационная среда, быстро становится коммуникационной средой. Телефон был создан как средство коммуникации, но сейчас превращается в еще одну информационную среду со своими голосовыми порталами. А в цифровом мире коммуникация и информация сходятся в поток цифр, к которому с легкостью могут обращаться много устройств - где и когда угодно человеку. Кто предоставляет голосовые порталы?

Индустрия голосовых порталов все еще развивается, бизнес-планы меняются с большой скоростью, и в перспективе возможны еще слияния и перетасовки. Сегодня сервис голосовых порталов в основном организуют первые компании, появившиеся в этой области, веб-порталы, а также сетевые провайдеры.

Стартовые компании голосовых порталов.Основной бизнес этих компаний - создание, хостинг и маркетинг услуг голосовых порталов, направленных на определенную аудиторию. Возьмем, к примеру, HeyAnita, чей голосовой портал предоставляет разнообразный набор информационных услуг напрямую фирмам и потребителям. HeyAnita дебютировала на рынке голосовых порталов в конце 2000г.

Веб-порталы.Вторым соискателем на рынке является традиционный Интернет-портал, расширяющийся в сферу телефонии. AOL, например, недавно приобрела Quack.com, для того чтобы пользователи могли получить доступ к AOL по телефону. Легко понять все преимущества, которые получает веб-портал, дополненный голосовой службой. Кэтти Кинней, директор по развитию MapQuest, сказала в интервью Wall Street Journal: "Как и у любого Интернет-портала, наша аудитория ограничивалась людьми, выходящими в Интернет с помощью различных компьютероподобных устройств. Мы посмотрели на телефон и воскликнули: "Ну и ну, это же отличный способ добраться до нас соседке через дорогу, и для этого ей понадобится всего лишь телефон на кухне, который она использовала всю жизнь"". (Wall Street Journal, 20 июня, 2000)

Сетевые провайдеры.Третьими по счету в работе на рынке голосовых порталов идут телекоммуникационные и Интернет-провайдеры (ISP). Эти провайдеры стремятся повысить свою востребованность у покупателей и максимизировать сетевое использование фирменных порталов, размещенных на их машинах, а также заполучить сторонних поставщиков. Например, Talk2.com - партнер компаний беспроводной связи, которые хотят добавить значимости своим контрактам. Telera, Netbytel и iBasis являются примерами хостинговых провайдеров, позволяющих ISP и стартовым компаниям голосовых порталов расширять использование голосовых услуг без необходимости создавать и поддерживать инфраструктуру технологии. ISP нет необходимости быть экспертом в конкретной технологии или ее применении, например, в распознавании речи или телекоммуникации. Вместо этого ISP сосредотачивают усилия на запуске новых служб и их дальнейшем развитии. Все эти провайдеры, предоставляющие услуги хостинга, основаны на технологии Intel®, позволяющей им изменять и масштабировать свою структуру, с тем чтобы отвечать растущим запросам ISP. Вкратце, ISP могут выбрать оптимальное приложение, отвечающее их модели бизнеса, и сосредоточиться на привлечении и сохранении клиентов, а не на поддержании технологии.

направления развития технологии

Несколько тенденций технологии разжигают интерес к голосовым порталам. Наиболее интересной является голосовая технология, развившаяся с головокружительной скоростью за последние несколько лет. Большинство аналитиков прогнозируют ее дальнейшее развития со скоростью 31% в год, который уже наблюдается с 1999 по 2004.

программы автоматического распознавания речи (ASR)

Автоматическое распознавание речи (ASR) быстро становится одним из основных направлений. Ранние голосовые приложения распознавали лишь небольшой набор из 20-30 слов, но точность и размер словаря механизмов ASR сейчас серьезно увеличились, чему способствовали улучшенные алгоритмы, серьезное увеличение вычислительных мощностей и уменьшение затрат. Сегодняшние речевые системы поддерживают общеупотребительные фразы и не требуют предварительного обучения.
Ведущими поставщиками ПО распознавания речи являются IBM, Nuance, Philips Electronics NV, а также SpeechWorks International. В США популярны поддерживающие несколько языков программы от Nuance и SpeechWorks.

обработка связной речи (CSP)

Технология CSP из семейства продукции Dialogic не требует специфических аппаратных средств для работы с речью. CSP оптимизирует
производительность централизованных механизмов распознавания речи путем разделения обрабатываемых данных на два потока - телефонных плат (аналоговых, T1, E1) и ЦП центрального компьютера. Из-за того, что CSP поддерживает аппаратные средства из семейства продуктов Dialogic, она используется при препроцессорной обработке данных; для распознавания речи лучше подходит централизованная система.

Системы, созданные на основе CSP, обеспечивают большую мощность, так как разгружают ЦП благодаря модулям обработки цифрового сигнала (DSP) - таких как высококачественный гаситель эха, детектор голосовой активности (VAD), преречевая буферизация. Это позволяет освободить процессор от бесполезной продолжительной обработки бесполезных данных, например, тишины.

Поддерживая до 120 портов на плату, программное обеспечение CSP обладает унифицированным программным интерфейсом (API) для расширенных возможностей по масштабированию системы. Разработчики могут добавлять сотни портов для речи, при этом все равно функции распознавания речи будут выполняться эффективно и качественно. Положительным моментом также является огромная экономия на инфраструктуре и развертывании системы. Преобразование текста в речь

Как только информация получена, ее нужно передать пользователю. Одним из способов является преобразование текста в речь (TTS). TTS все больше и больше используется для воспроизведения по телефону текстов электронных писем и содержания страниц, а в будущем он будет играть еще более важную роль. Реальное использование TTS, как, например, чтение электронной почты по телефону, возможно с использованием препроцессорных средств, поддерживающих так называемые "грязные" данные - акронимы, контрактуры, изменения интонации. Lernout & Hauspie является ведущим производителем TTS с мультиязыковой поддержкой.

VoiceXML

Так же, как при росте Интернета возникла необходимость в разработке стандарта HTML, при продвижении голосовых услуг необходимо принятие для них своего универсального стандарта.
Voice eXtensible Markup Language (VoiceXML) является главным стандартом для голосовых услуг. Он позволит провайдерам предлагать пользователям в сети услуги, имеющие голосовой интерфейс. Он поддерживает синтезированную речь для TTS, голосовой ввод, распознавание двухтонального многочастотного набора (DTMF), запись голосового ввода, управление с телефона. Предприятия могут создавать автоматизированные голосовые сервисы с помощью той же технологии, которую они используют для создания визуальных Веб-узлов, серьезно снижая затраты на разработку и информирование пользователей телефонов о новых услугах. Так как используются устоявшиеся Веб-технологии, интеграция с серверными базами данных проходит аналогично приложениям HTML.

VoiceXML, работы над которым начались в AT&T Bell Laboratories, совмещает в себе языки разметки Lucent и AT&T Markup, а также SpeechML от IBM и VoxML от Motorola. Большинство ведущих разработчиков в сфере голосовых языков являются участниками форума VoiceXML.

новые способы тестирования

Успех голосовых приложений зависит от таких факторов, как голосовые подсказки или других интерактивных моментов. Поэтому важно уметь своевременно применять усвоенные уроки в новых версиях приложений.

Провайдеры голосовых технологий создали мощные инструменты для ускорения развертывания. Один высокоуровневый апплет, к примеру, содержит множество данных о методе работы приложения, наиболее часто используемых функциях. Это может ускорить процесс создания конечного приложения с 30 человек-лет до месяцев и даже недель.

беремся за дело

Разработка решений для голосового портала - задача более сложная, чем просто соединение вместе отдельных компонентов. Провайдерам необходимо сконцентрироваться на своем бизнесе - клиентах и торговых марках - а не на технологиях. Время - это все, а для того, чтобы попасть на рынок быстро, необходим опытный партнер, понимающий как технологию, так и требования конкурирующих провайдеров. А также необходимо увеличение скорости Интернета. Провайдеры и разработчики ищут поставщиков, которые бы обеспечили их набором открытых, стандартных блоков для создания программ, что бы обеспечило им максимальную гибкость.
Еще одним часто упускаемым из вида фактором является важность сервисов поддержки, подготовки, справочных сервисов. Эти услуги, позволяющие быстрее разработать и развернуть голосовой портал, являются неотъемлемой частью всего предлагаемого продукта в целом. И хотя многие продавцы утверждают, что располагают консалтинговыми центрами, важно проверить, насколько эти службы хорошо работают, прежде чем определиться с выбором партнера.

У поставщика услуг есть выбор из трех основных возможностей при развертывании голосового портала:
1. Создать и развернуть портал самостоятельно.
2. Купить систему у стороннего производителя.
3. Воспользоваться хостингом для своей услуги.
Вне зависимости от пути, которым пойдет провайдер, ему важно учитывать следующее при выборе системы и поставщика:
• Состоит ли данное решение из открытых стандартных компонентов?
• Является ли оно масштабируемым?
• Существует ли ясная и обозримая перспектива развития?
• Позволяет ли платформа достаточно легко добавлять/изменять доступные услуги?
• Предоставляет ли продавец необходимую поддержку?
• Возможно ли обучение?
• Насколько хороши предлагаемые продавцом консалтинговые услуги для дизайна, планирования, установки?

создание

Сегодня многие провайдеры предпочитают покупать все компоненты решений для голосовых порталов (включая голосовые платы, сетевой интерфейс, инструменты разработки ПО, платформы приложений, а также необходимое вычислительное оборудование) и создавать порталы самостоятельно. Один из вариантов - покупка аппаратных компонентов по отдельности, интегрирование платформы и разработка приложения. В качестве альтернативы они могут выбрать преимущества конструктивного блока нового уровня - так называемой "готовой платформы". Это заранее настроенная серверная платформа, содержащая в себе всю необходимую аппаратную голосовую часть, на которой они могут основывать свой сервис.

В любом случае, обучение и профессиональные службы поддержки помогут им собрать компоненты решения вместе быстрее и легче, без необходимости привлекать специализированные ресурсы для разработки.

Создание решений предпочтительно для провайдеров, потому что обеспечивает полный контроль над стоимостью и изменяемостью конфигурации. Провайдер может выбрать необходимый ему набор компонентов и лучшую цену на них в зависимости от их количества. При таком подходе потребности провайдеров целиком удовлетворяются.

Тем не менее, создание собственного решения имеет свои недостатки. Дело в том, что не всем под силу решить задачу интегрирования всех приобретенных компонентов. Цена необходимого для этого опыта высока, особенно если такого рода задачи не являются основными в бизнесе.

покупка

Так как создание собственного решения подходит не всем, для провайдеров, желающих сфокусироваться собственно на поставке, а не на интеграции, существует множество других вариантов. Рынок голосовых порталов растет, и у провайдеров появляется выбор среди множества разработчиков голосовых порталов, уже располагающих передовыми приложениями. Сюда относятся, например, доступ к Интернету, интегрированная система обработки сообщений, виртуальные личные помощники.

При поиске готовых решений провайдерам следует обращаться к продавцам, располагающим всеми перечисленными выше компонентами (голосовые платы, сетевой интерфейс, инструменты разработки ПО, платформы приложений), а также необходимое вычислительное оборудование - и все это в одном решении. В такой комплектации решения для голосовых порталов могут получать свою торговую марку и распространяться в большом количестве. Кроме того, отдельные аппаратные компоненты могут быть оптимизированы для определенной конфигурации, что повышает надежность и обеспечивает бесперебойную работу. Приложения, построенные на таких выверенных платформах, могут быть полностью готовыми к использованию продуктами или наборами, позволяющими легко вносить необходимые модификации.

хостинг

С другой стороны, "экосистема" Интернета пришла к такому виду, что место, оборудование, информация могут использоваться в качестве хоста третьими лицами. Рынок голосовых порталов движется в том же направлении.

Хорошо организованное хостинговое решение - это конфигурации с хорошей пропускной способностью, обеспечивающие благодаря мониторингу зависящую от целевого назначения надежность. Провайдеры могут развертывать решения практически сразу. Им не приходится заботиться об оборудовании или пропускной способности. Вместо того, чтобы думать о технологии, провайдер может подумать о бизнесе. Время, необходимое на приобретение и запуск, быстро уменьшается, для чего провайдеры привлекают сторонних экспертов, полностью концентрируясь на деловой части, а не на технологии.



По материалам Internet.


Сетевые решения. Статья была опубликована в номере 05 за 2005 год в рубрике решения

©1999-2024 Сетевые решения