Смартфоны распознают эмоции

Если вы думаете, что способность вашего телефона найти ближайшую автобусную остановку - это круто, то как вы отнесетесь к возможности смартфона определять ваше настроение?

Исследования, которыми занимается команда инженеров из Университета Рочестера, скоро сделают это возможным. На семинаре IEEE по Разговорным Языковым Технологиям, который проходил 5 декабря 2012 года, исследователи продемонстрировали новую компьютерную программу, которая, с достаточно высокой точностью, анализирует человеческие чувства и эмоции с помощью речи.

Удивительно, но программа не обращает никакого внимания на смысл слов. "Мы использовали актеров, которые просто читают вслух календарь, называя дни недели и числа месяца, абсолютно не имеет значения, что именно они говорят, нам важно то, как они говорят", - говорит Вэнди Хенцельман, профессор кафедры вычислительной техники. Хенцельман пояснила, что программа анализирует дюжину особенностей и параметров человеческой речи, например такие, как высота и громкость, чтобы определить одну из шести основных эмоций. Сейчас программа достигла показателя точности 81% в определении человеческих эмоций, это значительно лучше, чем у ранних версий, которые могли похвастаться точностью лишь в 55%.

На основе этих исследований было создано и приложение для смартфона. Пока программа отображает только веселое либо грустное лицо после записи и анализа голоса пользователя. Программу написал один из аспирантов Хенцельман во время летней стажировки в Microsoft Research. "Исследование еще далеко от завершающей стадии, - добавила Хенцельман, - легко представить себе более сложные приложения, которые могут использовать данную технологию, от подстройки цветовой гаммы и графических шаблонов вашего мобильника до подбора музыки в соответствии с настроением пользователя". Хенцельман и ее команда сотрудничает с психологами Мелиссой Старж-Эппл и Патриком Дэвисом, которые изучают особенности взаимодействия между подростками и их родителями. Вот где практически все общение происходит на невербальном и эмоциональном уровне. "Надежный способ категоризации эмоций будет очень полезен для нашего исследования, - говорит Мелисса. - Исследователю больше не нужно слушать разговоры и самостоятельно определять эмоции собеседников на разных стадиях беседы".

Компьютер учится понимать эмоции так же, как это делают люди. Вы слышите чей-то голос и уже знаете, что человек на что-то сердится, или он находится в хорошем, приподнятом настроении, или его голос передает оттенки грусти... Эмоции влияют на то, как люди говорят, изменяя громкость, высоту и даже гармоники их речи. Чтобы классифицировать эмоции, компьютер должен работать с измеряемыми величинами. Таким образом, исследователи определили и установили 12 конкретных характеристик или функций речи, которые измерялись в каждой записи через короткие промежутки времени. Затем исследователи классифицировали каждый фрагмент записей и использовали их, чтобы научить компьютерную программу, какие именно изменения в голосе выражают "печаль", "счастье", "страх", "отвращение" или "нейтралитет". Затем система анализирует новые записи и пытается определить, похожи ли голосовые оттенки на любую из уже известных ей эмоций. Если компьютерная программа не смогла сделать выбор, определиться между двумя или более эмоциями, она просто не выдает результата. Предыдущие исследования показали, что система классификации эмоций имеет очень высокую зависимость от динамики, она работает гораздо лучше, если обучается тем же голосом, который предстоит анализировать. Поэтому система пока не готова к экспериментам с группами людей, которые ведут оживленную беседу; например, если обучение проводится на одном человеке, а тестирование на другом, то точность определения эмоций снижается до 30 процентов. Исследователи ищут способы минимизации этого эффекта, например, путем обучения системы по голосам одной возрастной группы или пола.

Игорь Грень


Компьютерная газета. Статья была опубликована в номере 03 за 2013 год в рубрике mobile

©1997-2024 Компьютерная газета