Служба "Цитаты в новостях" позволяет отличать слухи от фактов
Новая служба Яндекса "Цитаты в новостях" позволяет искать высказывания людей в сообщениях СМИ. Самые популярные высказывания и самые цитируемые за последние сутки авторы представлены на главной странице сервиса. Это новостная картина дня в прямой речи главных действующих лиц. "Цитаты в новостях" стали следующим после пресс-портретов применением технологии извлечения фактов (fact extraction), разработанной в Яндексе.
В основе технологии выделения цитат лежит синтаксический анализатор и модуль обработки предикативных конструкций с коммуникативными глаголами и оборотами. Выделяется как прямая речь в кавычках, так и косвенная речь, выраженная придаточными предложениями ("Иванов отметил, что ...") и вводными оборотами ("по словам Иванова, ..."). Использование результатов извлечения всех фактов о человеке и полный анализ всего новостного сообщения позволяют с высокой точностью различать однофамильцев при определении автора высказывания, даже если в предложении с цитатой никакой дополнительной информации кроме имени и фамилии указано не было.
Цитаты - это еще один важный тип информации о ньюсмейкере. Из персонального пресс-портрета можно перейти ко всем его цитатам и наоборот - для каждого автора посмотреть его цитаты в пресс-портретах. Служба "Цитаты в новостях" расширяет справочную часть Яндекс.Новостей - теперь, в дополнение к миллиону пресс-потретов, пользователь может искать по 3,5 млн цитат более 600 тыс. авторов. Новостная служба Яндекса была открыта шесть лет назад, сегодня в базе Яндекс.Новостей хранится более 14 млн информационных сообщений от 1500 источников.
В основе технологии выделения цитат лежит синтаксический анализатор и модуль обработки предикативных конструкций с коммуникативными глаголами и оборотами. Выделяется как прямая речь в кавычках, так и косвенная речь, выраженная придаточными предложениями ("Иванов отметил, что ...") и вводными оборотами ("по словам Иванова, ..."). Использование результатов извлечения всех фактов о человеке и полный анализ всего новостного сообщения позволяют с высокой точностью различать однофамильцев при определении автора высказывания, даже если в предложении с цитатой никакой дополнительной информации кроме имени и фамилии указано не было.
Цитаты - это еще один важный тип информации о ньюсмейкере. Из персонального пресс-портрета можно перейти ко всем его цитатам и наоборот - для каждого автора посмотреть его цитаты в пресс-портретах. Служба "Цитаты в новостях" расширяет справочную часть Яндекс.Новостей - теперь, в дополнение к миллиону пресс-потретов, пользователь может искать по 3,5 млн цитат более 600 тыс. авторов. Новостная служба Яндекса была открыта шесть лет назад, сегодня в базе Яндекс.Новостей хранится более 14 млн информационных сообщений от 1500 источников.