ИВК представляет «ИВК СОНЕТ»
Компания ИВК объявляет о завершении разработки и начале продвижения на рынок нового программного продукта — Информационно-аналитической системы обработки неформализованных естественных текстов «ИВК СОНЕТ». Эта система позволяет госструктурам, силовым ведомствам, коммерческим предприятиям и общественным организациям создавать эффективные решения промышленного уровня для сбора, систематизации и анализа неструктурированной текстовой информации, полученной из всевозможных источников, включая информационные ресурсы Интернет, новостные ленты и обновляемые разделы сайтов, сообщения электронной почты, электронные документы различных форматов и др.
В итоге, значительно возрастает оперативность, точность и обоснованность решения таких задач, как глубокое изучение рынка, анализ действий конкурентов, «информационная разведка», идентификация информационных кампаний, выявление тенденций и как результат – принятие эффективных управленческих решений. Система «ИВК СОНЕТ» базируется на собственных технологиях и разработках компании ИВК в области лингвистической обработки неструктурированной информации, морфологического и синтаксического анализа текстов на русском языке. Синтаксический анализ выделяет простые предложения в составе сложного и устанавливает связи между словами. Технология морфологического анализа позволяет учитывать изменяемость слов, ярко выраженную в русском языке. В результате значительно возрастает полнота, точность поиска информации, а также увеличивается скорость обработки запроса.
Отдельные технологии, вошедшие в «ИВК СОНЕТ», в течение ряда лет прошли всестороннюю проверку в реальных системах обработки информации, относящейся к столь разным предметным областям, как чрезвычайные ситуации, спорт, нефтяной комплекс, судебная система, гуманитарная сфера и др. Вместе с тем, при создании программного продукта «ИВК СОНЕТ» данные технологии были значительно усовершенствованы по функциональности и производительности, а также интегрированы в единый комплекс инструментов для сбора и консолидации информации из различных источников, решения всевозможных задач по анализу собранного массива текстов, а также настройки системы на новые предметные области. Благодаря интуитивно понятному интерфейсу системы «ИВК СОНЕТ» для эффективной работы с ней требуется лишь минимальное обучение.
Подчеркнем, что вошедший в «ИВК СОНЕТ» набор функций достаточен для поддержки работы аналитика над задачами, критически важными практически для любой организации. В ПО «ИВК СОНЕТ» объединены средства сбора и консолидации информации, инструменты фильтрации и поиска, а также три вида аналитической обработки: классификация, кластеризация и контент-анализ. Встроенные средства и специальные программы-конверторы позволяют автоматически заносить в базу данных системы сообщения в наиболее распространенных форматах, включая TXT, HTML, XML, RTF, DOC, E-MAIL и др.
При этом «ИВК СОНЕТ» унифицирует формат полученной информации, проводит полнотекстовое индексирование сообщений, а также классификацию входного потока с использованием средств морфологического и синтаксического анализа. Система фильтрации и поиска позволяет формировать выборки на основе сложных запросов, в которых могут быть задействованы регулярные выражения, ключевые слова, временные интервалы и разнообразные атрибуты сообщения, например, автор, рубрика и т.д.
Классификация позволяет распределять сообщения по заданным рубрикам, набор и содержание которых как раз и задают привязку системы к конкретной предметной области. В этой связи необходимо отметить, что система «ИВК СОНЕТ» не накладывает технических ограничений на количество рубрик, число описывающих рубрику словосочетаний и на их длину. Это свойство системы, в сочетании с морфологическим и синтаксическим анализом, значительно повышает эффективность классификации, резко сокращает объем текстов, необходимых для обучения системы.
Кластеризация группирует информационные сообщения по степени близости их содержания к анализируемому в текущий момент тексту-ядру кластера. При этом заготовленный рубрикатор не требуется. Контент-анализ формирует список словосочетаний, составляющих «информационное окружение» анализируемого объекта. В реальных задачах этот вид аналитической обработки позволяет, в частности, выявлять наиболее проблемные (актуальные) вопросы «вокруг» анализируемого объекта. Реализованный в системе «ИВК СОНЕТ» контент-анализ позволяет отслеживать динамику изменения проблемных вопросов во времени.
В перспективе компания ИВК планирует дальнейшее развитие комплекса «ИВК СОНЕТ». В ближайших планах - внедрение функции тонального анализа, позволяющего выявлять сообщения с положительной, нейтральной и негативной эмоциональной окраской. Затем в систему будут включены функции создания семантической сети терминов, окружающих изучаемый объект, а также установления возможных транзитивных связей между объектами. Кроме того, компания планирует интегрировать систему «ИВК СОНЕТ » в среду «ИВК Юпитер », что расширит возможности анализа территориально-распределенных массивов текстовой информации, разграничения доступа к данным «ИВК СОНЕТ», безопасного обмена информацией между аналитиками и потребителями их услуг.
В итоге, значительно возрастает оперативность, точность и обоснованность решения таких задач, как глубокое изучение рынка, анализ действий конкурентов, «информационная разведка», идентификация информационных кампаний, выявление тенденций и как результат – принятие эффективных управленческих решений. Система «ИВК СОНЕТ» базируется на собственных технологиях и разработках компании ИВК в области лингвистической обработки неструктурированной информации, морфологического и синтаксического анализа текстов на русском языке. Синтаксический анализ выделяет простые предложения в составе сложного и устанавливает связи между словами. Технология морфологического анализа позволяет учитывать изменяемость слов, ярко выраженную в русском языке. В результате значительно возрастает полнота, точность поиска информации, а также увеличивается скорость обработки запроса.
Отдельные технологии, вошедшие в «ИВК СОНЕТ», в течение ряда лет прошли всестороннюю проверку в реальных системах обработки информации, относящейся к столь разным предметным областям, как чрезвычайные ситуации, спорт, нефтяной комплекс, судебная система, гуманитарная сфера и др. Вместе с тем, при создании программного продукта «ИВК СОНЕТ» данные технологии были значительно усовершенствованы по функциональности и производительности, а также интегрированы в единый комплекс инструментов для сбора и консолидации информации из различных источников, решения всевозможных задач по анализу собранного массива текстов, а также настройки системы на новые предметные области. Благодаря интуитивно понятному интерфейсу системы «ИВК СОНЕТ» для эффективной работы с ней требуется лишь минимальное обучение.
Подчеркнем, что вошедший в «ИВК СОНЕТ» набор функций достаточен для поддержки работы аналитика над задачами, критически важными практически для любой организации. В ПО «ИВК СОНЕТ» объединены средства сбора и консолидации информации, инструменты фильтрации и поиска, а также три вида аналитической обработки: классификация, кластеризация и контент-анализ. Встроенные средства и специальные программы-конверторы позволяют автоматически заносить в базу данных системы сообщения в наиболее распространенных форматах, включая TXT, HTML, XML, RTF, DOC, E-MAIL и др.
При этом «ИВК СОНЕТ» унифицирует формат полученной информации, проводит полнотекстовое индексирование сообщений, а также классификацию входного потока с использованием средств морфологического и синтаксического анализа. Система фильтрации и поиска позволяет формировать выборки на основе сложных запросов, в которых могут быть задействованы регулярные выражения, ключевые слова, временные интервалы и разнообразные атрибуты сообщения, например, автор, рубрика и т.д.
Классификация позволяет распределять сообщения по заданным рубрикам, набор и содержание которых как раз и задают привязку системы к конкретной предметной области. В этой связи необходимо отметить, что система «ИВК СОНЕТ» не накладывает технических ограничений на количество рубрик, число описывающих рубрику словосочетаний и на их длину. Это свойство системы, в сочетании с морфологическим и синтаксическим анализом, значительно повышает эффективность классификации, резко сокращает объем текстов, необходимых для обучения системы.
Кластеризация группирует информационные сообщения по степени близости их содержания к анализируемому в текущий момент тексту-ядру кластера. При этом заготовленный рубрикатор не требуется. Контент-анализ формирует список словосочетаний, составляющих «информационное окружение» анализируемого объекта. В реальных задачах этот вид аналитической обработки позволяет, в частности, выявлять наиболее проблемные (актуальные) вопросы «вокруг» анализируемого объекта. Реализованный в системе «ИВК СОНЕТ» контент-анализ позволяет отслеживать динамику изменения проблемных вопросов во времени.
В перспективе компания ИВК планирует дальнейшее развитие комплекса «ИВК СОНЕТ». В ближайших планах - внедрение функции тонального анализа, позволяющего выявлять сообщения с положительной, нейтральной и негативной эмоциональной окраской. Затем в систему будут включены функции создания семантической сети терминов, окружающих изучаемый объект, а также установления возможных транзитивных связей между объектами. Кроме того, компания планирует интегрировать систему «ИВК СОНЕТ » в среду «ИВК Юпитер », что расширит возможности анализа территориально-распределенных массивов текстовой информации, разграничения доступа к данным «ИВК СОНЕТ», безопасного обмена информацией между аналитиками и потребителями их услуг.