"ИВК Сонет" перенесена на СУБД Microsoft SQL Server
Компания ИВК завершила перенос информационно-аналитической системы обработки неформализованных естественных текстов "ИВК Сонет" на платформу СУБД Microsoft SQL Server. Новая версия доступна заказчикам. Система "ИВК Сонет" позволяет госструктурам, силовым ведомствам, коммерческим предприятиям и общественным организациям создавать эффективные решения промышленного уровня для сбора, систематизации и анализа неструктурированной текстовой информации.
Исходные данные могут быть получены из всевозможных источников, включая информационные ресурсы Интернет, новостные ленты и обновляемые разделы сайтов, сообщения электронной почты, электронные документы различных форматов и др. В ПО "ИВК Сонет" объединены средства сбора и консолидации информации, инструменты фильтрации и поиска, а также три вида аналитической обработки: классификация, кластеризация и контент-анализ.
При этом "ИВК Сонет" унифицирует формат полученной информации, заносит ее в БД, проводит полнотекстовое индексирование сообщений, а также классификацию входного потока с использованием средств морфологического и синтаксического анализа. ПО "ИВК Сонет" базируется на собственных технологиях ИВК в области лингвистической обработки неструктурированной информации, морфологического и синтаксического анализа текстов на русском языке. Эти технологии в течение ряда лет прошли всестороннюю проверку в реальных системах обработки информации, относящейся к столь разным предметным областям, как чрезвычайные ситуации, спорт, нефтяной комплекс, судебная система, гуманитарная сфера и др.
Внедрение подобных систем улучшает информационную поддержку принятия управленческих решений, повышает эффективность ключевых процессов взаимодействия предприятия с окружающей бизнес-средой, в частности, мониторинг и анализ деятельности конкурентов, прогнозирование динамики рынка и поведения потребителей, раннее выявление перспективных ниш бизнеса, ведение информационных кампаний и др.
Соответственно, серьезный интерес к таким системам начинают проявлять не только крупные организации национального масштаба, но и средний бизнес. Вместе с тем, использование до настоящего времени СУБД Oracle в качестве единственной возможной платформы "ИВК Сонет" не являлось оптимальным для этой категории заказчиков т.к. подразумевало высокие затраты на лицензирование и администрирование СУБД, особенно в тех случаях, когда организация уже использовала инфраструктуру управления данными на базе других СУБД. Именно поэтому перенос "ИВК Сонет" на другие популярные серверы баз данных стал важнейшим направлением развития этой информационно-аналитической системы.
Отметим, что основные функции системы "ИВК Сонет" реализованы на встроенном языке программирования сервера СУБД или во внешних модулях, которые активно используют фирменные интерфейсы прикладного программирования. Глубокие различия этих средств в СУБД разных разработчиков делают перенос "ИВК Сонет" на другие СУБД исключительно сложной задачей.
Сегодня она полностью решена, и в версии для Microsoft SQL Server в полном объеме реализованы все функции информационно-аналитической системы обработки неформализованных естественных текстов компании ИВК. Более того, в ходе данного проекта ряд модулей системы был перепроектирован таким образом, чтобы в дальнейшем упростить перенос и на другие СУБД, в первую очередь, с открытым исходным кодом.
Исходные данные могут быть получены из всевозможных источников, включая информационные ресурсы Интернет, новостные ленты и обновляемые разделы сайтов, сообщения электронной почты, электронные документы различных форматов и др. В ПО "ИВК Сонет" объединены средства сбора и консолидации информации, инструменты фильтрации и поиска, а также три вида аналитической обработки: классификация, кластеризация и контент-анализ.
При этом "ИВК Сонет" унифицирует формат полученной информации, заносит ее в БД, проводит полнотекстовое индексирование сообщений, а также классификацию входного потока с использованием средств морфологического и синтаксического анализа. ПО "ИВК Сонет" базируется на собственных технологиях ИВК в области лингвистической обработки неструктурированной информации, морфологического и синтаксического анализа текстов на русском языке. Эти технологии в течение ряда лет прошли всестороннюю проверку в реальных системах обработки информации, относящейся к столь разным предметным областям, как чрезвычайные ситуации, спорт, нефтяной комплекс, судебная система, гуманитарная сфера и др.
Внедрение подобных систем улучшает информационную поддержку принятия управленческих решений, повышает эффективность ключевых процессов взаимодействия предприятия с окружающей бизнес-средой, в частности, мониторинг и анализ деятельности конкурентов, прогнозирование динамики рынка и поведения потребителей, раннее выявление перспективных ниш бизнеса, ведение информационных кампаний и др.
Соответственно, серьезный интерес к таким системам начинают проявлять не только крупные организации национального масштаба, но и средний бизнес. Вместе с тем, использование до настоящего времени СУБД Oracle в качестве единственной возможной платформы "ИВК Сонет" не являлось оптимальным для этой категории заказчиков т.к. подразумевало высокие затраты на лицензирование и администрирование СУБД, особенно в тех случаях, когда организация уже использовала инфраструктуру управления данными на базе других СУБД. Именно поэтому перенос "ИВК Сонет" на другие популярные серверы баз данных стал важнейшим направлением развития этой информационно-аналитической системы.
Отметим, что основные функции системы "ИВК Сонет" реализованы на встроенном языке программирования сервера СУБД или во внешних модулях, которые активно используют фирменные интерфейсы прикладного программирования. Глубокие различия этих средств в СУБД разных разработчиков делают перенос "ИВК Сонет" на другие СУБД исключительно сложной задачей.
Сегодня она полностью решена, и в версии для Microsoft SQL Server в полном объеме реализованы все функции информационно-аналитической системы обработки неформализованных естественных текстов компании ИВК. Более того, в ходе данного проекта ряд модулей системы был перепроектирован таким образом, чтобы в дальнейшем упростить перенос и на другие СУБД, в первую очередь, с открытым исходным кодом.