Nigma.ru

Исполнился год с момента запуска интеллектуальной поисковой системы Nigma.ru, которая разрабатывается в рамках научного проекта студентов и аспирантов факультетов ВМиК и психологии МГУ им.М.В.Ломоносова.

За прошедший год Nigma улучшила механизм выдачи кластеров и обзавелась собственным индексом размером 1 терабайт. В механизме индексации применяются современные технологии, включая удаление дублирующейся информации во время исполнения запроса (в данный момент на наличие дублей просматриваются первые 50 результатов).

Помимо кластеризации и собственного индекса, был разработан синтаксис языка запросов (в стадии документирования), добавлена проверка орфографии на базе словаря, составленного из реальной русской орфографии, которую авторы веб-сайтов используют на своих страницах. Тем не менее, слово "превед" и прочие подобные слова в орфографический словарь Nigma.ru не попали.

Текущая посещаемость проекта - это десятки тысяч человек в сутки, миллионы запросов в месяц. Согласно статистике Liveinternet.ru, Nigma.ru в данный момент обрабатывает 0.3% запросов пользователей и ее доля постоянно растет.

©1997-2024 Компьютерная газета