Новые технологии поиска информации в сети Интернет

Ведущие операторы интернет-поиска Google, Yahoo и Microsoft ведут неустанную борьбу за расширение сферы поиска, совершенствуя поисковые технологии и разрабатывая новые поисковые сервисы.

Веб-портал Yahoo сообщил о своих планах создания нового механизма поиска видеоматериалов в Интернете, который позволит удовлетворить растущий спрос на онлайновые мультимедийные развлечения. Yahoo разрабатывает специальную службу, которая даст возможность искать в Сети видеоклипы с тем же успехом, с которым сегодня происходит поиск текстовой и графической информации. Бета-версия продукта уже доступна широкой публике на страничке разработчиков Next.yahoo.com. Она может выполнять поиск видеофайлов в формате Windows Media, Apple QuickTime и Real Media.

Другие компании, сделавшие поиск информации своей специализацией, также работают над созданием подобных сервисов. Google (не особо разглашая сей факт) уже записывает и индексирует телепрограммы, чтобы в дальнейшем сделать возможным их онлайн-поиск, занимается оцифровкой литературы, библиотечных книжных архивов.
Microsoft также разрабатывает платформу для поиска через Интернет видеофайлов и телепрограмм. А America Online недавно обновила свою мультимедийную поисковую систему Singingfish, добавив функцию поиска видео на своем главном сайте. В решении задачи видеопоиска Yahoo сотрудничает с порталом AtomFilms, имеющим огромный видеоархив — от мультфильмов до сериалов.

Сегодня видеопоиск актуален по нескольким причинам. Многие люди в мире имеют современные компьютеры и высокоскоростной доступ в Интернет дома и на работе — практически все, что необходимо для просмотра видеофильмов или телепрограмм через Всемирную сеть.
Стоимость создания, хостинга и транспортировки видеоинформации по Интернету значительно снизилась и сделала мультимедийные интернет-технологии более доступными. Сеть развивается, превращаясь в развлекательную платформу для телевидения, появляются новые устройства, объединяющие функции персонального компьютера и телевизора, и для многих людей стала весьма актуальной возможность поиска видеоинформации вне зависимости от способа ее распространения — через платные кабельные каналы или широковещательную сеть.

Для операторов, предоставляющих сервис поиска видео, новый рынок услуг весьма привлекателен не только из-за возможности удовлетворить мультимедиаголод потребителей. Он также поможет эффективнее взаимодействовать с компаниями, которые занимаются рекламой и тратят на нее $60 млрд ежегодно. Основные рекламодатели с телевидения готовы использовать новые рекламные площадки в сети Интернет.

Поэтому Yahoo, Google и другие поисковые системы стараются наладить хорошие отношения с Голливудом, навести деловые мосты, которые станут основой для взаимовыгодного сотрудничества в области видеорекламы, распространения и продажи видеопродукции. Кроме делового партнерства с магнатами видео- и киноиндустрии, Yahoo внедряет новые технологии при создании своей системы видеопоиска. Компания разрабатывает новый медиастандарт Really Simple Syndication (RSS) Media, над которым работает совместно с Creative Commons, Broadband Mechanics, AtomFilms и другими компаниями. Новая система, построенная на этом стандарте, позволит добавлять текстовую информацию или метатеги в медиафайлы, размещенные на веб-сайтах.

Эти данные могут использоваться поисковой системой для индексации и, соответственно, поиска видеофайлов. Новый стандарт должен помочь решить проблему поисковой индексации файлов, которые содержат мало текстовой информации или не содержат ее вовсе. Yahoo создает технологию, которая позволит извлекать для поиска текстовую информацию из заголовков и других данных, связанных с видеофайлом, а в дальнейшем планирует задействовать технологии распознавания речи для расширения возможностей поиска. Для компаний, подобных AtomFilms, новый поисковый сервис означает увеличение трафика и в результате дополнительные поступления средств от рекламы. Компания занимается продажей рекламы, которая демонстрируется при загрузке видеофайлов с ее сайта и стоит от 20 до 35 долларов за тысячу показов — почти в пять раз дороже обычной баннерной рекламы.

Вместе с тем новые технологии и поисковые инструменты порой нуждаются в доработке. Ученый-компьютерщик из университета Rice, Сан Франциско, вместе со своими учениками обнаружил серьезный недостаток, который является потенциальной угрозой безопасности, в утилите для поиска информации на дисках ПК, недавно выпущенной Google.
Эта брешь может позволить злоумышленнику негласно выполнять поиск данных на компьютере с установленной утилитой desktop search через Интернет. Первоначально исследователи просто занялись анализом работы данной программы, но, выяснив алгоритмы и механизмы ее поведения, обнаружили, что ею может управлять злоумышленник. Тестовая версия desktop search выпущена Google 14 октября 2004 г., и ее можно бесплатно загрузить с сайта компании.

Программа индексирует данные, хранящиеся на жестком диске, и использует их при поиске информации среди электронных писем, текстовых и других файлов. Брешь в системе безопасности программы делает возможным поиск в относительно небольшом объеме файлов, и только при наличии определенных обстоятельств. С компьютера через Интернет могут уходить поисковые запросы пользователя, но не файлы, которые хранятся на его дисках.

Читая эти запросы, отправляемые поисковой службе, Google может размещать текстовую рекламу в результатах поиска, которые отображаются пользовательским браузером. Авторы программы заявили, что обнаружили уязвимость в конце ноября и уже 10 декабря начали распространять новую версию desktop search, в которой потенциальная дыра в системе безопасности закрыта.
Основными конкурентами Google в области новых поисковых технологий и desktop search являются Microsoft и Yahoo. Microsoft также выпустила тестовую версию своей утилиты desktop search как составную часть панели управления MSN, а Yahoo объявил о начале тестирования подобной программы в январе 2005 г. Исследователи из университета Rice сообщили, что не проверяли программу desktop search от Microsoft, однако отметили, что она не интегрирует результаты локального поиска и поиска во Всемирной паутине, как это делает программа от Google. Уязвимость поисковой утилиты Google заложена в алгоритме ее работы и позволяет перехватывать данные, передаваемые с компьютера пользователя в Интернет. Программа отслеживает трафик, направленный на сайт Google.com, и добавляет к нему результаты поиска на локальном диске. Оказалось, что программу можно обмануть и перенаправить данные с результатами поиска на другой сайт, где их сможет получить злоумышленник.

Для успешной атаки хакеру достаточно заманить жертву на свой сайт, причем тип и версия браузера не имеют значения. По заявлению Google, фактов наличия подобных атак выявлено не было. Занявшиеся этой проблемой ученые смогли создать небольшую программу на языке Java, которая после загрузки на компьютер пользователя с установленной программой Google desktop search устанавливала сетевое соединение с сервером, с которого была загружена, и перенаправляла на него все поисковые запросы и результаты локального поиска. Программа настольного поиска Google может автоматически обновляться, загружая новые версии с сайта компании незаметно для владельца компьютера, на котором установлена. Благодаря этому пользователи могут уточнить наличие на своей машине безопасной версии программы, обратившись к пункту меню "О программе" — свежая и надежная версия имеет номер 121,004.

Екатерина Грень


Компьютерная газета. Статья была опубликована в номере 01 за 2005 год в рубрике интернет :: разное

©1997-2022 Компьютерная газета