Google готовится пойти по стопам Гутенберга

Один из мегапроектов компании Google, постепенно развиваемый на протяжении уже нескольких лет, — это перевод на электронные носители информации ("оцифровка") содержания книг, периодических изданий и других единиц хранения ведущих библиотек и музеев мира. Однако мало кому известно, какие события легли в основу этих действий и в чем состоит их конечная цель.

Книги по проводам


А было все так. Ларри Пейджу — одному из основателей Google — во время учебы в Стэнфорде пришла идея создать глобальную электронную систему поиска книг. Произошло это, когда он вспомнил, с какими трудностями столкнулся в старших классах школы, пытаясь найти нужные учебные пособия по сборке различных электронных устройств. Впоследствии Пейдж вспоминал: "Учащимся трудно было находить нужные книги, выходящие за пределы школьной программы, из-за физической ограниченности фондов библиотек". В Стэнфорде у Ларри Пейджа родилась идея электронной межбиблиотечной системы взаимопомощи, при которой библиотеки одалживали бы не сами имеющиеся у них книги, а их электронные копии. Много лет спустя студенческий замысел воплотился в систему поиска книг (Google Book Search) с ее замыслом оцифровать и выставить для всеобщего пользования 20 миллионов изданий из собраний крупнейших библиотек мира. Теоретически возможной становится ситуация, когда любая книга, когда-либо опубликованная, может стать реально доступной каждому человеку, имеющему доступ к Интернету. Конечно, и сегодня существуют огромные онлайновые библиотеки, но вся совокупность их содержимого не составляет и доли процента того, что издано к сегодняшнему дню на бумаге (папирусе, глиняных или восковых табличках, стенах пещер и прочих твердых носителях).

Правда, вскоре обнаружилось серьезное системное противоречие. Первоначальная концепция Google Book Search рассматривала книгу "с точки зрения технаря" — как учебное пособие, справочник, руководство — в общем, как хранилище информации, по которому пользователь может перемещаться в своих поисках. Однако большинство книг, составляющих человеческое культурное наследие, мягко говоря, "не читаются" с использованием электронных средств. Любой пользователь ПК наверняка знает, насколько дискомфортно читать роман любимого писателя с экрана монитора. А распечатывать, скажем, "Легенду об Уленшпигеле" на принтере — это уже из области извращений. Альтернативой становится использование специальных стационарных станков-принтеров, расположенных в общественных местах и доступных широкому кругу пользователей. Такой станок по заказу автоматически напечатает и переплетет книгу, а также украсит ее титульным листом по желанию покупателя. В результате получается книга, неотличимая от книги, изготовленной традиционным типографским способом. Впрочем, к такому варианту мы еще вернемся.

Все началось в гараже

Два выпускника Стэнфордского университета Ларри Пейдж и Сергей Брин основали компанию Google в 1998 году в простом гараже в Калифорнии — как и положено легенде "Силиконовой долины". Американский интернет-бум уже был в самом разгаре, и никто в тот момент не придал особого значения рождению "еще одной интернет-компании". А зря. Ларри Пейдж и Сергей Брин с самого начала создавали свою поисковую систему на основе новейших технологий. Но еще более важным оказалось то, что одновременно была создана и запущена система классификации сайтов — PageRank system — система, способная распознавать и получать информацию из множества ресурсов Всемирной паутины, а затем классифицировать веб-сайты, содержащие эту информацию, по степени их важности для каждого данного случая в соответствии с количеством ссылок на них по всему Интернету. Конечно, Google был далеко не первой поисковой машиной, предназначенной для фильтрации содержания быстро растущей Сети, однако революционная на тот момент система PageRank привела к созданию новой инфраструктуры и изменила методику ведения поиска. "Старые" поисковые серверы в большей мере исходили из того, насколько часто запрошенное слово появляется на веб-странице. Google стал "поисковиком №1" за счет того, что использует PageRank для изучения всей структуры ссылок Интернета и определения, какие страницы являются наиболее важными. Затем производится анализ гипертекста, чтобы определить, какие страницы являются релевантными для данного поиска. Сочетание показателей общей значимости и релевантности для конкретного запроса позволяет Google размещать на первых местах оптимальные результаты поиска.

Бизнес на поиске информации

После того, как в 2001 году в Америке громко лопнул пузырь "интернет-экономики", на плаву остались немногие работавшие в этой сфере фирмы. А компания Google, наоборот, "расцвела", демонстрируя просто-таки феноменальные темпы роста. К счастью создателей Google, им удалось совместить удачную поисковую технологию с эффективной бизнес-схемой. И они, и рекламодатели оценили коммерческие возможности технологии, дающей возможность миллионам пользователей найти интересующую их информацию и таким образом "наводящей" потребителей на широчайший ассортимент товаров и услуг. К тому же, уникальная рекламная технология Google предоставляет пользователю наиболее эффективные средства для сопоставления различных предложений, что позволяет сделать осознанный выбор. В результате благодаря Google сотни тысяч рекламодателей, большинство которых являются представителями мелкого бизнеса, принимают участие в грандиозном интернет-аукционе, где идет борьба на равных за потенциального покупателя. При этом рекламодатели оплачивают каждое посещение своего сайта, что очень быстро сделало Google одной из богатейших корпораций мира. Чтобы расширить рекламную площадку, в Google начали "прикручивать" к поисковику самые различные веб-сервисы: электронную почту, новости, видео, карты, различное бесплатное ПО, плотно связанное с WWW, и т.д. Весь контент и все сервисы Google бесплатны для пользователя, который оплачивает их косвенно — за счет просмотра рекламы. В результате сейчас мы имеем портал с поистине необъятным набором услуг — при попытке подсчитать сервисы Google лично я сбился на девятом десятке.

Децентрализация рынка

Сейчас львиную долю доходов книгоиздателям приносят бестселлеры: их немного, но массированная реклама успешно делает свое дело. В результате именно бестселлерам отведены первые полки книжных магазинов, тогда как малораспространенную книгу по какой-нибудь редкой теме читатель в лучшем случае обнаруживает в центральной библиотеке. И пусть он десять раз готов ее купить — сделать это нереально (ситуация, знакомая очень многим добросовестным студентам). То есть можно говорить о своего рода централизации книжного рынка.

Еще недавно аналогичная ситуация складывалась на музыкальном рынке: звукозаписывающая индустрия львиную долю доходов получала за счет хитов из Top-100. Однако Интернет и появившийся удачный формат mp3 разрушили музыкальный рынок в его прежнем виде. Теперь онлайновые музыкальные магазины большую часть прибыли имеют за счет продажи записей малоизвестных исполнителей самых разных (и порой весьма экзотических) музыкальных стилей, которые крайне редко появляются на CD в музыкальных магазинах. В пиринговых сетях и на пиратских музыкальных сайтах ситуация выглядит еще более контрастной — как показывает статистика, "хиты сегодняшнего дня" с их помощью практически никто не скачивает. Крис Андерсон — редактор культового в IT-кругах журнала Wired — утверждает, что на обширной виртуальной "книжной полке" Интернета можно разместить практически неограниченное по разнообразию и объему текстовое содержание. К этому нужно добавить легкость доступа: в Интернете исчезают все трудности и ограничения, связанные с физическим предоставлением книги читателю библиотеки. То есть не нужно, затребовав книгу из фонда, ждать, пока она будет доставлена, лично идти в библиотеку, чтобы ее забрать, и т.д.

Юридическая казуистика

Главная на сегодняшний день проблема проекта по глобальной оцифровке — авторские права, принадлежащие издательствам и собственно авторам. Существующие законы об авторском праве на каждом шагу вступают в противоречие с реальностями цифрового мира. Так, законом позволяется так называемое "честное применение" ("fair use"), предполагающее право использовать и тиражировать в книгах или статьях короткие цитаты из печатных текстов с соответствующими ссылками. Но для того чтобы Google мог предоставить эту возможность своим пользователям, он должен сначала оцифровать весь текст, что оказывается нарушением закона об авторском праве, запрещающего копирование всего, что не может быть названо "кратким фрагментом текста". Теперь работающие на Google юристы и адвокаты различных издательств активно выясняют отношения в судах по всему миру. Эксперты уверены, что так будет продолжаться до тех пор, пока книгоиздатели не осознают, что тотальная оцифровка и "освобождение" авторских прав отвечают их собственным интересам и интересам связанных с ними авторов. Когда такое осознание наступит, претензии издателей к Google исчезнут сами собой.

Бизнес-модель

Пока не совсем ясно, каким образом проект "глобальной библиотеки" может окупиться и начать приносить прибыль. Ларри Пейдж наверняка не думал об этом, когда ему в голову пришла вдохновленная заботой об общественном благе идея об электронной межбиблиотечной системе. Однако Google Book Search вполне может со временем превратиться не только в многоязычную "библиотеку библиотек", но и в универсальный книжный магазин, предлагающий миллионы названий читателям всей планеты. Деньги тут можно зарабатывать на продаже самого текста в электронном виде (очень маловероятно), на иллюстрациях, на услугах по превращению файла книги в бумажную версию издания ("твердую копию") или на размещении контекстной рекламы, в чем компания Google весьма преуспела в Сети. Конечно, реклама ближайшего магазина компьютерной периферии на страницах "Одиссеи" — нонсенс, но человечество видело вещи и поабсурднее. Ничего, привыкнет.

"Братство по цеху"

Усилия Google по оцифровке мирового культурного и интеллектуального наследия отнюдь не одиноки. Тем же самым занимаются "Проект "Гутенберг" (Gutenberg Project), Open Content Alliance (проект по оцифровке литературных произведений и периодики, затеянный компанией Yahoo и организацией Internet Archive в противовес Google Print) и еще ряд аналогичных проектов. Теперь ученые говорят, что все эти проекты фактически открывают новую страницу в истории цивилизации. Вот один пример начавшихся изменений: молодая американская компания "Книги по требованию" (On Demand Books) установила в книжном магазине Всемирного банка (World Bank bookstore) в Вашингтоне экспериментальную версию специального печатного станка: в него закладывается оцифрованный текст в виде файла, а станок автоматически печатает и переплетает по требованию покупателя книгу в мягкой обложке типографского качества по низкой цене с минимальным вмешательством человека — получается своего рода "банкомат для книг". Второй экспериментальный станок такого типа установлен в Египте в Александрийской библиотеке, где на нем печатаются книги на арабском языке. Усовершенствованная модель подобного станка будет установлена в конце этого или начале следующего года в Нью-Йоркской публичной библиотеке. У читателей появляется возможность распечатывать по требованию любую книгу прямо на месте продажи, причем по цене, соответствующей обычному балансу издательских затрат и доходов с учетом авторских гонораров с предусмотренным контрактом долевым вознаграждением с продаж ("роялти"). Когда Иоганн Гутенберг создавал свой печатный станок, он думал о том, чтобы сделать максимально дешевой и общедоступной Библию. Сегодня Google хочет сделать общедоступным уже все мировое интеллектуальное наследие. Бизнес-план прилагается, но это тот самый случай, когда материальная заинтересованность никак не умаляет всех прочих достоинств суперпроекта.

Денис Лавникевич


Компьютерная газета. Статья была опубликована в номере 40 за 2006 год в рубрике интернет

©1997-2024 Компьютерная газета