Google "ворочает" петабайтами

Компания Google в рамках своей файловой системы рассортировала 1 петабайт данных (эквивалент десяти триллионов 100-байтовых текстовых файлов) между четырьмя тысячами компьютеров за шесть часов две минуты. Для размещения такого количества данных Google потребовалось 48 тысяч жестких дисков, но они не заполнялись полностью. Кроме того, создавалось по три копии каждого файла на разных дисках, так как есть опасность выхода их строя одного из трех винчестеров.

Сортировка меньшего объема информации - терабайта данных - между тысячей компьютеров заняла у файловой системы Google 68 секунд. Такой же объем информации был рассортирован между 910 компьютерами за 209 секунд. Основой вычислительной системы Google является компонент MapReduce. Он позволяет запускать несколько процессов одновременно. В январе текущего года MapReduce обрабатывал в среднем по 20 петабайт данных ежедневно.

Google

©1997-2024 Компьютерная газета