Процессор Celeron 1.80
Процессор Celeron 1.80 Celeron — это название так называемого "бюджетного" семейства процессоров Intel. Процессоры Celeron построены на базе одного из семейств Pentium, но имеют некоторые упрощения, призванные снизить их стоимость. Конечно, при этом страдает и производительность, однако Celeron предназначен для базовых офисных задач, в которых быстродействие процессора не является определяющим фактором, в отличие от инженерных, научных, математических задач и т.п.
Процессоры Celeron развиваются почти одновременно со своими старшими "братьями", Pentium. Меняются процессорные ядра, корпусы, частоты. Но вот никаких цифр к их названию от этого не прибавляется. И если последнее поколение Pentium в названии содержит цифру "4", то Celeron так и остался Celeron'ом. Отличать один от другого приходится по тактовым частотам. Так, в мае 2002 года появились два новых Celeron — 1.70 и 1.80, которые принадлежат к следующему, пятому по счету поколению, построенному на базе ядра Willamette и совместимому с Pentium 4.
Новые Celeron — шаг вперед или назад?
Как известно, до появления новых моделей Celeron самым быстродействующим в семействе был процессор с частотой 1.3 ГГц. Он и объявленный чуть позже Celeron 1.40 имеют ядро Tualatin c 100 МГц шиной и 256 Кб кэша второго уровня, совместимы с архитектурой Socket370. Эти процессоры отлично справляются с поставленными перед ними задачами; более того, в большинстве тестов они оказываются даже быстрее своих более частотных собратьев. Зачем же тогда потребовалось переводить Celeron на новые рельсы вместо того, чтобы и дальше наращивать частоты прежних процессоров?
Тому есть несколько причин. Во-первых, архитектура P6, по которой построено ядро Tualatin, уже исчерпала себя. Поскольку производительность подсистемы памяти за последние пару лет резко возросла, процессор стал сдерживающим фактором на пути к дальнейшему наращиванию производительности. Конечно, можно попробовать увеличить частоту процессорной шины в несколько раз. Но ведь процессор проектируется с расчетом на определенное быстродействие его составных блоков. Нельзя просто повысить частоту шинного интерфейса, оставив без изменений объемы буферов, разрядности шин, регистров, длину и состав исполнительных конвейеров и т.п. Да, у Intel были планы по введению новой шины для процессоров Pentium III, однако вместо доработки старого процессора было принято решение форсировать выпуск нового, Pentium 4.
Во-вторых, развитие платформы Socket370 остановилось. Да, во многом это было сделано искусственно. Однако тесты первых систем с поддержкой памяти DDR показали, что производительность платформы Socket370 во многих случаях остается на месте. Приложения, предназначенные для обработки больших массивов данных, нуждаются в увеличении пропускной способности памяти, а старая платформа не может этого обеспечить. Поэтому сначала Intel, а потом и другие разработчики чипсетов прекратили работу в этом направлении.
В-третьих, интенсивно использующие память задачи из разряда специфических перешли в разряд обыденных. Сжатие и воспроизведение звука и видео, компьютерные игры, мультимедиа-презентации... Кроме того, вскоре должны появиться интерфейсы, использующие не только графический, но и голосовой ввод, распознавание движений и т.п., которые начнут внедряться только в том случае, если среднестатистическая аппаратная база будет достаточно мощной, чтобы их поддерживать.
Кроме того, потребовалось просто привести все компоненты системы к общему знаменателю. Зачем продолжать выпускать два семейства чипсетов, разъемов, кулеров, блоков питания, если можно отбросить одно из них? И конечно, лучше отбросить старое.
Что такое новый Celeron?
По большому счету, это просто Pentium 4 с меньшим объемом кэш-памяти второго уровня. Celeron 1.70 и 1.80 имеют в своей основе ядро Pentium 4 первого поколения — Willamette. Это 32-разрядное суперскалярное CISC-ядро архитектуры IA32, которое выпускается по технологическим нормам 0.18 мкм, имеет кэш первого уровня объемом 8 Кб для данных и трассировочный кэш на 12 тыс. микроопераций, длинный конвейер на 20 стадий; внешняя шина имеет разрядность 64 бита, частоту 100 МГц, учетверенный поток данных (эквивалентно частоте 400 МГц). Кэш второго уровня, встроенный в ядро, у оригинального Willamette имел объем 256 Кб, но у Celeron был урезан до 128 Кб. При этом специалисты Intel утверждают, что латентность (длительность задержек) и ассоциативность (количество блоков, в которых хранятся не связанные между собой данные) кэша не изменились, то есть быстродействие осталось тем же. Можно предположить, что для процессора с архитектурой Pentium 4 объем кэша не так важен, поскольку у него данные из памяти поступают и так достаточно быстро. Тем не менее, частота процессорной шины составляет 100 МГц, поэтому задержки, возникающие при кэш-промахе и необходимые для реакции контроллера памяти, должны быть достаточно высокими. В общем, Celeron был неплохо "приторможен" по сравнению с Pentium 4.
Есть также неофициальные данные, что переход Celeron на более совершенное ядро Northwood не приведет к увеличению объема кэша или частоты шины. Возможно, корпоративные потребители не особенно расстроятся, а вот наши отечественные пользователи, вынужденные покупать бюджетные процессоры из-за недостатка средств, потеряют возможность заполучить достаточно быстрый процессор по низкой цене.
Впрочем, сейчас неизвестно, какое решение примет руководство Intel. В данный момент нас интересует, насколько ниже получилась производительность нового Celeron по сравнению с Pentium 4.
Тестирование
Чтобы точно выяснить, насколько пострадал Celeron от сокращения размера кэша, я решил протестировать три процессора с одинаковой тактовой частотой, но различными кэшами. Для этого я взял три процессора: Celeron 1.80, Pentium 4 1.80 и Pentium 4 1.80A. У первого объем кэш-памяти второго уровня составляет 128 Кб, у второго — 256 Кб (он основан на том же ядре), а у третьего — 512 Кб, так как это уже процессор на ядре Northwood. Внешне все три процессора почти не отличаются, корпус у них один и тот же, работают они на одних и тех же материнских платах. А вот быстродействие у них отличается, и единственная тому причина — кэш.
Процессоры устанавливались в материнскую плату Intel D845GBV (чипсет i845G) с 256 Мб памяти PC2700, графика использовалась встроенная. Так эмулировалась наиболее вероятная среда существования процессора Celeron. Понятно, что для Pentium 4 1.80A пользователь предпочтет внешнюю графику, больший объем памяти, и если он не дурак, разгонит процессор до 2.4-2.5 ГГц.
Начнем с измерения пропускной способности кэш-памяти процессора с помощью теста Cachemem. По его результатам получается, что кэш первого уровня у всех трех процессоров обеспечивает пропускную способность 13,5 Гб/c. Что касается кэша второго уровня, то он, похоже, у них тоже имеет одинаковые параметры и обеспечивает 7,3 Гб/с. Это — при выполнении выборки данных. При записи результат для обоих кэш оказывается одинаковым — 6 Гб/с, что свидетельствует о режиме сквозной записи в кэш первого уровня.
Графики чтения всех трех процессоров идеально совпадают во всем, кроме одного — вторая ступень, обозначающая работу в пределах кэша второго уровня, заканчивается у них по-разному.
Тест Linpack, измеряющий скорость решения систем линейных уравнений, более реалистично показывает влияние объема кэш-памяти на быстродействие в математических задачах. Мы видим, что у всех процессоров графики идут вверх с одинаковой скоростью, а потом начинают резко спадать. У Celeron 1.80 спад начинается намного раньше. Если взять объем матрицы 330 Кб, Celeron покажет быстродействие в полтора раза хуже, чем Pentium 4 1.80, а Pentium 4 1.80A окажется втрое быстрее последнего.
Рассмотрим другие синтетические тесты. Начнем с Sandra CPU Bench. Этот тест измеряет количество целочисленых и FP-операций, выполняемых процессором. Само собой, у всех трех результаты одинаковы, так как они построены по одной архитектуре и имеют равные тактовые частоты.
Тест CPUMark'99 содержит набор инструкций (instruction mix) различных приложений, список которых не приводится. Он использовался раньше для измерения производительности процессоров. Результаты свидетельствуют, что Celeron с нагрузкой справился на 33% хуже, чем Pentium 4, а процессор с ядром Northwood оказался еще на 5% быстрее.
Тест CPU Rightmark моделирует в реальном времени поведение системы многих тел в среде, обладающей вязкостью. Он состоит из трех вычислительных блоков. Блок решения системы дифференциальных уравнений (поддержка SSE2) не заметил разницы между процессорами. Блок отображения результатов, оптимизированный под инструкции SSE, тоже отработал с одинаковой скоростью. А вот блок предварительного расчета координат, использующий только набор команд x87 и написанный на языке высокого уровня, оказался чувствительным к объему кэша. Celeron возился с ним на 40% дольше, чем P4 1.80, а P4 1.80A оказался лишь на 6% быстрее предшественника.
Еще одна математическая задача — вычисление знаков числа "пи". Я измерял, сколько тысяч знаков рассчитывает процессор за секунду. Celeron оказался на 30% медленее Pentium 4 1.80, а тот, в свою очередь, на 10% медленее Pentium 4 1.80A.
Тест PCMark2002 содержит несколько различных алгоритмов обработки данных. Раскодирование JPEG-файлов с помощью стандартной библиотеки версии 6b все три процессора выполняют одинаково, то есть Celeron наравне с Pentium 4 может использоваться для просмотра изображений. Распаковка ZIP-архивов, созданных стандартным методом LZ77, тоже выполняется одинаково (1% не считается). А вот сжатие тем же методом Celeron выполняет медленее на 40%. Поиск строки текста распространенным методом Бойера-Мура все три процессора опять-таки выполняют одинаково. Нет между ними разницы и при выполнении 3D-моделирования объектов с использованием оптимизированных алгоритмов движка MAX-FX (игра Max Payne). Немного отстает (3%) Celeron при сжатии звука кодером Ogg Vobis. Похожие цифры (4-8%) мы видим и при сжатии видео в формат MPEG4 с использованием кодера Windows Media Encoder 7.1.
Идем дальше. Офисные приложения, для которых и предназначены процессоры Celeron. Согласно SYSmark2002, бюджетный процессор уступает 10% P4 1.80 и 20% — P4 1.80A. Прилично. В Winstone2001 на похожем наборе приложений Celeron оказался на 20% медленнее, а соотношение между P4 не изменилось. Как ни странно, в задачах, связанных с подготовкой материалов для Web, в том же Winstone2001, Celeron приблизился к P4 1.80 (-8%). А в аналогичном тесте SYSmark2002 вперед вырвался P4 1.80A (17%); соотношение между P4 1.80 и Celeron не изменилось (10%). Видимо, новые версии приложений, использованные в SYSmark2002, стали более требовательными к быстродействию подсистемы памяти.
Возъмем тест SPECviewperf. Он содержит фрагменты профессиональных приложений для дизайнеров. В большинстве случаев разницы между процессорами не заметно из-за того, что не справилась встроенная видеокарта. Но в двух тестах мы видим, что Celeron и P4 с кэшем 256 Кб показали близкие результаты, а P4 c кэшем 512 Кб вырвался вперед (10% в одном и 20% в другом тесте).
Возьмем некоторые 3D-игры в низком разрешении (640х480х16 бит), когда влияние видеокарты минимально. Отставание Celeron от процессора с 256 Кб кэша составило в среднем 15-20%, и только Comanche4 оказался ему не по зубам. Pentium 4 1.80A от своих лишних 256 Кб получил 15% преимущества.
Итог
Мы рассмотрели результаты тестов. Очевидно, что сложные математические задачи даются новому Celeron c большим трудом — в них он отстает чуть ли не в полтора раза даже от Pentium 4 c кэшем 256 Кб. Более-менее удается ему справиться с сжатием мультимедиа-данных, причем тут прослеживается зависимость от алгоритма. В играх Celeron, к сожалению, не блещет, зато нормально справляется с офисными задачами, отставая на 10% от Pentium 4 на том же ядре. Pentium 4 с кэшем 512 Кб практически во всех реальных приложениях имеет не менее 5% преимущества над предшественником с той же частотой. Поэтому если вас не интересуют ни игры, ни сложная математика, то Celeron будет оправданным выбором. В противном случае имеет смысл ориентироваться на Pentium 4 на ядре Northwood, особенно если учесть его отличный разгонный потенциал.
Процессоры для тестирования предоставлены фирмой "СОТА".
Макс Курмаз, max@hw.by
Процессоры Celeron развиваются почти одновременно со своими старшими "братьями", Pentium. Меняются процессорные ядра, корпусы, частоты. Но вот никаких цифр к их названию от этого не прибавляется. И если последнее поколение Pentium в названии содержит цифру "4", то Celeron так и остался Celeron'ом. Отличать один от другого приходится по тактовым частотам. Так, в мае 2002 года появились два новых Celeron — 1.70 и 1.80, которые принадлежат к следующему, пятому по счету поколению, построенному на базе ядра Willamette и совместимому с Pentium 4.
Новые Celeron — шаг вперед или назад?
Как известно, до появления новых моделей Celeron самым быстродействующим в семействе был процессор с частотой 1.3 ГГц. Он и объявленный чуть позже Celeron 1.40 имеют ядро Tualatin c 100 МГц шиной и 256 Кб кэша второго уровня, совместимы с архитектурой Socket370. Эти процессоры отлично справляются с поставленными перед ними задачами; более того, в большинстве тестов они оказываются даже быстрее своих более частотных собратьев. Зачем же тогда потребовалось переводить Celeron на новые рельсы вместо того, чтобы и дальше наращивать частоты прежних процессоров?
Тому есть несколько причин. Во-первых, архитектура P6, по которой построено ядро Tualatin, уже исчерпала себя. Поскольку производительность подсистемы памяти за последние пару лет резко возросла, процессор стал сдерживающим фактором на пути к дальнейшему наращиванию производительности. Конечно, можно попробовать увеличить частоту процессорной шины в несколько раз. Но ведь процессор проектируется с расчетом на определенное быстродействие его составных блоков. Нельзя просто повысить частоту шинного интерфейса, оставив без изменений объемы буферов, разрядности шин, регистров, длину и состав исполнительных конвейеров и т.п. Да, у Intel были планы по введению новой шины для процессоров Pentium III, однако вместо доработки старого процессора было принято решение форсировать выпуск нового, Pentium 4.
Во-вторых, развитие платформы Socket370 остановилось. Да, во многом это было сделано искусственно. Однако тесты первых систем с поддержкой памяти DDR показали, что производительность платформы Socket370 во многих случаях остается на месте. Приложения, предназначенные для обработки больших массивов данных, нуждаются в увеличении пропускной способности памяти, а старая платформа не может этого обеспечить. Поэтому сначала Intel, а потом и другие разработчики чипсетов прекратили работу в этом направлении.
В-третьих, интенсивно использующие память задачи из разряда специфических перешли в разряд обыденных. Сжатие и воспроизведение звука и видео, компьютерные игры, мультимедиа-презентации... Кроме того, вскоре должны появиться интерфейсы, использующие не только графический, но и голосовой ввод, распознавание движений и т.п., которые начнут внедряться только в том случае, если среднестатистическая аппаратная база будет достаточно мощной, чтобы их поддерживать.
Кроме того, потребовалось просто привести все компоненты системы к общему знаменателю. Зачем продолжать выпускать два семейства чипсетов, разъемов, кулеров, блоков питания, если можно отбросить одно из них? И конечно, лучше отбросить старое.
Что такое новый Celeron?
По большому счету, это просто Pentium 4 с меньшим объемом кэш-памяти второго уровня. Celeron 1.70 и 1.80 имеют в своей основе ядро Pentium 4 первого поколения — Willamette. Это 32-разрядное суперскалярное CISC-ядро архитектуры IA32, которое выпускается по технологическим нормам 0.18 мкм, имеет кэш первого уровня объемом 8 Кб для данных и трассировочный кэш на 12 тыс. микроопераций, длинный конвейер на 20 стадий; внешняя шина имеет разрядность 64 бита, частоту 100 МГц, учетверенный поток данных (эквивалентно частоте 400 МГц). Кэш второго уровня, встроенный в ядро, у оригинального Willamette имел объем 256 Кб, но у Celeron был урезан до 128 Кб. При этом специалисты Intel утверждают, что латентность (длительность задержек) и ассоциативность (количество блоков, в которых хранятся не связанные между собой данные) кэша не изменились, то есть быстродействие осталось тем же. Можно предположить, что для процессора с архитектурой Pentium 4 объем кэша не так важен, поскольку у него данные из памяти поступают и так достаточно быстро. Тем не менее, частота процессорной шины составляет 100 МГц, поэтому задержки, возникающие при кэш-промахе и необходимые для реакции контроллера памяти, должны быть достаточно высокими. В общем, Celeron был неплохо "приторможен" по сравнению с Pentium 4.
Есть также неофициальные данные, что переход Celeron на более совершенное ядро Northwood не приведет к увеличению объема кэша или частоты шины. Возможно, корпоративные потребители не особенно расстроятся, а вот наши отечественные пользователи, вынужденные покупать бюджетные процессоры из-за недостатка средств, потеряют возможность заполучить достаточно быстрый процессор по низкой цене.
Впрочем, сейчас неизвестно, какое решение примет руководство Intel. В данный момент нас интересует, насколько ниже получилась производительность нового Celeron по сравнению с Pentium 4.
Тестирование
Чтобы точно выяснить, насколько пострадал Celeron от сокращения размера кэша, я решил протестировать три процессора с одинаковой тактовой частотой, но различными кэшами. Для этого я взял три процессора: Celeron 1.80, Pentium 4 1.80 и Pentium 4 1.80A. У первого объем кэш-памяти второго уровня составляет 128 Кб, у второго — 256 Кб (он основан на том же ядре), а у третьего — 512 Кб, так как это уже процессор на ядре Northwood. Внешне все три процессора почти не отличаются, корпус у них один и тот же, работают они на одних и тех же материнских платах. А вот быстродействие у них отличается, и единственная тому причина — кэш.
Процессоры устанавливались в материнскую плату Intel D845GBV (чипсет i845G) с 256 Мб памяти PC2700, графика использовалась встроенная. Так эмулировалась наиболее вероятная среда существования процессора Celeron. Понятно, что для Pentium 4 1.80A пользователь предпочтет внешнюю графику, больший объем памяти, и если он не дурак, разгонит процессор до 2.4-2.5 ГГц.
Начнем с измерения пропускной способности кэш-памяти процессора с помощью теста Cachemem. По его результатам получается, что кэш первого уровня у всех трех процессоров обеспечивает пропускную способность 13,5 Гб/c. Что касается кэша второго уровня, то он, похоже, у них тоже имеет одинаковые параметры и обеспечивает 7,3 Гб/с. Это — при выполнении выборки данных. При записи результат для обоих кэш оказывается одинаковым — 6 Гб/с, что свидетельствует о режиме сквозной записи в кэш первого уровня.
Графики чтения всех трех процессоров идеально совпадают во всем, кроме одного — вторая ступень, обозначающая работу в пределах кэша второго уровня, заканчивается у них по-разному.
Тест Linpack, измеряющий скорость решения систем линейных уравнений, более реалистично показывает влияние объема кэш-памяти на быстродействие в математических задачах. Мы видим, что у всех процессоров графики идут вверх с одинаковой скоростью, а потом начинают резко спадать. У Celeron 1.80 спад начинается намного раньше. Если взять объем матрицы 330 Кб, Celeron покажет быстродействие в полтора раза хуже, чем Pentium 4 1.80, а Pentium 4 1.80A окажется втрое быстрее последнего.
Рассмотрим другие синтетические тесты. Начнем с Sandra CPU Bench. Этот тест измеряет количество целочисленых и FP-операций, выполняемых процессором. Само собой, у всех трех результаты одинаковы, так как они построены по одной архитектуре и имеют равные тактовые частоты.
Тест CPUMark'99 содержит набор инструкций (instruction mix) различных приложений, список которых не приводится. Он использовался раньше для измерения производительности процессоров. Результаты свидетельствуют, что Celeron с нагрузкой справился на 33% хуже, чем Pentium 4, а процессор с ядром Northwood оказался еще на 5% быстрее.
Тест CPU Rightmark моделирует в реальном времени поведение системы многих тел в среде, обладающей вязкостью. Он состоит из трех вычислительных блоков. Блок решения системы дифференциальных уравнений (поддержка SSE2) не заметил разницы между процессорами. Блок отображения результатов, оптимизированный под инструкции SSE, тоже отработал с одинаковой скоростью. А вот блок предварительного расчета координат, использующий только набор команд x87 и написанный на языке высокого уровня, оказался чувствительным к объему кэша. Celeron возился с ним на 40% дольше, чем P4 1.80, а P4 1.80A оказался лишь на 6% быстрее предшественника.
Еще одна математическая задача — вычисление знаков числа "пи". Я измерял, сколько тысяч знаков рассчитывает процессор за секунду. Celeron оказался на 30% медленее Pentium 4 1.80, а тот, в свою очередь, на 10% медленее Pentium 4 1.80A.
Тест PCMark2002 содержит несколько различных алгоритмов обработки данных. Раскодирование JPEG-файлов с помощью стандартной библиотеки версии 6b все три процессора выполняют одинаково, то есть Celeron наравне с Pentium 4 может использоваться для просмотра изображений. Распаковка ZIP-архивов, созданных стандартным методом LZ77, тоже выполняется одинаково (1% не считается). А вот сжатие тем же методом Celeron выполняет медленее на 40%. Поиск строки текста распространенным методом Бойера-Мура все три процессора опять-таки выполняют одинаково. Нет между ними разницы и при выполнении 3D-моделирования объектов с использованием оптимизированных алгоритмов движка MAX-FX (игра Max Payne). Немного отстает (3%) Celeron при сжатии звука кодером Ogg Vobis. Похожие цифры (4-8%) мы видим и при сжатии видео в формат MPEG4 с использованием кодера Windows Media Encoder 7.1.
Идем дальше. Офисные приложения, для которых и предназначены процессоры Celeron. Согласно SYSmark2002, бюджетный процессор уступает 10% P4 1.80 и 20% — P4 1.80A. Прилично. В Winstone2001 на похожем наборе приложений Celeron оказался на 20% медленнее, а соотношение между P4 не изменилось. Как ни странно, в задачах, связанных с подготовкой материалов для Web, в том же Winstone2001, Celeron приблизился к P4 1.80 (-8%). А в аналогичном тесте SYSmark2002 вперед вырвался P4 1.80A (17%); соотношение между P4 1.80 и Celeron не изменилось (10%). Видимо, новые версии приложений, использованные в SYSmark2002, стали более требовательными к быстродействию подсистемы памяти.
Возъмем тест SPECviewperf. Он содержит фрагменты профессиональных приложений для дизайнеров. В большинстве случаев разницы между процессорами не заметно из-за того, что не справилась встроенная видеокарта. Но в двух тестах мы видим, что Celeron и P4 с кэшем 256 Кб показали близкие результаты, а P4 c кэшем 512 Кб вырвался вперед (10% в одном и 20% в другом тесте).
Возьмем некоторые 3D-игры в низком разрешении (640х480х16 бит), когда влияние видеокарты минимально. Отставание Celeron от процессора с 256 Кб кэша составило в среднем 15-20%, и только Comanche4 оказался ему не по зубам. Pentium 4 1.80A от своих лишних 256 Кб получил 15% преимущества.
Итог
Мы рассмотрели результаты тестов. Очевидно, что сложные математические задачи даются новому Celeron c большим трудом — в них он отстает чуть ли не в полтора раза даже от Pentium 4 c кэшем 256 Кб. Более-менее удается ему справиться с сжатием мультимедиа-данных, причем тут прослеживается зависимость от алгоритма. В играх Celeron, к сожалению, не блещет, зато нормально справляется с офисными задачами, отставая на 10% от Pentium 4 на том же ядре. Pentium 4 с кэшем 512 Кб практически во всех реальных приложениях имеет не менее 5% преимущества над предшественником с той же частотой. Поэтому если вас не интересуют ни игры, ни сложная математика, то Celeron будет оправданным выбором. В противном случае имеет смысл ориентироваться на Pentium 4 на ядре Northwood, особенно если учесть его отличный разгонный потенциал.
Процессоры для тестирования предоставлены фирмой "СОТА".
Макс Курмаз, max@hw.by
Компьютерная газета. Статья была опубликована в номере 32 за 2002 год в рубрике hard :: процессоры