Первый Celeron на шине 100 МГц
Первый Celeron на шине 100 МГц В декабре 2000 года, на несколько месяцев раньше объявленного срока, корпорация Intel выпустила долгожданную 800 МГц-версию своего "бюджетного" процессора Celeron. Принципиальным отличием этого процессора от всех предыдущих была частота хост-шины - 100 МГц против 66 МГц. Как известно, процессоры Celeron уступают в производительности как старшим моделям производства Intel - Pentium-III, так и процессорам производства AMD - Athlon и Duron. Многие специалисты видели причину такого отставания именно в низкой частоте хост-шины, которая подключает процессор к системному контроллеру. И вот теперь этот недостаток устранен. Станет ли новый Celeron достойным соперником набирающему популярность "бюджетному" процессору Duron?
Немного истории...
Впервые процессоры Intel разделились на старшие и младшие модели одной архитектуры весной 1998 года, когда был представлен первый Celeron, основанный на ядре Covington. Так как у него не было кэша второго уровня, производительностью он не блистал, и потому через полгода Celeron получил ядро Mendocino. Так как кэш второго уровня у него был небольшим - всего 128 Кб, инженерам Intel удалось разместить оба кэша непосредственно на кристалле и заставить работать на частоте процессора. Тем самым Celeron, имея вдвое меньший кэш второго уровня, мог составить конкуренцию старшему собрату - Pentium-II - практически во всех задачах. Однако следующее ядро, Coppermine, лишило Celeron его преимущества. Сейчас у Pentium-3 точно такой же кэш, как и у Celeron. Более того, ядро современных Celeron, называемое Coppermine-128, на самом деле представляет собой не что иное, как отбракованный кристалл Pentium-3, в котором не работает половина ячеек памяти, отведенных под кристалл.
...немного теории...
В современных процессорах кэш-память - очень важный компонент. Команды и данные ядро процессора получает из кэша первого уровня. Если необходимых данных там нет, то происходит обращение к кэшу второго уровня, который подключается к процессору по отдельной шине. Если данных нет и там, то контроллер кэша посылает запрос контроллеру памяти, данные по хост-шине поступают в кэш второго уровня и становятся доступными процессору. Из этой упрощенной схемы видно, что быстродействие процессора зависит от трех моментов:
1) насколько быстро данные из кэша поступают в исполнительные модули ядра;
2) насколько высока вероятность того, что данные есть в кэше (эффективность кэширования);
3) с какой скоростью данные из памяти смогут поступить в кэш.
Если первый момент касается другой темы - сравнения архитектурных особенностей процессоров Intel и AMD, то два оставшихся как раз и являются причиной отставания Celeron от других процессоров.
Во-первых, половина кэша, оказавшаяся в распоряжении ядра Celeron, работает не так эффективно, как кэш Pentium-3. И дело тут не только в том, что кэш имеет уменьшенный размер. На самом деле блочно-ассоциативный кэш, будучи поделенным пополам, имеет только половину блоков. То есть при необходимости замены одного блока данных другим кэш-контроллер вынужден выбросить один из четырех блоков, а это гораздо хуже, чем выбирать из восьми блоков.
Во-вторых, при необходимости подгрузить в кэш данные Celeron должен ожидать больше, чем другие процессоры, так как шина, соединяющая его с памятью, имеет частоту всего 66 МГц. И хотя в обычных приложениях это случается не часто (90-96% запросов удовлетворяется кэшем), в некоторых задачах, связанных с обработкой больших массивов данных, не умещающихся в кэше, этот фактор дает о себе знать.
Однако выход Celeron-800 позволяет говорить о ликвидации последнего момента. Насколько лучше стал работать Celeron? Для этого воспользуемся результатами тестов, проведенных Анандом Шимпи, руководителем авторитетного Интернет-сайта AnandTech ( http://www.anandtech.com/ ), посвященного компьютерному "железу".
...и практические результаты.
Итак, Ананд провел сравнение производительности четырех процессоров: Intel Celeron-800 (8x100), последний из старой серии - Intel Celeron-766 (11.5x66), самый младший из процессоров AMD - Duron-600 (6x100), аналогичный по частоте подопытному Duron-800 (8x100). Кроме них, в тестировании также участвовали Celeron-566 и Cyrix-III-667. Все тесты проводились на двух разных системах. Первая была предназначена для выявления всего потенциала, заложенного в процессорах. Поэтому конфигурация была самая что ни на есть "навороченная": 256 Мб памяти, материнские платы от ASUS (A7V для Duron, CUSL2 для Athlon), видеокарта GeForce2 GTS, жесткий диск IBM Deskstar 307030. Вторая тестовая конфигурация представляла наиболее вероятное применение этих процессоров, т.е. систему невысокой стоимости. Поэтому материнские платы для Duron были основаны на чипсетах SIS-730S и VIA KM133, видеокарты - встроенные, памяти только 128 Мб.
Офисные задачи
Посмотрим на производительность Celeron-800 в задачах создания и обработки текста, графики и мультимедиа. Для измерения этого параметра традиционно используются тесты BAPCo SYSMark и Ziff-Davis Media Business/CC Winstone. Они содержат фрагменты наиболее распространенных программ и измеряют время их выполнения. При этом SYSMark запускает их по одному, а Winstone измеряет время параллельной работы.
Сначала новый процессор работает в первой, "навороченной" конфигурации (рис. 2, 3 и 4 ). Тест SYSMark2000 показывает, что благодаря более быстродействующей шине Celeron-800 превосходит Celeron-766 на 12%, хотя по частоте разрыв не такой большой - всего 4.5%. Однако догнать Duron-800 ему не удается - разрыв между ними составляет 10%. Далее идет тест Business Winstone-2001. Картина похожая - Celeron-766 отстает на 6.2%, Duron-800 впереди на 13%. CC Winstone-2001 подтверждает общую тенденцию: Celeron-766 не дотягивает 9%, а Duron-800 превосходит на 8,6%. Получается, что в реальных офисных задачах повышение частоты хост-шины дает прирост около 5%. Безусловно, разрыв между Celeron и Duron, хорошо видимый при сравнении Duron-600 и Celeron-566 (получается около 20%), сокращается в два раза, однако он по-прежнему остается.
Теперь подошла очередь испытаниям процессоров на "бюджетной" машине (рис. 5, 6 и 7 ). Тут ситуация намного лучше для Celeron. На SYSMark2000 Celeron-800 превзошел предшественника на 10% и сравнялся с Duron-800. Business Winstone показывает, что чипсет VIA может испортить результаты Duron-800 и опустить его ниже Celeron. На тесте CC Winstone Celeron-800 отстает, но всего на 3%. Таким образом, на дешевой и не очень быстродействующей платформе новый Celeron имеет такую же производительность, как и Duron.
Игры
Для тестирования производительности процессоров были выбраны игры Quake-3 Arena (для режима OpenGL) и Unreal Tournament (для DirectX). Обе игры интенсивно нагружают подсистему памяти и используют процессорные ресурсы на полную катушку.
В первой конфигурации (напомню, используется видеокарта GeForce2 GTS) Quake3 в разрешении 640x480x32 (рис. 8 ) показал, что Celeron-800 превосходит Celeron-766 более чем на 20%, но даже Duron-600 для него недостижим. Тут сказываются недостатки устаревшего блока обработки чисел с плавающей запятой. А ведь когда-то Celeron положил на лопатки AMD K6-2 именно благодаря этому блоку! Кроме того, у Duron больше объем кэша (128К+64К), да и его шина EV6 имеет более высокую пропускную способность (передача данных на частоте 200 МГц). Смена разрешения на 1024x768x32 (рис. 9 ) сокращает разрыв - нагрузка распределяется в сторону видеокарты и AGP-порта, но и тут Celeron не может догнать даже Duron-600.
Unreal Tournament дает похожую картину (рис. 10 и 11 ), только тут разница в производительности меньше, и Celeron-800 догоняет-таки Duron-600. Однако Duron-800 по-прежнему впереди и на 10% превосходит соперника. Очевидно, что для игр Celeron сегодня не лучший выбор.
Во второй конфигурации (рис. 12 - 15 ) производительность в играх целиком и полностью ограничивается медленными графическими ядрами, которые к тому же используют системную память для своих нужд. Очевидно, что устаревший i752, встроенный в чипсет i815, не способен составить конкуренцию ни SIS300 (чипсет SIS730S), ни Savage4 (чипсет KM133). Хотя вряд ли подобная система вообще покупается в расчете на игры, тем более такие требовательные, как Quake3 и Unreal Tournament.
Профессиональные OpenGL-приложения
Результаты теста SPECviewperf (рис. 15 ) показывают, что Celeron-800 ничего не выигрывает от повышения частоты шины. Его блок обработки чисел с плавающей запятой не позволяет конкурировать с процессорами Duron, поэтому во всех тестах он отстает даже от Duron-600. Подведем итоги
Увиденные нами результаты тестов позволяют сделать следующие выводы:
1) Celeron получает заметный прирост производительности при использовании шины 100 МГц вместо 66 МГц. Не 50%, конечно, но 5% - это точно. Причем в играх этот прирост заметнее, чем в офисных задачах. Это хорошо объясняется тем, что обычные приложения не часто обращаются за пределы кэша, а игры требуют обработки больших массивов данных.
2) Догнать Duron с аналогичной частотой Celeron-800 не может ни в играх, ни в офисных задачах. Только использование интегрированного чипсета позволяет говорить о равенстве двух этих процессоров, то есть они оба показывают невысокую производительность.
3) Процессор Celeron окончательно потерял свой имидж самого предпочтительного решения для недорогого процессора энтузиаста-экспериментатора. Его цена выше, чем у Duron, возможности разгона приблизительно такие же, производительность на дорогой материнской плате невысока.
4) Для недорого офисного или домашнего компьютера Celeron по-прежнему более предпочтительное решение. Платы на чипсете i810 дешевы, доступны, надежны, чего не скажешь об интегрированных платах для Duron. Ситуация изменится, но еще не скоро.
В чем основная причина отставания Celeron? Видимо, в устаревшей архитектуре и "ущербности" в плане кэша второго уровня. Вернет ли Celeron себе лидерство? Видимо, нет, поскольку через год его место займет Pentium-3 на ядре Tualatin, а старшим в семействе процессоров Intel будет Pentium-4 на ядре Northwood.
Макс Курмаз, hardware@kv.by http://www.kv.by/hardware/
(c) компьютерная газета
Немного истории...
Впервые процессоры Intel разделились на старшие и младшие модели одной архитектуры весной 1998 года, когда был представлен первый Celeron, основанный на ядре Covington. Так как у него не было кэша второго уровня, производительностью он не блистал, и потому через полгода Celeron получил ядро Mendocino. Так как кэш второго уровня у него был небольшим - всего 128 Кб, инженерам Intel удалось разместить оба кэша непосредственно на кристалле и заставить работать на частоте процессора. Тем самым Celeron, имея вдвое меньший кэш второго уровня, мог составить конкуренцию старшему собрату - Pentium-II - практически во всех задачах. Однако следующее ядро, Coppermine, лишило Celeron его преимущества. Сейчас у Pentium-3 точно такой же кэш, как и у Celeron. Более того, ядро современных Celeron, называемое Coppermine-128, на самом деле представляет собой не что иное, как отбракованный кристалл Pentium-3, в котором не работает половина ячеек памяти, отведенных под кристалл.
...немного теории...
В современных процессорах кэш-память - очень важный компонент. Команды и данные ядро процессора получает из кэша первого уровня. Если необходимых данных там нет, то происходит обращение к кэшу второго уровня, который подключается к процессору по отдельной шине. Если данных нет и там, то контроллер кэша посылает запрос контроллеру памяти, данные по хост-шине поступают в кэш второго уровня и становятся доступными процессору. Из этой упрощенной схемы видно, что быстродействие процессора зависит от трех моментов:
1) насколько быстро данные из кэша поступают в исполнительные модули ядра;
2) насколько высока вероятность того, что данные есть в кэше (эффективность кэширования);
3) с какой скоростью данные из памяти смогут поступить в кэш.
Если первый момент касается другой темы - сравнения архитектурных особенностей процессоров Intel и AMD, то два оставшихся как раз и являются причиной отставания Celeron от других процессоров.
Во-первых, половина кэша, оказавшаяся в распоряжении ядра Celeron, работает не так эффективно, как кэш Pentium-3. И дело тут не только в том, что кэш имеет уменьшенный размер. На самом деле блочно-ассоциативный кэш, будучи поделенным пополам, имеет только половину блоков. То есть при необходимости замены одного блока данных другим кэш-контроллер вынужден выбросить один из четырех блоков, а это гораздо хуже, чем выбирать из восьми блоков.
Во-вторых, при необходимости подгрузить в кэш данные Celeron должен ожидать больше, чем другие процессоры, так как шина, соединяющая его с памятью, имеет частоту всего 66 МГц. И хотя в обычных приложениях это случается не часто (90-96% запросов удовлетворяется кэшем), в некоторых задачах, связанных с обработкой больших массивов данных, не умещающихся в кэше, этот фактор дает о себе знать.
Однако выход Celeron-800 позволяет говорить о ликвидации последнего момента. Насколько лучше стал работать Celeron? Для этого воспользуемся результатами тестов, проведенных Анандом Шимпи, руководителем авторитетного Интернет-сайта AnandTech ( http://www.anandtech.com/ ), посвященного компьютерному "железу".
...и практические результаты.
Итак, Ананд провел сравнение производительности четырех процессоров: Intel Celeron-800 (8x100), последний из старой серии - Intel Celeron-766 (11.5x66), самый младший из процессоров AMD - Duron-600 (6x100), аналогичный по частоте подопытному Duron-800 (8x100). Кроме них, в тестировании также участвовали Celeron-566 и Cyrix-III-667. Все тесты проводились на двух разных системах. Первая была предназначена для выявления всего потенциала, заложенного в процессорах. Поэтому конфигурация была самая что ни на есть "навороченная": 256 Мб памяти, материнские платы от ASUS (A7V для Duron, CUSL2 для Athlon), видеокарта GeForce2 GTS, жесткий диск IBM Deskstar 307030. Вторая тестовая конфигурация представляла наиболее вероятное применение этих процессоров, т.е. систему невысокой стоимости. Поэтому материнские платы для Duron были основаны на чипсетах SIS-730S и VIA KM133, видеокарты - встроенные, памяти только 128 Мб.
Офисные задачи
Посмотрим на производительность Celeron-800 в задачах создания и обработки текста, графики и мультимедиа. Для измерения этого параметра традиционно используются тесты BAPCo SYSMark и Ziff-Davis Media Business/CC Winstone. Они содержат фрагменты наиболее распространенных программ и измеряют время их выполнения. При этом SYSMark запускает их по одному, а Winstone измеряет время параллельной работы.
Сначала новый процессор работает в первой, "навороченной" конфигурации (рис. 2, 3 и 4 ). Тест SYSMark2000 показывает, что благодаря более быстродействующей шине Celeron-800 превосходит Celeron-766 на 12%, хотя по частоте разрыв не такой большой - всего 4.5%. Однако догнать Duron-800 ему не удается - разрыв между ними составляет 10%. Далее идет тест Business Winstone-2001. Картина похожая - Celeron-766 отстает на 6.2%, Duron-800 впереди на 13%. CC Winstone-2001 подтверждает общую тенденцию: Celeron-766 не дотягивает 9%, а Duron-800 превосходит на 8,6%. Получается, что в реальных офисных задачах повышение частоты хост-шины дает прирост около 5%. Безусловно, разрыв между Celeron и Duron, хорошо видимый при сравнении Duron-600 и Celeron-566 (получается около 20%), сокращается в два раза, однако он по-прежнему остается.
Теперь подошла очередь испытаниям процессоров на "бюджетной" машине (рис. 5, 6 и 7 ). Тут ситуация намного лучше для Celeron. На SYSMark2000 Celeron-800 превзошел предшественника на 10% и сравнялся с Duron-800. Business Winstone показывает, что чипсет VIA может испортить результаты Duron-800 и опустить его ниже Celeron. На тесте CC Winstone Celeron-800 отстает, но всего на 3%. Таким образом, на дешевой и не очень быстродействующей платформе новый Celeron имеет такую же производительность, как и Duron.
Игры
Для тестирования производительности процессоров были выбраны игры Quake-3 Arena (для режима OpenGL) и Unreal Tournament (для DirectX). Обе игры интенсивно нагружают подсистему памяти и используют процессорные ресурсы на полную катушку.
В первой конфигурации (напомню, используется видеокарта GeForce2 GTS) Quake3 в разрешении 640x480x32 (рис. 8 ) показал, что Celeron-800 превосходит Celeron-766 более чем на 20%, но даже Duron-600 для него недостижим. Тут сказываются недостатки устаревшего блока обработки чисел с плавающей запятой. А ведь когда-то Celeron положил на лопатки AMD K6-2 именно благодаря этому блоку! Кроме того, у Duron больше объем кэша (128К+64К), да и его шина EV6 имеет более высокую пропускную способность (передача данных на частоте 200 МГц). Смена разрешения на 1024x768x32 (рис. 9 ) сокращает разрыв - нагрузка распределяется в сторону видеокарты и AGP-порта, но и тут Celeron не может догнать даже Duron-600.
Unreal Tournament дает похожую картину (рис. 10 и 11 ), только тут разница в производительности меньше, и Celeron-800 догоняет-таки Duron-600. Однако Duron-800 по-прежнему впереди и на 10% превосходит соперника. Очевидно, что для игр Celeron сегодня не лучший выбор.
Во второй конфигурации (рис. 12 - 15 ) производительность в играх целиком и полностью ограничивается медленными графическими ядрами, которые к тому же используют системную память для своих нужд. Очевидно, что устаревший i752, встроенный в чипсет i815, не способен составить конкуренцию ни SIS300 (чипсет SIS730S), ни Savage4 (чипсет KM133). Хотя вряд ли подобная система вообще покупается в расчете на игры, тем более такие требовательные, как Quake3 и Unreal Tournament.
Профессиональные OpenGL-приложения
Результаты теста SPECviewperf (рис. 15 ) показывают, что Celeron-800 ничего не выигрывает от повышения частоты шины. Его блок обработки чисел с плавающей запятой не позволяет конкурировать с процессорами Duron, поэтому во всех тестах он отстает даже от Duron-600. Подведем итоги
Увиденные нами результаты тестов позволяют сделать следующие выводы:
1) Celeron получает заметный прирост производительности при использовании шины 100 МГц вместо 66 МГц. Не 50%, конечно, но 5% - это точно. Причем в играх этот прирост заметнее, чем в офисных задачах. Это хорошо объясняется тем, что обычные приложения не часто обращаются за пределы кэша, а игры требуют обработки больших массивов данных.
2) Догнать Duron с аналогичной частотой Celeron-800 не может ни в играх, ни в офисных задачах. Только использование интегрированного чипсета позволяет говорить о равенстве двух этих процессоров, то есть они оба показывают невысокую производительность.
3) Процессор Celeron окончательно потерял свой имидж самого предпочтительного решения для недорогого процессора энтузиаста-экспериментатора. Его цена выше, чем у Duron, возможности разгона приблизительно такие же, производительность на дорогой материнской плате невысока.
4) Для недорого офисного или домашнего компьютера Celeron по-прежнему более предпочтительное решение. Платы на чипсете i810 дешевы, доступны, надежны, чего не скажешь об интегрированных платах для Duron. Ситуация изменится, но еще не скоро.
В чем основная причина отставания Celeron? Видимо, в устаревшей архитектуре и "ущербности" в плане кэша второго уровня. Вернет ли Celeron себе лидерство? Видимо, нет, поскольку через год его место займет Pentium-3 на ядре Tualatin, а старшим в семействе процессоров Intel будет Pentium-4 на ядре Northwood.
Макс Курмаз, hardware@kv.by http://www.kv.by/hardware/
(c) компьютерная газета
Компьютерная газета. Статья была опубликована в номере 03 за 2001 год в рубрике hard :: процессоры