Обзор видеокарты GeCube Radeon 9550 Platinum Edition.Нужен ли DirectX 9.0 в Low-End? Часть 2

Обзор видеокарты GeCube Radeon 9550 Platinum Edition.Нужен ли DirectX 9.0 в Low-End? Часть 2

Мы продолжаем рассматривать интереснейшую новинку для нижнеценового сектора видеокарт от редкого пока в наших краях брэнда — компании GeCube. Компания начала заявлять о себе всерьез совсем недавно. Главной особенностью видеокарт GeCube является особая серия карт Extreme и Platinum Edition. Карты этой серии выпускаются с тактовыми частотами чипа и/или памяти, значительно превосходящими рекомендованные производителем чипов. Именно рассмотрением того, что же дают лишние мегагерцы рассматриваемой сегодня GeCube Radeon 9550 Platinum Edition, мы и займемся в синтетических тестах.

Исходя из заявленной стоимости платы в 100 вражеских рублей и данных по частотам испытуемой сегодня видеокарты производства GeCube, у которой, напомним нашим читателям, частоты работы значительно повышены относительно канонического решения от ATI — ATI Radeon 9550, мы выбрали для тестирования карты на следующих чипах:
— NVIDIA GeForce FX 5700;
— ATI Radeon 9600 Pro.

По ценам эти два решения весьма схожи. GeCube обещает продавать свои платы по цене около $100, что находится на одном уровне с ценой нынешних решений на базе чипа NVIDIA GeForce FX 5700. Ну, и нам было интересно посмотреть на производительность платы на базе чипа ATI Radeon 9600 Pro, так как решение от GeCube имеет весьма близкие к ней частоты, в то время как цена на платы, базирующиеся на чипе ATI Radeon 9600 Pro, несравненно выше заявленных GeCube 100 вечнозеленых. Брать для сравнения плату на базе ATI Radeon 9600 не имело бы никакого смысла: ее интересно будет рассмотреть, когда к нам в руки попадутся платы на базе канонически верной ATI Radeon 9550, а roadmap GeCube — это поистине что-то будоражащее воображение. Если мы видим коробку GeCube с надписью Extreme, то смело можем ожидать чего-то сверхординарного. Так и получилось с GeCube Radeon 9550 Platinum Edition. Однако давайте посмотрим на результаты тестов, чтобы понять, в каком диапазоне лежит производительность детища GeCube для Low-End-рынка.

Качество 2D
Прежде чем дать оценку качеству изображения, выдаваемому видеокартой GeCube Radeon 9550 Platinum Edition, мы в стотысячный раз повторяем=), что на сегодняшний день более или менее объективную оценку данному параметру для серии видеокарт дать нельзя, т.к. он сильно зависит от конкретного экземпляра, а также от монитора и соединительного кабеля. Качество 2D, показываемое платой в разрешениях 1024x768x85 Hz и 1280х1024х60 Hz, можно охарактеризовать как отменное. Заметных отклонений в этом плане замечено не было.

Разгон
Видеокарта разгонялась при помощи утилиты RivaTuner. Стабильность работы при разгоне проверялась при помощи бенчмарков Future Mark 3DMark2003 v330 и MadOnion 3DMark2001SE. В первом прокручивалась третья игровая сцена Trolls' Lair в зацикленном режиме для быстрого выявления разгонного потенциала плат. После нахождения критических частот 3 раза прокручивался тест 3DMark2001SE. Если на мониторе появлялись искажения (выбитые пиксели, полосы, линии и т.д.), то частоту памяти понижали на несколько мегагерц. Если же компьютер зависал, то понижали частоту графического чипа. Если тесты прокручивались успешно, разгон считался успешным. Дополнительное охлаждение не применялось.
Итак, видеокарту GeCube Radeon 9550 Platinum Edition удалось разогнать до частот 460/560 MHz для ядра и памяти соответственно.
Для номинальных 400/500 MHz очень даже неплохо. В итоге мы имеем не просто заманчивое, а до ужаса заманчивое решение за обещанные 100 долларов, теперь и с учетом разгона. Если честно, то просто не верится, что данные видеокарты будут продаваться в России по такой цене.
Анализ разгона плат — это, конечно, хорошо, но мы не поленимся повторить в две тысячи первый раз, что разгон не является обязательной характеристикой видеокарты, может варьироваться от образца к образцу, и мы также не несем никакой ответственности за оборудование, вышедшее из строя после разгона!
Тестовый стенд:
— Материнская плата: MicroStar K7N2 Delta (nForce 2 Ultra 400).
— Процессор: AMD Athlon XP 3200+ Barton (200x11 = 2200 MHz).
— Память: 2x512 Mb DDR PC 3200 Kingston (двухканальный режим, тайминги 5 3 3 2).
— Винчестер: Maxtor Diamond 9 Plus 120 Gb (8 Mb Cashe).
— Видеокарты:
— MSI GeForce FX 5700;
— GeCube Radeon 9550 Extreme;
— Gigabyte Radeon 9600 Pro.

Операционная система, тестовые программы, драйверы и настройки

Система:
— Microsoft Windows XP SP1 ENG.
— DirectX 9.0b.
— Драйвер для видеокарт NVIDIA — ForceWare 56.72 WHQL;
— Драйвер для видеокарт ATI — Catalyst 4.4 WHQL.
Все излишества и "красивости" в операционной системе убирались, система настраивалась на максимальное быстродействие. Vsync принудительно отключался через драйверы как в OpenGL-, так и в Direct3D-приложениях. Технология сжатия текстур S3TC также отключалась.

Тестовые программы:
— Future Mark 3DMark2003 v340;
— ToMMTi-Systems ShaderMark v2.0 (синтетический DirectX 9 HLSL бенчмарк пиксельных шейдеров);
— iXBT.com/Digit-Life D3D RightMark (комплексный DirectX 9.0 синтетический тест);
— CodeCult Codecreatures v1.0.0 (DirectX 8.1 приложение, шейдеры, Hardware T&L);
— Digital Extreme/Epic Games Unreal Tournament 2003 v2225 (Direct3D, Hardware T&L, вершинные шейдеры, Dot3, cube texturing. Использовалось демо Antalus Flubu);
— Yeti studious Gun Metal Benchmark 2 v1.20s (DirectX 9.0 бенчмарк, Vertex Shaders 2.0, Pixel Shaders 1.1, Hardware T&L);
— Egosoft X2: The Threat (Direct3D, мультитекстурирование, Dot3, режим встроенного в демо-версию бенчмарка);
— Microsoft HALO: Combat Evolved 1.3 (DirectX 9.0, Vertex Shaders 1.1/1.4/2.0, Pixel Shaders 1.1/1.4/2.0, Hardware T&L, качество максимально возможное);
— Massive Development AquaMark 3 (DirectX 9.0, Vertex Shaders 1.1/1.4/ 2.0, Pixel Shaders 1.1/1.4/2.0, Hardwa-re T&L, режим AquaMark3 Triscore);
— Valve Software/Vivendi Universal Games Half-life 2 leaked beta (DirectX 9.0, Vertex Shaders 2.0, Pixel Shaders 2.0, качество по умолчанию, собственные записанные демки-бенчмарки 3Dnews001 и 3Dnews005);
— Legend Ent./Epic Games Unreal II: The Awakening v1403 (Direct3D, вершинные шейдеры, Hardware T&L, Dot3, cube texturing, качество, предлагаемое программой BenchemAll);
— Activision Call of Duty 1.1 (OpenGL, мультитекстурирование. Настройка качества изображения на максимальном уровне. Использовалась одна из собственных записанных демо-записей 3Dnews002 (облет уровня mp_rocket));
— GSC GameWorld/"Руссобит М" FireStarter (DirectX 8.1/DirectX 9.0, пиксельные и вершинные шейдеры, система частиц, динамические источники света, проецируемые текстуры);
— Core Design/Eidos Entaractive Tomb Raider: Angel of Darkness v49 (DirectX 9.0, Vertex Shaders 2.0, Pixel Shaders 2.0, качество по умолчанию, в качестве демок использовались Paris5_4 Demo, Paris1c Demo и Paris2g Demo);
— Crytek/UbiSoft FarCry (DirectX 9.0, Pixel Shaders 2.0, настройки качества на максимально возможном уровне, использовалась собственная записанная демка 3Dnews004);

— People Can Fly/DreamCatcher Interactive Painkiller v 1.15 (DirectX 9.0, пиксельные и вершинные шейдеры (версия не уточняется), проецируемые текстуры, динамическое попиксельное затенение, DOT3 bump mapping и проч.);
— Ubisoft Prince of Persia: Sands of Time (DirectX 8.1, пиксельные шейдеры 1.1, мультитекстурирование);
— CDV Software Entertainment/Brat Designs Breed (DirectX 8.1, пиксельные и вершинные шейдеры 1.1, стенсильные тени, Bump mapping).

Результаты тестирования
Синтетические тесты
По традиции начинаем с нашего коренным образом измененного пакета синтетических тестовых программ.

ShaderMark v2.0
Как хорошо видно из диаграммы, мы наблюдаем традиционное проседание платы NVIDIA в этом тесте. HLSL-шейдеры версии 2.0 никогда не были сильным местом архитектуры чипов NVIDIA GeForce FX. На этот раз ситуация только подтвердилась. Также обратим внимание читателей на результаты GeCube Radeon 9550 Platinum Edition и платы Gigabyte на базе чипа ATI Radeon 9600 Pro. Они практически всегда идентичны. Все достаточно закономерно учитывая одинаковое графическое ядро в первом и втором случаях и полностью идентичную тактовую частоту работы у графических процессоров обеих плат — частоты работы памяти в этом тесте играют заметно меньшую роль: все упирается в скорость обработки шейдеров графическими процессорами.

D3D RightMark
Geometry Processing Speed
Тест позволяет оценить скорость обработки геометрии акселератором. Тест позволяет выбирать следующие модели освещения (вычисляемые на уровне вершин):
1. Ambient Lighting — простейшее константное освещение.
2. 1 Diffuse Light — один диффузный источник света.
3. 2 Diffuse Lights — два диффузных источника света.
4. 3 Diffuse Lights — три диффузных источника света.
5. 1 Diffuse + Specular Light — один диффузно-спекулярный источник.
6. 2 Diffuse + Specular Lights — два диффузно-спекулярных источника.
7. 3 Diffuse + Specular Lights — три диффузно-спекулярных источника.



Использовался же наиболее сложный режим с тремя диффузно-спекулярными источниками света в связке с тремя различными режимами работы: традиционный TCL (Fixed-Function Pipeline), вершинные шейдеры 1.1 и пиксельные шейдеры 1.1, вершинные шейдеры 2.0 и пиксельные шейдеры 2.0; а также наиболее простой режим с амбиентным освещением также в связке с тремя различными режимами работы: традиционный TCL (Fixed-Function Pipeline), вершинные шейдеры 1.1 и пиксельные шейдеры 1.1, вершинные шейдеры 2.0 и пиксельные шейдеры 2.0. В случае Ambient-освещения (простейшее константное освещение) и трансформации мы получаем практический предел пропускной способности карты по обработке треугольников.
В случае сложного режима с тремя диффузно-спекулярными источниками света в связке с тремя различными режимами работы: традиционный TCL (Fixed-Function Pipeline), вершинные шейдеры 1.1 и пиксельные шейдеры 1.1, вершинные шейдеры 2.0 и пиксельные шейдеры 2.0, — мы имеем достаточно прогнозируемые и знакомые нам по предыдущим материалам результаты. В режиме Fixed-Function Pipeline плата MSI на чипе NVIDIA GeForce FX 5700 вне конкуренции. Это достаточно закономерная победа чипов NVIDIA в том плане, что чипы ATI не имеют аппаратной поддержки для эмуляции T&L, а у чипов NVIDIA реализация аппаратных блоков, отвечающих за расчет источников освещения, имеется. Платы на чипах ATI имеют одинаковые, стабильные практически во всех режимах работы, результаты (результаты и у ATI Radeon 9550, и у ATI Radeon 9600 Pro абсолютно идентичны из-за одинаковых тактовых частот работы графических процессоров — по 400 MHz у каждой). Плата же на чипе NVIDIA GeForce FX 5700 заметно лидирует в режиме Fixed-Function Pipeline, но постепенно снижает результаты с ростом версии и сложности используемого шейдера (как хорошо видно в режиме VS 2.0 static flow control (HLSL), чип NVIDIA уже заметно проседает).

В случае Ambient-освещения (простейшее константное освещение) и трансформации, где мы получаем практический предел пропускной способности карты по обработке треугольников, результаты как у представителей плат ATI, так и у представителей плат NVIDIA более ровные, хотя любовь NVIDIA GeForce FX 5700 к режиму Fixed-Function Pipeline все равно отчетливо просматривается=). Лидером в этих тестах являются все же платы ATI — предел пропускной способности по треугольникам у них выше (хотя и ненамного, чем у плат NVIDIA).

Pixel Filling
Тест выполняет множество различных задач, но нас больше всего интересовала возможность измерения производительности закраски буфера кадров. В этом тесте мы использовали две схемы — как в случае одной текстуры размером 256х256, так и при отсутствии таковой.
В случае измерения производительности при закраске буфера кадра при отсутствии текстуры мы можем констатировать лидерство плат ATI, причем между ATI Radeon 9550 и ATI Radeon 9600 Pro разница уже видна невооруженным глазом — в дело вступила ПСП, которая у этих двух плат разная вследствие различной частоты работы памяти (у ATI Radeon 9600 Pro она, напомним, больше). В данном тесте очевидна архитектура 4x1 NVIDIA GeForce FX 5700, которая показывает результаты, полностью соответствующие данной конфигурации числа пиксельных процессоров и текстурников вкупе с тактовой частотой чипа. Пиковые значения отличаются всего лишь на 40-50 миллионах пикселей в секунду от теоретически допустимых, что можно смело считать в свете получаемых абсолютных значений небольшой погрешностью. Чипы ATI в данном тесте традиционно не показывают своей теоретически заявленной пропускной способности пиксельного заполнения.
В случае текстурирования (1 текстура размером 256х256) мы получаем совсем иные результаты, нежели в случае отсутствия текстуры. Теперь в лидерах плата MSI на чипе NVIDIA GeForce FX 5700, платы ATI по-прежнему показывают разные результаты (ATI Radeon 9600 Pro — закономерный лидер), но они чуть-чуть не дотягивают до показателей NVIDIA GeForce FX 5700.

Pixel Shading
Данный тест тестового пакета D3D RightMark позволяет оценить производительность выполнения различных пиксельных шейдеров второй версии. В тесте максимально упрощена геометрия, с тем чтобы свести к минимуму зависимость его результатов от геометрической производительности чипа и проверить работу сугубо пиксельных конвейеров. Приведены режимы работы как с 16-битной, так и с 32-битной точностью работы с плавающей запятой (переключение точности работы актуально только для чипов NVIDIA).
С тестом на вычисление пиксельных шейдеров все три платы в случае использования простых 1.1 пиксельных шейдеров справляются более или менее одинаково, хотя платы ATI все же имеют некоторое преимущество.
Чипы NVIDIA просто разгромлены при исполнении шейдера версии 2.0 при точности работы с плавающей запятой в 32 бит. Да, мы можем сделать оговорку на то, что чип ATI работал в это время со своей неизменной 24-битной точностью, но давайте посмотрим на значения fps при 16-битной точности работы с плавающей запятой. В данном случае в более выгодном положении находится чип NVIDIA, так как он использует меньшую точность работы, нежели чип ATI (у которого абсолютные значения, как то и следует, не меняются — он работает с неизменными 24 битами). Да, значения fps у NVIDIA, как того и следовало ожидать, подросли, но в конечном итоге — опять, увы, фиаско. NVIDIA по результатам теста исполняет пиксельные программы более чем вдвое медленнее, чем ATI.

Point Sprites
Тест направлен на выявление скорости акселератора при выводе точечных спрайтов. Перечислим настраиваемые параметры теста:
— Разрешение.
— Оконный или полноэкранный режим.
— Время тестирования (накопления статистики) в секундах.
— Режим программной эмуляции вершинных шейдеров.
— Режим работы:
• Vertex Shaders 1.1 и Fixed Function Blend Stages;
• Vertex Shaders 2.0 и Fixed Function Blend Stages.
— Режим анимации:
• отсутствует;
• проводится.
— Режим освещения:
• отсутствует;
• проводится.

В настройках теста нами использовались 2 диффузных источника освещения и включенная анимация, мы также исследовали зависимость скорости выполнения операций при выводе точечных спрайтов от версии используемого вершинного шейдера.
По спрайтам сделать однозначного вывода явно нельзя. Чип NVIDIA, как видим, тяготеет к малого размера спрайтам, в то время как чипы ATI неплохо себя чувствуют на средних размеров спрайтах и немного быстрее (ATI Radeon 9600 Pro) на больших спрайтах.
В случае вершинных шейдеров 2.0 плата MSI на чипе NVIDIA GeForce FX 5700 стабильно входит в число аутсайдеров, однако разрыв не такой большой, как, скажем, при использовании пиксельных шейдеров 2.0 в предыдущем тесте (все же задачи здесь исполняются совсем иные).

Hidden Surface Removal
Тест позволяет оценить эффективность удаления акселератором невидимых точек и примитивов. Сцена, генерируемая случайно, затем будет выводиться в одном из трех выбранных режимов:
1. Сортировка по удалению, от ближних к дальним (sorted, front to back order).
2. Сортировка по удалению, от дальних к ближним (sorted, back to front order).
3. Хаотически, без сортировки (unsorted).

Здесь мы, опять-таки, проводим исследование зависимости эффективности удаления акселератором невидимых точек и примитивов от версии используемого вершинного шейдера (1.1 или 2.0).
Не во всех режимах, однако в большинстве их них, HSR-блок у чипа NVIDIA работает явно быстрее, чем у ATI'шных чипов, но здесь на руку чипам NVIDIA играют наши настройки тестов — мы производим текстурную выборку, что может не дать нам 100% правильного результата при оценке эффективности HSR-блока чипа. В ближайшем будущем мы добавим в этой части нашего анализа работы акселератора еще один режим оценки эффективности HSR, дабы получать более ясную картину в этом плане.
В случае перехода на использование шейдеров версии 2.0 общая картина раскладки сил по чипам ATI и NVIDIA не меняется.

Codecreatures
Хорошо нам знакомый тест Codecreatures показывает лидерство платы MicroStar на чипе NVIDIA GeForce FX 5700. Оптимизации NVIDIA вкупе с хорошими характеристиками самого чипа NVIDIA GeForce FX 5700 дают неплохой результат — NVIDIA GeForce FX 5700 — лидер. А как вам нравятся результаты GeCube Radeon 9550 Platinum Edition? Результаты в реальном приложении, основанном на реальном игровом движке, подтверждают результаты, полученные в узких синтетических приложениях: карта GeCube Radeon 9550 Platinum Edition идет практически вровень с решением ATI Radeon 9600 Pro, и это при обещанных 100 долларах за плату!

3DMark 2003 v340
Традиционное баловство с 3DMark'ом=). Мы уже неоднократно имели повод усомниться в результатах этого бенчмарка, а потому не будем в очередной раз вспоминать, кто же в этом споре был прав, а кто виноват, а просто приведем результаты тестирования в данном комплексном пакете для, так сказать, общего ознакомления=). Отметим только, что GeCube Radeon 9550 Platinum Edition здесь снова держится молодцом.
Итак, теперь мы полностью готовы к тому, чтобы заняться исследованием скорости работы платы GeCube Radeon 9550 Platinum Edition и ее конкурента в реальных игровых приложениях (зная ее сильные и слабые места в различных синтетических тестах). Однако этим мы займемся в следующем номере КГ.

Бурдыко Алекс, Knes@tut.by


компьютерная газета


Компьютерная газета. Статья была опубликована в номере 34 за 2004 год в рубрике hard :: video

©1997-2024 Компьютерная газета