Сравнительное тестирование: GeForce 6800 Ultra против Radeon X800 XT PE

Чипы ATI R420 и NVIDIA NV40 вышли уже достаточно давно. Топовые решения на базе этих графических процессоров сразу же были отданы на тестирование в ведущие онлайновые и оффлайновые издания, и выводы по ним были сделаны незамедлительно. Однако после этого еще очень продолжительное время плат на топовых чипах нельзя было найти в розничной продаже. Самые производительные и самые дорогие решения рядовым покупателям были недоступны даже несмотря на то, что после первых тестов производительности NVIDIA GeForce 6800 Ultra и ATI Radeon X800 XT Platinum Edition многие хардкорные геймеры и компьютерные энтузиасты с толстым кошельком готовы были выложить за одну из этих плат сумасшедшие деньги. И даже сейчас, когда поставки плат на чипах для всех секторов рынка налажены более чем хорошо, топовые решения как на базе чипов ATI, так и на базе графических процессоров NVIDIA редкие гости в прайсах компьютерных фирм. Именно поэтому, как только мы получили возможность взять на тесты серийно выпущенные платы на базе GPU NVIDIA GeForce 6800 Ultra и ATI Radeon X800 XT Platinum Edition, мы тут же решили протестировать этих "монстров производительности" в нашем расширенном наборе тестов из 27 игр с целью выяснить, как же все-таки соотносятся силы между оппонентами сейчас, когда драйверописатели смогли отладить работу чипов во всех ранее вышедших, а также новых приложениях. Также было интересно посмотреть на работу серийно выпущенных плат, а не референс-плат от самих ATI и NVIDIA.

Графические чипы NV40 и R420

Ниже представлена таблица спецификаций чипов NV40 и R420.



ATI RADEON X800 XT PE NVIDIA GeForce 6800 Ultra
Технологический процесс 0,13 мкм low-k 0,13 мкм
Число транзисторов 160 млн 220 млн
Частота работы ядра 520 МГц 425 МГц
Тип видеопамяти GDDR3 SDRAM 256 бит GDDR3 SDRAM 256 бит
Частота работы памяти 1120 МГц 1100 МГц
Пиковая пропускная способность шины видеопамяти 35,8 Гб/сек 35,2 Гб/сек
Максимальный объем видеопамяти 512 Мб 512 Мб
Интерфейс передачи данных AGP 3.0 4x/8x AGP 3.0 4x/8x
Версия шейдеров 2.b 3.0
Типы фильтрации текстур билинейная, трилинейная, анизотропная, трилинейная + анизотропная билинейная, трилинейная, анизотропная, трилинейная + анизотропная
Максимальная степень анизотропной фильтрации 16х 16x
Число вершинных процессоров 6 6
Число пиксельных конвейеров 16 16
Число текстурных блоков на конвейер 1 1
Число бит на канал цвета 10 10
Статические переходы в коде шейдера есть есть
Динамические переходы в коде шейдера нет есть


Если взглянуть на основные технические характеристики чипов обеих компаний, то приходишь к выводу о том, что чипы, предлагаемые на сегодняшний день ATI и NVIDIA, разработаны со строгой оглядкой на решения конкурента. Судите сами: блоки геометрической обработки у обоих графических процессоров имеют одинаковое число вершинных процессоров — 6. По сравнению с решениями предыдущего поколения ATI увеличила количество вершинных процессоров на 2 (у ATI Radeon 9800 XT/ATI Radeon 9800 Pro их было 4), а NVIDIA и вовсе удвоила: 6 вместо 3 у GeForce FX 5950 Ultra и GeForce FX 5900 Ultra. Так или иначе, но на данном этапе конкуренции у обоих крупнейших производителей графических чипов для настольных систем одинаковое число вершинных процессоров. Однако не стоит забывать, что количество вертексных процессоров у разных чипов вовсе не обязательно означает одинаковую функциональность ввиду различных подходов к реализации работы с вершинными шейдерами у каждого из производителей графических чипов. Если вернуться к нашей таблице спецификаций и просмотреть ее на предмет значений, отвечающих за частоты ядер у обоих решений, то мы можем увидеть, что частота ядра у ATI Radeon X800 XT равняется 520 МГц, в то время как NVIDIA GeForce 6800 Ultra имеет заметно меньшую частоту графического ядра — 400 МГц. Именно поэтому ATI R420 с тем же числом вершинных процессоров изначально имеет преимущество над NV40 благодаря гораздо более высокой тактовой частоте ядра. Однако гибкость вершинных процессоров у R420 заметно ниже, чем у NV40. Это выражается в отсутствии поддержки динамических переходов в вершинных шейдерах, а также в невозможности производить выборку текстур. Все вместе это означает, что ATI никоим образом не сможет заявить поддержку вершинных шейдеров 3.0 — ее чип R420 просто физически не способен обрабатывать вершинные шейдеры, соответствующие этой версии.

Количество пиксельных конвейеров — это также одна из ключевых характеристик акселератора, которая влияет на скорость закраски графического процессора. Здесь мы видим абсолютную солидарность ATI и NVIDIA. Обе компании увеличили количество пиксельных конвейеров ровно в два раза, и теперь как NV40, так и R420 имеют по 16 пиксельных конвейеров, что позволяет им выводить по 16 пикселей за такт. Однако утверждение о том, что R420 имеет 16 пиксельных конвейеров, было бы не совсем верным, так как архитектура работы блока закраски у него несколько иная. Если вспомнить блок-схемы презентации архитектуры нового чипа, мы сможем увидеть, что 16 пиксельных конвейеров (представленных схематично в виде небольших "трубочек") сгруппированы в виде 4 блоков по 4 конвейера. По сути, мы имеем дело не с 16, а с 4 пиксельными конвейерами, но каждый из этих блоков умеет работать не с одним-единственным пикселем, а сразу с целым блоком пикселей, называемым "квадом", где находится сразу 4 пикселя в виде блока 2х2. Таким образом мы и получаем 16 выводимых пикселей за такт. Каждый из таких широких 4 пиксельных блоков имеет свою независимую организацию работы и независимо от других блоков имеет свою кэш-память, блоки выборки текстур и сами пиксельные процессоры. По замыслам ATI, такая структура пиксельных конвейеров их чипа R420 должна наилучшим образом уменьшать латентность работы блока закраски графического процессора и наиболее оптимальным образом расходовать вычислительные мощности GPU. В результате ATI получает хорошую возможность более эффективно использовать все выпускаемые ею чипы. Путем отключения одного из 4 блоков пиксельных конвейеров можно получать 12-, 8- и даже 4-конвейерные решения на базе R420. Такой подход для ATI уже далеко не нов — вспомним "трюк" с переделкой ATI Radeon 9800 SE в полноценный ATI Radeon 9800 Pro. Канадская компания давно использует все свои чипы наиболее оптимальным образом, и опыт работы с чипами архитектуры R3XX помогает и в работе с новинками. Если в ходе тестирования работы выпущенного чипа обнаруживаются проблемы в одном из блоков, то он благополучно выключается, и мы можем использовать оставшиеся 3 "больших" пиксельных конвейера для производства менее производительных решений. Именно таким образом была получена модификация чипа ATI Radeon X800 Pro, которая имеет 12 пиксельных конвейера рендеринга, то есть 3 блока. Планируемая в скором времени SE-модификация карт ATI Radeon X800 будет иметь уже только половину пиксельных блоков по сравнению с ATI Radeon X800 XT.

Весьма больным вопросом в свое время был вопрос о точности вычислений при работе с плавающей запятой в пиксельных процессорах. Многочисленные скандалы с 3D Mark'ами и нападки на NVIDIA, которая имела гибкую архитектуру своих графических процессоров GeForce FX, позволяющих им производить вычисления как с 16-битной, так и с 32-битной точностью работы с плавающей запятой. Проблемы заключались в том, что вычисления, производимые в 16-битном формате, имели на выходе явные артефакты в получаемом изображении (бандинг), а 32-битные вычисления обходились NVIDIA очень дорого в плане производительности. ATI же придерживалась в данном вопросе золотой середины: благодаря спецификациям DirectX 9.0 была установлена минимально допустимая точность работы с плавающей запятой — 24 бит. Видимо, решив, что изобретать велосипед, а точнее, наступать на грабли NVIDIA, не стоит, ATI в своем новом чипе придерживается старых 24 бит для вычислений с плавающей запятой, хотя и поддерживает представление данных в 16-битном и 32-битном форматах. И мы можем понять ATI в этом вопросе: качество изображения при такой точности работы с плавающей запятой оптимально для среднестатистического глаза, поддержки шейдеров 3.0 компания вводить не собирается, а это значит, что и улучшать точность работы с плавающей запятой пока рано.
Однако скучное перечисление спецификаций графических процессоров — это вовсе не то, ради чего мы здесь собрались, не правда ли? Поэтому мы переходим к самому интересному — комплексному тестированию двух видеокарт на базе чипов NVIDIA GeForce 6800 Ultra и ATI Radeon X800 XT Platinum Edition в 27 играх. Были протестированы два изделия: плату на чипе ATI Radeon X800 XT Platinum Edition представляло решение от Sapphire, а на чипе NVIDIA GeForce 6800 Ultra — решение от Leadtek.

Тестовый стенд:
Материнская плата: MicroStar K7N2 Delta (nForce 2 Ultra 400).
Процессор: AMD Athlon XP 3200+ Barton (200x11 = 2200 MHz).
Память: 2x512 Мб DDR PC 3200 Kingston (двухканальный режим, тайминги 5 3 3 2).
Винчестер: Maxtor Diamond 9 Plus 120 Гб (8 Мб Cashe).

Операционная система, тестовые программы, драйверы и настройки
Система:
Microsoft Windows XP SP1 ENG.
DirectX 9.0b:
драйвер для видеокарт NVIDIA — ForceWare 71.90 WHQL;
драйвер для видеокарт ATI — Catalyst 5.3 WHQL.
Драйверы NVIDIA: оптимизации трилинейной фильтрации включены, анизотропной — также включены по умолчанию. Драйверы ATI: оптимизации трилинейной фильтрации включены по умолчанию. Все излишества и "красивости" в операционной системе убирались, система настраивалась на максимальное быстродействие. Vsync принудительно отключался через драйверы как в OpenGL-, так и в Direct3D-приложениях. Технология сжатия текстур S3TC также отключалась.

Тестовые программы:
FutureMark 3DMark2003 v340 (комплексный полусинтетический DirectX 9.0 тест, Vertex Shaders 1.1/1.4/2.0, Pixel Shaders 1.1/1.4/2.0); FutureMark 3DMark 2005 (комплексный полусинтетический DirectX 9.0с тест, Vertex Shaders 2.0/3.0, Pixel Shaders 2.0/3.0);
Massive Development AquaMark 3 (комплексный полусинтетический DirectX 9.0 тест, Vertex Shaders 1.1/1.4/2.0, Pixel Shaders 1.1/1.4/2.0, Hardware T&L);
Digital Extreme/Epic Games Unreal Tournament 2004 (Direct3D, Hardware T&L, Dot3, cube texturing);
Legend Ent./Epic Games Unreal II: The Awakening v1403 (Direct3D, Hardware T&L, Dot3, cube texturing);
Activision/Infinity Ward Call of Duty 1.4 (OpenGL, мультитекстурирование);
Activision/id Software Quake 3: Arena 1.32 (OpenGL, мультитекстурирование);
Egosoft X2: The Threat (Direct3D, мультитекстурирование, Dot3, стенсильные тени);
GodGames/Croteam Serious Sam: The Second Encounter 1.07 (OpenGL, мультитекстурирование);
People Can Fly/DreamCatcher Interactive Painkiller v 1.31 (Direct3D, пиксельные и вершинные шейдеры версии 1.1, проецируемые текстуры, динамическое попиксельное затенение, DOT3 bump mapping);
GSC GameWorld/"Руссобит М" FireStarter (Direct3D, пиксельные и вершинные шейдеры версии 1.1, система частиц, динамические источники света, проецируемые текстуры);
Ubisoft Prince of Persia: Warrior Within (Direct3D, пиксельные и вершинные шейдеры 1.1, мультитекстурирование);
CDV Software Entertainment/Brat Designs Breed (Direct3D, пиксельные и вершинные шейдеры 1.1, стенсильные тени, Bump mapping);
Codemasters Colin McRay Rally 2005 (Direct3D, пиксельные и вершинные шейдеры 1.1);
Remedy Int. Max Payne 2: The Fall of Max Payne (Direct3D, пиксельные шейдеры 1.1);
Ion Storm/Eidos Interactive Thief 3: Deadly Shadows (Direct3D, пиксельные и вершинные шейдеры 1.1);
IO Int./Eidos Entaractive Hitman: Contracts (Direct3D, пиксельные и вершинные шейдеры 1.1);
Crytek/UbiSoft FarCry 1.3 (DirectX 9.0, пиксельные и вершинные шейдеры версии 2.0, мультитекстурирование);
Valve Software/Vivendi Universal Games Half-Life 2 (DirectX 9.0, пиксельные и вершинные шейдеры версии 2.0);
Core Design/Eidos Entaractive Tomb Raider: Angel of Darkness v49 (DirectX 9.0, пиксельные и вершинные шейдеры версии 2.0, качество по умолчанию);
Microsoft HALO: Combat Evolved 1.3 (DirectX 9.0, Vertex Shaders 1.1/1.4/2.0, Pixel Shaders 1.1/1.4/2.0, Hardware T&L);
Activision/id Software Doom 3 (OpenGL, мультитекстурирование);
Irrational Games/Vivendi Universal Games Tribes: Vengeance (DirectX 9.0, пиксельные и вершинные шейдеры 2.0 для карт ATI, Hardware T&L); EA Black Box/Electronic Arts Need for Speed: Underground 2 (D3D, пиксельные и вершинные шейдеры 1.1, Hardware T&L);
1С: Maddox Games/1C IL 2 Shturmovik: Forgotten Battles (режим OpenGL, мультитекстурирование, режим максимального качества);
Troika games/Activision Vampire: The Masquerade Bloodlines (DirectX 9.0, пиксельные и вершинные шейдеры версии 2.0, движок Half-Life 2); Starbreeze Studios/Vivendi Universal Games Chronicles of Riddick (DirectX 9.0, пиксельные и вершинные шейдеры версии 2.0).

Результаты тестирования
Комментарии к результатам тестов
Для удобства мы сделали специальную таблицу, где условно указали победу или проигрыш ATI Radeon X800 XT Platinum Edition против NVIDIA GeForce 6800 Ultra. Итоговый результат выводился в сумме по итогам тестов как в режиме чистой скорости, так и в режиме с AA и Aniso. То есть, если карта ATI выигрывала в режиме чистой скорости, но проигрывала в режиме с AA и Aniso, это считалось паритетом. Итак, приступим:


Бенчмарки ATI Radeon X800 XT Platinum Edition vs NVIDIA GeForce 6800 Ultra
3DMark 2003 v340 -
3DMark 2005 +
AquaMark 3 =
Unreal Tournament 2004 =
Unreal II: The Awakening +
X2: The Threat -
Call of Duty -
Quake 3: Arena -
Serious Sam: The Second Encounter -
IL 2 Shturmovik: Forgotten Battles -
Doom 3 -
Painkiller +
Need for Speed: Underground 2 -
Firestarter -
Prince of Persia: Warrior Within -
Breed +
Colin McRay Rally 2005 +
Max Payne 2 +
Thief 3: Deadly Shadows +
Hitman: Contracts +
Tribes: Vengeance +
FarCry +
Half-Life 2 +
Tomb Raider: Angel of Darkness +
HALO: Combat Evolved -
Chronicles of Riddick +
Vampire: The Masquerade Bloodlines =


Итак, по результатам нашего сравнительного тестирования у ATI Radeon X800 XT Platinum Edition 13 побед (+) и 11 поражений (-). Также зафиксировано 3 "ничьи" (=). Отметим также характер приложений, которые любит каждая из карт. NVIDIA традиционно наиболее производительна в OpenGL-играх, а также в играх, которые НЕ оперируют активно пиксельными и вершинными шейдерами 2.0 (а также в некоторых случаях и 1.1). ATI же сильнее в последних выпущенных играх с шейдерами 2.0.

Выводы
По итогам нашего тестирования точно мы можем сказать одно: наиболее быстрые решения от ATI и NVIDIA сегодня (самые быстрые с некоторыми оговорками — уже выпущены несколько разогнанные аналоги, правда, не слишком далеко ушедшие от своих прародителей) спроектированы с четкой оглядкой на конкурента. Производительность обоих решений вместе с отточкой драйверов под все ныне существующие приложения находится на примерно одинаковом уровне. Тем не менее, тестирование выявило лидера — Radeon X800 XT Platinum Edition. Четкие тенденции также хорошо заметны. Конек ATI — игры, активно использующие шейдеры 2.0. NVIDIA удерживает традиционное лидерство в OpenGL (ATI не спасает даже переписанный в их новых драйверах OpenGL-драйвер) и в специально оптимизированных под NVIDIA D3D-приложениях. Выбор на будущее очевиден — топовые карты на чипе ATI, однако местами различия в производительности минимальны, поэтому вопрос выбора топовой видеокарты (особенно в условиях не самого быстрого процессора) остается делом больше личных предпочтений, нежели очевидного выбора.

Видеокарта Leadtek GeForce 6800 Ultra предоставлена интернет-магазином UltraPrice.by

Алексей Бурдыко


Компьютерная газета. Статья была опубликована в номере 16 за 2005 год в рубрике hard :: video

©1997-2024 Компьютерная газета