NVIDIA GeForceFX

NVIDIA GeForceFX

Для компании NVIDIA настали не очень хорошие времена, и, как отметили многие СМИ, она явно сбилась с графика. Новое детище NVIDIA мир уже увидел, кроме того, многие СМИ получили рабочие образцы, а что касается массовых поставок, то они пока еще не начались, да и много всяких слухов ходит вокруг поставок данного графического процессора. Что касается ATI — главного конкурента NVIDIA, — то у нее все неплохо — даже, можно сказать, отлично. Судите сами: компания выпустила один из самых быстрых GPU на сегодняшний день — ATI Radeon 9700 PRO, который до выхода FX'а был самым быстрым графическим чипом, ATI успела также выпустить удешевленную версию 9700-го с более низкими частотами, нежели у Pro-версии, а также урезанные версии — Radeon 9500/9500 PRO.

В данной статье мы рассмотрим новый GPU NVIDIA GeForceFX и его нововведения, а также конструктивные особенности видеокарт, которые будут построены на базе GeForceFX.

Чип NVIDIA GeForceFX
GeForceFX (NV30) — первый чип от компании NVIDIA, при создании которого были использованы технологии ранее приобретенной 3dfx и Gigapixel.
В сравнении c предшественником — GeForce4 Ti — чип очень маленький. Новый чип выполнен по технологическому процессу в 0,13 мкн. Если сравнивать с 0,15-микронным технологическим процессом, новый дизайн предусматривает на 25% больше транзисторов, что теоретически должно увеличить производительность на 25%.
NV30 имеет на 25 миллионов транзисторов больше, чем R300 от ATI.

Технические характеристики и спецификации GPU NVIDIA GeForceFX:
— технологический процесс 0,13 мкн;
— Flip-chip-дизайн;
— 256-битный GPU;
— 125 млн транзисторов;
— поддержка 8 конвейеров пиксельных шейдеров (Pixel Shaders);
— поддержка вертексных шейдеров (x Vertex Shaders);
— частота ядра — 500 MHz;
— память стандарта DDR-II с тактовой частотой в 500 MHz (1 GHz DDR);
— 128-битная шина памяти;
— оптимизированный интерфейс памяти;
— интерфейс AGP 8X;
— FX Flow — новая система охлаждения, предложенная компанией NVIDIA.

Спецификации 3D:
— полная поддержка DirectX 9;
— адаптивная анизотропная фильтрация;
— Intellisample antialiasing;
— 32/64/128-битный формат цвета (переменный);
— Digital Vibrance Control 3.0;
— Pixel Shader 2.0+ (пиксельные шейдеры).

Конструктивные особенности видеокарт, построенных на базе GPU NVIDIA GeForceFX
Из-за большого количества транзисторов (около 125 млн) новый чип рассеивает огромное количество тепла. Компания NVIDIA решила эту проблему с помощью Flow FX. Это новая система охлаждения, напоминающая систему охлаждения от ABIT, ABIT OTES.
Система охлаждения представляет собой медный радиатор, у которого сверху установлен турбинный кулер. Если внимательно посмотреть на фото, то можно увидеть еще один трубчатый радиатор, через который и гонит воздух наш турбокулер. От трубчатого радиатора к медному накрывающему чип радиатору идут трубки, наполненные легкокипящей жидкостью, которая и способствует теплопередаче между радиаторами.
Из-за массивности охлаждающего устройства потребовалось увеличение габаритов карты вширь, что привело к невозможности использования следующего после AGP, PCI-слота.
GeForceFX оснащен двумя интегрированными RAMDAC, частота которых составляет 400 MHz. Максимально поддерживаемое разрешение каждого из них — 2048x1536@85 GH. Также чип оснащен встроенным кодеком для реализации ТВ-выхода.

Видеокарты, построенные на чипе NVIDIA GeForceFX, будут идти вкупе с памятью стандарта DDR-II. Память стандарта DDR-II может передавать по 4 бита за такт, а DDR-память — в два раза меньше, то бишь лишь 2 бита за такт. В результате мы получаем удвоенное значение теоретической пропускной способности без дополнительного увеличения тактовой частоты. Память стандарта DDR исчерпала свой ресурс, и ее производительности недостаточно. DDR-II в сравнении с DDR имеет свои преимущества:
— сниженное потребление энергии, а значит, меньшее выделение тепла — от 2.5 V до 1.8 V;
— более низкое время доступа к памяти, приблизительно от 1,8 ns до 2,2 ns, что примерно соответствует памяти DDR со временем выборки в 2,9 ns;
— линии данных затерминированы на чипе памяти, а не на плате (что приводит к повышению качества сигнала).
Все эти факторы вместе позволяют достигать огромных частот памяти. Видеокарты на базе GeForceFX будут оснащаться памятью с частотой 500 MHz (1 GHz DDR-II) и иметь 128-битную шину. Пропускная способность памяти составит 16 Gb/s. Пропускные способности GeForce4 Ti's и Radeon 9700 Pro — 10.4 Gb/s и 19.6 Gb/s соответственно. Также отметим, что Radeon 9700 Pro имеет 256-битную шину памяти. Как видно из предыдущих строк, пропускная способность памяти выросла, но лишь до 19.6 Gb/s у Radeon 9700 Pro. Однако, как показывают последние тесты, сейчас важно не столько количество гигабайт в секунду, сколько применение специальных технологий работы с памятью. Например, наделавшая много шуму Matrox Parhelia по производительности и близко не может подойти к GeForce4 Ti4600 (NV25), хотя и имеет вдвое большую пропускную способность памяти. GeForceFX (NV30) будет использовать улучшенный высокооптимизированный интерфейс памяти (Lightspeed Memory Architecture), который ранее был применен в GeForce4 Ti4600 (NV25).

Для удобства представления нововведений NVIDIA GeForceFX приведем таблицу, в которой сравним новый флагман с его предшественником и с главным конкурентом — ATI Radeon 9700 PRO.





NVIDIA GeForceFX

NVIDIA GeForce4 Ti4600

ATI Radeon 9700 PRO

Технология чипа

256-bit

256-bit

256-bit

Технологический процесс

0.13 мкн

0.15 мкн

0.15 мкн

Количество транзисторов

125 млн

63 млн

~ 107 млн

Шины памяти

128-bit DDR2

128-bit DDR

256-bit DDR

Пропускная способность памяти

16 Gb/s

10.4 Gb/s

19.8 Gb/s

Pixel Fillrate

~ 4 Gigapixel/s

1.24 Gigapixel/s

2.6 Gigapixel/s

Anti Aliased Fillrate

~ 16 Billion AA Samples/s

4.8 Billion AA Samples/s

15.6 Billion AA Samples/s

FSAA-модификация

8x

4x

6x

Преобразование треугольников

350 M Triangles/s

69 M Triangles/s

325 M Triangles/s

AGP-интерфейс

1x/2x/4x/8x

1x/2x/4x

1x/2x/4x/8x

Объем памяти

128/256 Mb

128 Mb

128/256 Mb

Частота ядра

500 MHz

300 MHz

325 MHz

Частота памяти

500 MHz (1000 DDR2)

325 MHz (650 DDR)

310 MHz (620 DDR)

Тип памяти

BGA 2.0 ns

BGA 2.8 ns

BGA 2.9 ns

Вертексные шейдеры (Vertex Shader)

FP Array

2

4

Конвейеры пикселя (Pixel Pipelines)

8

4

8

Модули текстуры (Texture Units Per Pipe)

1

2

1

Textures per Texture Unit

16

4

8

Vertex S. Version

2.0+

1.1

2.0

Pixel S. Version

2.0+

1.3

2.0

Поддержка DirectX

9.0 (+)

8

9

FSAA Modi

MultiSampling

MultiSampling

MultiSampling

Оптимизация памяти

LMA II Optimized Color Compression

LMA II

Hyper Z III

Выводы изображения

2

2

2

Внутренний Ramdac

2 x 400 MHz

2 x 400 MHz

2 x 400 MHz

Внешний Ramdac




Бит в цветовой канал (Bits per Color Channel)

10

8

10

Блок вершинных программ Intellisample
GeForceFX использует программируемый массив с плавающей запятой, что дает возможность обработки 350 мегавершин в секунду. Для сравнения приведем результаты GeForce4 Ti: 136 мегавершин в секунду, Radeon 9700 PRO — 325 мегавершин в секунду.
Общая производительность блока вершин у флагмана NVIDIA выше, чем у ATI Radeon 9700 Pro. Достигается это более высокой тактовой частотой.
Intellisample ("кто это?" или "что это?") означает оптимизацию качества картинки, технологий фильтрации. Данное название подразумевает также улучшенное сглаживание.
GeForceFX поддерживает цветовую компрессию, которая позволяет сжимать в реальном времени данные до 4:1 без потерь производительности. Новый чип NVIDIA оснащен всеми ранее доступными режимами сглаживания, добавился также новый, 8x-режим. Отличительной особенностью данного режима является количество пикселей для расчета изображения, которое в два раза больше, чем в режиме 4x. Помимо этого NVIDIA стала использовать гамма-коррекцию. NVIDIA обещает, что при включении нового режима 8x производительность будет падать незначительно.
Разработчику не нужно больше постоянно держать в уме диапазоны яркостей, потому что теперь есть динамическая коррекция цвета, которая упрощает работу с уровнями гаммы при программируемых вычислениях.

Пиксельные и вершинные программы
Главный козырь GeForceFX, как считает NVIDIA, — в блоках вершинных и пиксельных программ. Аппаратная поддержка программ является важным шагом в достижении фотореализма. Напомним основные ключевые особенности и улучшения, которые реализованы в DirectX 9:
— пиксельные программы 2.0: наконец-то полностью программируемы;
— вершинные программы 2.0: улучшение гибкости программирования;
— высокоточный цвет с плавающей точкой.
NVIDIA GeForceFX обеспечивает полную поддержку DirectX 9 и даже уходит по прогрессивности своих технологий за ее пределы.

GeForceFX вершинные программы 2.0+ (в скобках указаны стандартные величины для DirectX 9):
— 256 инструкций в хранимой программе (128);
— 256 констант (96);
— векторный регистр адреса (скалярный);
— максимальное число инструкций — 65 536.

GeForceFX пиксельные программы 2.0+ (в скобках указаны стандартные величины для DirectX 9):
— использование 12-битных чисел с фиксированной запятой, 16-битных и 32-битных чисел с плавающей запятой;
— любое число текстурных запросов;
— 1024 инструкции на проход рендеринга;
— 8 текстурных координат (до 16 активных текстур);
— данные с плавающей запятой подвергаются преобразованию ширины;
— преобразования ширины и типа происходят без потери производительности;
— пиксели в группе затрачивают одинаковое число тактов.
Управление потоком, которое применяется к вершинным и пиксельным программам, позволяет оптимизировать работу программ и повысить производительность в целом. Например, в случае, если желаемый результат уже был получен, и рендеринг не нужен, программа отключается еще на ранней стадии, не используя тем самым вычислительную мощь чипа.
GeForceFX поддерживает 16-битный и 32-битный режимы цвета с плавающей запятой.

Выводы
Теоретически GeForceFX превосходит своего конкурента Radeon 9700 Pro. Здесь налицо технологическое превосходство NVIDIA перед ATI. Однако есть еще и практическая часть. Будет ли реальная производительность выше, покажет время. Многое зависит также от разработчиков компьютерных игр. Поддержат ли они новые технологии нового графического ядра NVIDIA GeForceFX — опять-таки, покажет время. Ждем. Битва за наши кошельки и за звание короля графического рынка продолжается. Засим позвольте удалиться.

Артем Семенков, tema@hotbox.ru

При подготовке статьи использовались материалы с сайтов: www.nvidia.com, www.tomshardware.com, www.annadtech.com


Компьютерная газета. Статья была опубликована в номере 11 за 2003 год в рубрике hard :: video

©1997-2024 Компьютерная газета