Видеокарта Sapphire Radeon HD 5770 – новый уровень производительности в среднем ценовом диапазоне с поддержкой DirectX 11

Серия графических ускорителей ATI (AMD) Radeon HD 4ххх оказалась весьма удачной и конкурентоспособной. Отчасти благодаря ей была значительно поднята планка производительности видеокарт, рассчитанных на средний бюджет. Однако анонсированные под закат серии топовые ускорители Radeon HD 4870 и HD4890 достаточно явно показали, что ресурсы архитектуры RV7хх исчерпаны. Дополнительным фактором, стимулирующим обновление графических процессоров, стал выход новой операционной системы Microsoft Windows 7 с API DirectX 11, крупнобюджетные игры с поддержкой которого были анонсированы на удивление быстро. Не заполнить назревающий вакуум на рынке означало бы неминуемую потерю своей доли "пирога", и AMD здесь сработала очень вовремя, выпустив новую серию ускорителей Radeon HD 5ххх и став на какое-то время единственным производителем, предлагающим видеокарты с поддержкой DirectX 11. Стоит ли говорить, что вместе с этим была взята и новая планка производительности? Первыми ускорителями нового поколения стали пока что топовые Radeon HD 5870 и HD 5850. Как и любые другие продукты верхнего ценового диапазона, карты, безусловно, весьма интересны, но для большинства потребителей этот интерес является чисто теоретическим. Ведь основная часть покупателей с появлением нового поколения все равно ждут видеокарт среднего ценового диапазона, которые компания представляет несколько позже. Ими стали ускорители Radeon HD 5770 и HD 5750. Что ж, не будем ходить вокруг да около и перейдем к практическому рассмотрению старшей видеокарты из этой пары – Radeon HD 5770, но прежде все же ознакомимся с нововведениями и классификацией всей серии Radeon HD 5ххх.

Кипарис и Можжевельник. Архитектура новых видеочипов ATI Cypress и Juniper

Анонсируя новую серию графических процессоров, вместо безликих и плохо запоминающихся цифробуквенных маркировок AMD стала оперировать кодовыми именами, что уже давно практикуется применительно к центральным процессорам. Так, старший в линейке GPU, применяемый в HD 5870 и HD 5850, получил имя Cypress (Кипарис), а урезанный процессор для HD 5770 и 5750 – Juniper (Можжевельник).

Продукт всех наработок ATI, реализованных в новом поколении, – это чип Cypress, а Juniper – результат традиционного процесса урезания мощности. Новая архитектура получила название TeraScale 2. Принципиальных отличий от предыдущей, лежащей в основе процессоров RV790 и 770, она в себе не несет. Основной задачей, решаемой при разработке Cypress, было наращивание производительности, что и было успешно достигнуто. Производительность нового графического процессора при вычислениях с единичной точностью составляет 2.7 терафлоп, что вдвое выше того, что демонстрировало предыдущее поколение. Cypress содержит 2.15 млрд транзисторов – это более чем вдвое больше, чем в предыдущем топовом GPU RV790, но площадь его кристалла больше лишь на треть.

Как уже было сказано выше, архитектура нового GPU не претерпела кардинальных изменений, и в целом его структурная схема не сильно отличается от схемы RV770.

Одним из наиболее заметных изменений является добавление в чип второго блока растеризации, что должно заметно сказаться на скорости выполнения задач, появившихся вместе с API DirectX 11, таких, как тесселяция. Основная вычислительная мощность Cypress обеспечена 20 SIMD ядрами, каждое из которых состоит из 16 суперскалярных потоковых процессоров. В свою очередь каждый из потоковых процессоров содержит по четыре исполнительных ядра, один блок выполнения специализированных функций, единицу ветвления и блок регистров общего назначения.

Таким образом, Cypress содержит 1600 (20 SIMDx16x5) скалярных 32-битных потоковых процессоров, обеспечивающих производительность 2.72 терафлоп при вычислениях с единичной точностью, и 544 гигафлоп - при точности двоичной.

Каждому из 20 SIMD ядер Cypress выделено по 4 текстурных блока, в сумме это дает 80 TMU, что, соответственно, увеличило скорость
текстурирования. Помимо увеличения количества, в связи с внедрением поддержки DirectX 11, TMU подверглись и качественной доработке. В частности, возникла потребность в поддержке текстур размером до 16384х16384 пикселя и новых алгоритмов сжатия текстур HDR.

Удвоилось по сравнению с RV770 и количество блоков растровых операций (ROP) – у Cypress их в наличии 32. Особых изменений они не претерпели. Известно лишь об увеличении производительности оригинального метода сглаживания CFAA и скорости работы с несколькими буферами одновременно.
Что касается младшего графического процессора Juniper, то для его получения ATI фактически уполовинила Cypress. Это отлично видно, если расположить рядом их структурные блок-схемы.

GPU Juniper содержит 1.04 млрд транзисторов, 800 блоков ALU, 40 текстурных процессоров, 16 ROP. В результате вдвое уменьшилась и теоретическая производительность – с 2.72 терафлоп у Cypress до 1.36 терафлоп у Juniper.

Вдвое отличается и количество контроллеров памяти. В то время как Cypress обладает четырьмя 64-битными контроллерами, у Juniper их осталось только два. Учитывая, что совместно с процессорами используются чипы GDDR5, функционирующие на частоте 1200 МГц, пиковая скорость обмена с памятью у первого равна 153.6 GB/s, а у второго, соответственно, 76.8 GB/s.

Контроллер памяти подвергся очередной оптимизации, причем как в плане производительности, так и качественно. Для увеличения производительности порог поддерживаемых частот чипов GDDR5 был расширен вплоть до 5 ГГц. Из качественных изменений можно отметить появление функции проверки ошибок EDC – Error Detection Code, а также возможность быстрого изменения рабочей частоты и напряжения питания чипов – Fast GDDR5 Link Retraining.

Но отойдем от количественных и качественных изменений аппаратной части и посмотрим, что нового видеочипы предлагают в функциональном плане.

Поддержка нового набора API DirectX 11

Как известно, совместно с Windows 7 – операционной системой, призванной исправить ошибки, допущенные при проектировании Windows Vista, Microsoft анонсировала и новый набор API DirectX 11. При этом после установки соответствующего обновления, одиннадцатая версия становится доступной и для Vista. По сравнению с предшествующей десятой версией, которую многие разработчики просто проигнорировали из-за незначительности изменений по сравнению с девятой, DirectX 11 несет в себе достаточно много нововведений, направленных как на увеличение производительности, так и на улучшение качества 3D-изображения путем внедрения новых технологий для их создания и обработки.

На рельсы увеличения производительности были поставлены многопоточный рендеринг и улучшенная технология DirectCompute. Преимущества многопоточности очевидны – если раньше каждая инструкция или шейдер дожидались очереди на обработку совместно с основным кодом, что создавало задержки, то теперь для них может быть выделен отдельный поток, исполняемый свободным ядром центрального процессора.

DirectCompute 11 в свою очередь может использоваться как для того, чтобы силами GPU помочь CPU в задачах транскодирования, проигрывания или обработки видео высокой четкости, так и для эффективного решения игровых задач (не будем забывать, для чего мы приобретаем новые видеокарты). Таких, как, например, расчет физических эффектов, алгоритмов поведения искусственного интеллекта, трассировка лучей, рендеринг теней и прочих.

В целях улучшения качества изображения в арсенал DirectX 11 были добавлены такие вещи, как поддержка Shader Model 5.0, аппаратная тесселяция, улучшенные тени и компрессия HDR-текстур.

Shader Model 5.0 предоставляет более удобные средства программирования шейдеров, что в первую очередь оценят разработчики, и содержит ряд новых инструкций, предоставляя поддержку двоичной точности.

Тесселяция представляет собой заполнение поверхности объекта большим количеством треугольников с текстурами, что позволяет строить более "гладкие" и детализованные модели. Кстати, само слово "tessellation" может быть переведено с английского как "мощение". Новое поколение GPU AMD с поддержкой DX 11 обзавелось блоком аппаратной тесселяции, что дает надежды на то, что теперь трехмерные модели в играх станут еще более гладкими, без значительного увеличения нагрузки на графический процессор. Обычно технология применяется для увеличения детализации земли и воды, но может использоваться и для более четкой прорисовки персонажей. Для более удобного программирования тесселяции в DX 11 были добавлены два новых шейдера – Domain и Hull.

Реализованные в DirectX 11 улучшенные методы сжатия HDR-текстур позволяют добиться более высокой степени компрессии, достигая соотношения 6:1, с поддержкой аппаратной декомпрессии, что опять-таки позволит более активно применять данные технологии в играх без значительной потери производительности.

Пожалуй, на этом можно закончить краткий обзор новых возможностей набора API DirectX 11, аппаратно поддерживаемого поколением видеокарт ATI Radeon HD 5ххх, и обратить внимание на другие нововведения.

ATI Stream – видеокарта в роли процессора

Как известно, сегодня видеокарты могут применяться не только для игр, но и для вычислений общего назначения. Программное обеспечение ATI Stream позволяет разработчикам обращаться к GPU, возлагая на него некоторые вычислительные задачи, разгружая тем самым центральный процессор или позволяя ему быстрее справиться с поставленной задачей. К слову, аналогичная технология у фактически единственного конкурента ATI – компании NVIDIA – именуется CUDA. Причем если ранее ATI Stream использовалось, главным образом, в задачах ускорения транскодирования видео, то после появления DirectCompute 11 круг может быть расширен весьма и весьма значительно.

Однако далеко не все мы постоянно конвертируем туда и обратно гигабайты видео и загружаем на все 100% даже имеющиеся центральные процессоры, не говоря уже о потребности в вычислительной мощности видеокарты. Правда, AMD нашла весьма изящное решение по популяризации возможностей ATI Stream, предложив использовать мощность простаивающего компьютера для распределенных вычислений. Для тех, кто не в курсе или подзабыл, напомним, что это такое.

Дело в том, что многие задачи физического моделирования, ставящиеся, например, при разработке лекарств, требуют громадных вычислительных мощностей. Вполне естественно, что даже относительно большие исследовательские лаборатории не могут позволить себе иметь в собственном распоряжении несколько суперкомпьютеров. Определенным решением проблемы здесь становится метод распределенных вычислений. Заключается он в том, что вся задача делится на много мелких частей, выкладываемых на сервере в Интернете. Части скачиваются специальным клиентом, после чего расчет запускается на локальном компьютере энтузиаста, решившего поучаствовать в процессе. По окончании расчета результат загружается обратно на сервер. Распределенные вычисления – также очень распространенный вид "спорта" у оверклокеров и компьютерных энтузиастов, служащий благой цели. Людьми создаются целые команды, а на соответствующих сайтах составляются рейтинги лидеров по объемам выполненных вычислений.

AMD с помощью своего ATI Stream предлагает задействовать для вычислений не только процессор, но и видеокарту, и участвовать в проекте Стэндфордского университета Folding@home, в рамках которого проводится компьютерная симуляция свертывания молекул белка с помощью распределенных вычислений.

Модуляция должна помочь в лучшем понимании причин возникновения болезней, вызванных дефектными белками. Пока это самый крупный проект как по мощности, так и по количеству активных участников.

ATI Eyefinity – еще больше мониторов

Технология ATI Eyefinity – это не что иное, как развитие поддержки нескольких мониторов, которые можно использовать для организации нескольких рабочих пространств или для более полного отображения игровой картины. Теперь одна видеокарта может выводить изображение не только сразу на один или два, но и на три и даже на шесть экранов. Последнее, правда, доступно пока лишь в специальной версии Radeon HD 5870. Остальные видеокарты, даже (пока) самая младшая HD 5750, поддерживают до трех видеовыходов одновременно.

Право, сегодня ЖК-мониторы с большими диагоналями на основе TFT-матриц стоят достаточно дешево, поэтому укомплектовать игровой компьютер тройкой недорогих экранов без особого напряжения может даже не самый обеспеченный геймер. Конечно, далеко не каждый решится на это. При этом удобство от такой конфигурации можно получить практически в любой игре. Хватило бы лишь фантазии и желания у разработчиков. В первую очередь от этого, конечно, выиграют всевозможные симуляторы, в которых тройка мониторов должна весьма значительно улучшить эффект присутствия.

Однако технологию могут использовать и, например, стратегии реального времени, где, зафиксировав отображение своей базы на одном из мониторов, больше не нужно будет мотаться по локации для того, чтобы произвести там определенные действия или проконтролировать текущую ситуацию. Помимо этого, трехмониторная конфигурация может быть весьма удобна и для работы.

PowerPlay – гибкое управление электропитанием

Судя по заявленным уровням энергопотребления, видеокарты ATI нового поколения являются весьма экономичными решениями. Особенно это касается энергопотребления в режиме простоя и отсутствия 3D-нагрузки, что отчасти обусловлено развитием технологии управления электропитанием PowerPlay. Технология позволяет динамически управлять частотой графического процессора, памяти и напряжениями их питания в зависимости от характера текущей нагрузки. Очевидно, что помимо экономии электроэнергии это позволяет уменьшить и тепловыделение, а значит, и замедлить вентилятор, тем самым снизив его шум.

Кипарис - для Radeon HD 5870 и HD 5850. Можжевельник - для Radeon HD 5770 и 5750

На основе рассмотренной пары чипов AMD пока представила четыре видеокарты. Cypress лежит в основе Radeon HD 5870 и HD 5850, а на Juniper построены Radeon HD 5770 и 5750. Упрощенные модификации Radeon HD 5850 и 5750 получены традиционно – уменьшением количества вычислительных блоков графических процессоров, а также за счет снижения рабочих частот GPU и видеопамяти. Это достаточно хорошо видно в сводной таблице технических характеристик.

На этом, пожалуй, можно закончить теоретическую часть материала. Практической частью, а именно обзором Sapphire Radeon HD 5770 – первой видеокарты из нового поколения, с которой мы знакомимся на страницах нашей газеты, мы займемся в следующем номере.

Александр Гуриненко


Компьютерная газета. Статья была опубликована в номере 03 за 2010 год в рубрике hard

©1997-2024 Компьютерная газета