Новые процессоры Intel с микроархитектурой Sandy Bridge
Как известно, начало текущего 2011 года было ознаменовано анонсом новой процессорной архитектуры Intel под кодовым именем Sandy Bridge. Состоялось это событие 3 января, то есть аккурат после новогодних праздников ибо, согласитесь, представлять новые процессоры 1 января (а если еще и в России), было бы весьма странно. Событие имеет большое значение для всего мира IT. Все же, как ни крути, да простят меня поклонники AMD, во все времена Intel была локомотивом на процессорном рынке, и каждое новое поколение задавало свою планку производительности CPU.
Микроархитектура Sandy Bridge
Новая процессорная микроархитектура Sandy Bridge построена на 32-нм техпроцессе, освоенном и обкатанном еще на прошлом поколении – Nehalem (Westmere), преемницей которого она и является. Структура процессора, по сути, осталась прежней – он, как и раньше, содержит ряд вычислительных ядер, контроллер памяти, шины PCI Express, DMI и графическое ядро, но теперь все это размещено в едином кристалле, в то время как в Nehalem графическое ядро, контроллеры памяти и шины PCIe, хоть и располагались в корпусе CPU, физически были реализованы на отдельном кристалле. Однако компоновка элементов в Sandy Bridge была значительно переработана. Вычислительные ядра (Core), каждое из которых оснащено своей кэш-памятью уровней L1 и L2, подключены к общей кольцевой шине разрядностью 256 bit. К ней же подключены блоки общей кэш-памяти L3 (Last Level Cache), набор системной логики, получивший название System Agent и включающий в себя двухканальный контроллер памяти (IMC), а также графическое ядро (IGP).
Таким образом, интегрированный графический процессор теперь не только физически размещен на одном кристалле с остальными блоками CPU, но и подключен к общей кэш-памяти 3-го уровня, что поднимает скорость обмена с буфером кадра на новый уровень.
Помимо этого, использование единого кристалла решает и чисто экономические задачи, позволяя снизить себестоимость изготовления CPU, что увеличивает их конкурентоспособность и прибыль от производства. Обкатанный на Westmere 32-нм технологический процесс вполне позволяет выпускать хороший процент годных кремниевых пластин высокой сложности. К тому же практика изготовления и последующая упаковка в один корпус двух кристаллов, произведенных по различным техпроцессам, не только менее рентабельна, но и явно неудобна в организационном плане.
Используемые в составе Sandy Bridge вычислительные ядра были доработаны и получили поддержку новых инструкций для работы с векторными вычислениями – Advanced Vector Extensions (AVX) в дополнение к существующим SSE. Причем, в то время как набор инструкций SSE работал со 128- битными регистрами, разрядность регистров AVX составляет 256 бит. По заверениям Intel, использование AVX способно ускорить некоторые алгоритмы почти на 90%.
Помимо этого был значительно переработан блок предсказания ветвлений, увеличены буферы промежуточных данных и обновлен блок регистров, однако это мало о чем говорит даже продвинутым пользователям и хорошо понятно разве что специалистам, поэтому взглянем на более очевидные изменения.
Платформа LGA 1155. Чипсеты Р67 и Н67 Express
Как и заведено, вместе с новой процессорной микроархитектурой, Intel анонсировала и новый ряд наборов микросхем, вот уже второе поколение которых отвечает за поддержку такой периферии, как порты SATA, USB, карты расширения, сеть, звук и только. Все самое главное, как мы знаем, было размещено под крышкой CPU еще в решениях Nehalem. При этом Intel пока ограничилась лишь двумя чипсетами – P67 и H67 Express.
Зная особенности решений предыдущего поколения, нетрудно догадаться, что чипы Н67 и P67 отличаются только поддержкой встроенного графического ядра. У первого она есть, а у второго, соответственно, нет. И если раньше, когда на рынке присутствовали модели Core i7/i5 для платформы LGA 1156, не оснащенные встроенным графическим ядром, существование чипсета P55 еще можно было оправдать, то теперь в отношении Р67 это сделать сложнее. Ведь в то время, когда графика размещалась на отдельном кристалле, на самые мощные модели CPU, которые явно будут использоваться с дискретной видеокартой (а то и двумя), устанавливать ее не имело смысла. Но теперь GPU – неотъемлемая часть CPU, поэтому чипсет, не умеющий с ней работать, выглядит несколько странно.
Чтобы укрепить позиции P67 Express и аргументировать его присутствие на рынке, Intel приняла меры, хотя все они явно искусственные. Так, в отличие от Н67, чип Р67 позволяет разделять имеющиеся 16 линий контроллера PCI Express 2.0, расположенного в кристалле CPU, на две группы для поддержки конфигураций видеокарт SLI/Cross Fire. Второе отличие – на системе с Р67 доступен "официальный" разгон ядер процессоров (об этом дальше) и памяти, с H67 – нет. Зато чипсет Н67, в свою очередь, позволяет разгонять интегрированную графику.
Об особенностях P67 и H67 Express, касающихся поддержки периферии, мы поговорим позднее, в последующих обзорах соответствующих плат, поэтому, дабы не загромождать материал, пока что пропустим эту тему.
Однако реализованные в Sandy Bridge архитектурные изменения и особенности новых наборов микросхем не описывают очень важного обстоятельства. Дело в том, что новые процессоры выпускаются в новой упаковке – LGA 1155, а значит, физически несовместимы со старыми материнскими платами. Учитывая, что новые чипсеты, а значит и платы, не предлагают пользователям ничего принципиально нового, ведь даже порты SATA 6 Gb/s уже давно реализуются с помощью дискретных контроллеров, факт несовместимости процессоров Sandy Bridge со старыми платами выглядит печально.
Причина несовместимости CPU Sandy Bridge с платформой LGA 1156 лежит на поверхности и заключается в несоответствии схем питания. Новым процессорам Intel нужны три независимые линии питания, а не две, как раньше (подробности ниже). К тому же существенно отличаются и значения используемых напряжений. В любом случае, новые CPU не смогли бы работать на старых платах, поэтому, во избежание коллизий со стороны непосвященных пользователей, Intel намеренно пошла на реализацию разъема, физически несовместимого со старым.
Intel HD Graphics 3000/2000
Начать описание развития новой интегрированной графики Intel стоит с определения ее "места под солнцем". Не секрет, что абсолютное большинство существующих интегрированных графических процессоров все еще трудно назвать подходящими для современных игр, и эта ситуация вряд ли изменится даже в обозримом будущем. Ведь полноценный графический процессор для игр по сложности структуры вполне может тягаться с процессором центральным, не говоря уже об энергопотреблении, тепловыделении и цене. Именно поэтому реализация полноценного GPU в составе чипсета и тем более CPU не только затруднительна, но и нецелесообразна. По производительности обработки 3D-графики, как бы ни пытались убедить нас в обратном маркетологи, встроенное видео в лучшем случае способно сравниться с самыми слабыми и дешевыми дискретными видеокартами. Однако в глобальном соотношении для запуска игр со сложной 3D-графикой используются лишь считанные проценты существующих ПК. Ну а от подавляющего большинства оставшейся части в графическом плане требуется лишь качественный вывод изображения на экран и возможность полноценного отображения и обработки всевозможного медиаконтента. Скажем прямо – с этим на вполне приемлемом уровне справлялось и прежнее видеоядро Intel HD Graphics, используемое в составе микроархитектуры Nehalem.
Однако конкуренты – AMD и NVIDIA в данном случае задают темп, заметно отстать от которого означает потерять определенную долю рынка. Особенно заметное значение это имеет в секторе мобильных ПК, где жесткие рамки по энергопотреблению и тепловыделению не позволяют использовать дискретные видеокарты на основе мощных GPU, ввиду чего в их составе чаще всего применяются адаптеры на основе графики начального уровня. Думается, что завоевание позиций в этом секторе и явилось приоритетной задачей Intel при разработке ядра HD Graphics 3000.
Предварительные тесты HD Graphics 3000 показывают, что с этой задачей разработчики Intel справились, ибо теперь встроенное в центральные процессоры ядро вполне может тягаться в играх даже с дискретными адаптерами начального уровня. Очевидно, что не последнюю роль в этом сыграл и перенос графического ядра на один кристалл с CPU, что позволило ему использовать общий кэш L3 и прямой доступ к контроллеру оперативной памяти. Помимо этого, были значительно переработаны и сами вычислительные блоки GPU, хотя их количество по-прежнему равно 12. При этом ожидаемой реализации поддержки набора API DirectX 11 не произошло, но это вполне понятно. Игр с DX11 все еще не так много, а достойные внимания в графическом плане настолько тяжелы, что с ними под силу справиться даже не каждой дискретной карте.
Зато в HD Graphics 3000 был реализован мощный блок аппаратного ускорения кодирования и декодирования видео, что, как минимум, позволит высвободить ядра центрального процессора при необходимости выполнения этих задач.
Наконец, перенос GPU на один кристалл с процессором позволил реализовать полноценное управление его производительностью и, как следствие, энергопотреблением. Частота ядра HD Graphics 3000 может динамически меняться в диапазоне от 850 до 1350 МГц, в зависимости от нагрузки как на сам GPU, так и на ядра CPU.
Однако одного графического ядра для всех моделей маркетологам Intel показалось мало, поэтому в рамках Sandy Bridge появилось еще одно – HD Graphics 2000, содержащее наполовину меньше универсальных процессоров, чем HD Graphics 3000.
Intel Turbo Boost Technology 2.0
При разработке архитектуры Sandy Bridge значительное внимание Intel уделила и развитию технологии адаптивной подстройки производительности – Turbo Boost, новая редакция которой была проиндексирована как 2.0. Впервые технология Turbo Boost была применена Intel в процессорах Nehalem, но там все сводилось к простому увеличению множителя на одну-две единицы для всех ядер сразу в зависимости от текущего энергопотребления CPU. Алгоритм работы Turbo Boost 2.0, благодаря новому блоку PСU (Power Control Unit), не в пример сложнее и агрессивнее. При использовании только одного ядра коэффициент умножения его частоты может увеличиваться на целых четыре единицы, что дает результирующий прирост 400 МГц. И это довольно значительное увеличение. Если в работу включается второе, для обоих множитель становится больше на три единицы относительно номинала. При использовании трех ядер приращение коэффициента снижается до двух единиц, а четырех – до единицы. По поводу логики использования такого алгоритма можно высказать нижеследующие соображения.
Известная проблема многоядерных CPU – это более низкая производительность в однопоточных приложениях, чем у аналогичных по цене моделей с меньшим количеством ядер. Или даже так – человек, значительно переплативший за, например, четырехъядерный процессор в приложениях, плохо приспособленных к многопоточности, может вообще не заметить прироста скорости по сравнению со значительно более дешевым двухъядерным, потому как в нашем гипотетическом случае они будут работать на одной частоте. По всей видимости, разработчики Intel уловили этот момент и нашли довольно изящный выход из ситуации. Так, к примеру, модель со штатной частотой 3,3 ГГц и множителем 33 (Core i5 2500), при использовании технологии Turbo Boost 2.0 во время нагрузки на одно ядро, может повышать его клокинг на целых 400 МГц, а с "разрешенным" (об этом дальше) разгоном — и вовсе на 800 МГц. И это без риска перегрева и превышения номинального энергопотребления. С вовлечением в работу остальных ядер частота снижается, но даже при использовании 100% ресурсов клокинг в рассмотренном примере будет составлять 3.4 ГГц. Таким образом, четырехъядерный процессор с Turbo Boost 2.0 уже может тягаться с работающими на значительно более высокой частоте двухъядерными моделями даже в однопоточных приложениях, где первый не может полностью раскрыть потенциал всех ядер.
В то же время, поскольку за счет Turbo Boost 2.0 значительный разгон происходит только при использовании одного-двух ядер, общая температура и энергопотребление процессора при этом останутся в рамках номинала. Стоит отметить, что схема работы приращения в первую очередь зависит от модели CPU и заложенных в нее ограничений, зависящих от количества активных ядер, а уже во вторую – от текущего энергопотребления и температуры.
Электропитание
Думается, все помнят, что еще в процессорах с микроархитектурой Nehalem был реализован специальный блок управления электропитанием, представляющий собой довольно сложный микроконтроллер. Данный модуль, анализируя текущие температуры ядер и энергопотребление, "разрешал" использование режимов Turbo Boost, а в случае перегрева спасал процессор от выхода из строя путем снижения производительности. В составе микроархитектуры Sandy Bridge этот блок получил дальнейшее развитие. Кристалл процессора был разделен на три домена, каждый из которых имеет раздельное электропитание. Первым и самым энергоемким является домен, содержащий вычислительные ядра и кольцевую шину, вторым – графическое ядро, а в третий вошли контроллеры памяти, шин PCI Express, DMI и системный агент. Таким образом, управление производительностью и энергопотреблением вычислительных ядер и GPU осуществляется независимо от других компонентов.
В настольном сегменте это позволило развить технологию Turbo Boost, переведя приращение производительности на более высокий уровень. Ну а в мобильных ПК это позволяет еще более гибко управлять энергосбережением.
Разгон (теперь только с "разрешения" Intel)
Микроархитектура Sandy Bridge несет с собой плохие новости для оверклокеров, заключающиеся в значительных ограничениях разгона новых процессоров Intel. Традиционный и проверенный прием, ранее подходящий в абсолютном большинстве случаев – увеличение базовой частоты – теперь стал недоступен. Дело в том, что базовая частота новых CPU, составляющая 100 МГц, может повышаться в весьма ограниченных пределах, в среднем не более чем на 3-4% от номинала, а то и меньше. Связано это с тем, что все электрические шины тактуются единым тактовым генератором, интегрированным в кристалл процессора. Поэтому даже небольшое увеличение его частоты вызывает сбои в работе других компонентов, что делает систему неработоспособной. Таким образом, оверклокеры лишились своего главного инструмента для разгона, но остался второй – множитель, а вернее, учитывая, что все CPU теперь многоядерные – множители. Как известно, этот инструмент уже давно и полностью подконтролен производителю процессоров, поэтому разрешение на оверклокинг теперь "выдает" он. Применительно к настольным решениям с архитектурой Sandy Bridge разрешения выглядят следующим образом.
Как видно на иллюстрациях, с точки зрения разгона новые процессоры были разделены на две группы. Оверклокерам адресованы модели с суффиксом "К", обозначающим полностью разблокированный множитель, а те, что без оного – всем остальным. Впрочем, последние тоже можно немного разгонять благодаря тому, что их множитель все же "ограниченно" (терминология Intel) разблокирован. Относительно номинала, коэффициент умножения базовой частоты этих процессоров может быть увеличен на 4 единицы, для каждого из режимов Turbo Boost 2.0. В свою очередь, коэффициент моделей с идентификатором товарной позиции (SKU), содержащим суффикс "К", ограничен лишь цифрой 57. При штатной BCKL 100 МГц такой множитель может дать результирующую частоту 5.7 ГГц, чего вряд ли удастся достичь без применения экстремальных систем охлаждения.
Таким образом, традиционный трюк разумных оверклокеров, заключающийся в покупке относительно недорогой "не оверклокерской" модели процессора с заблокированным множителем и последующем разгоне его до уровня производительности старших CPU, с Sandy Bridge уже не пройдет. Единственное, что, по всей видимости, здесь под силу изменить производителям материнских плат, предоставив при этом возможность довольно значимого разгона модификаций без индекса "K" – это реализовать использование максимального приращения Turbo Boost 2.0 для всех ядер независимо от нагрузки.
Модельные ряды
На момент анонса микроархитектуры Sandy Bridge в модельных рядах Intel присутствовало 14 процессоров, предназначенных для настольных ПК, и 15 — для мобильных. Маркировки бренда Intel Core и модификаторов i3, i5 и i7 остались неизменны. Изменился лишь так называемый товарный номер (SKU – Stock Keeping Unit), в дополнение к которому был введен целый ряд суффиксов.
На сегодняшний день известны следующие варианты суффиксов со следующими значениями:
К – процессоры для настольных ПК с полностью разблокированным множителем;
S – процессоры для настольных ПК с пониженным до 65 Вт максимальным тепловыделением;
Т – процессоры для настольных ПК с пониженным до 45 Вт максимальным тепловыделением;
М – двухъядерные процессоры для мобильных ПК с максимальным тепловыделением 35 Вт;
QM – четырехъядерные процессоры для мобильных ПК с максимальным тепловыделением 45 Вт.
У "обыкновенных" процессоров для настольных ПК с ограниченно разблокированным множителем суффикс отсутствует. Характеристики анонсированных моделей новых CPU для настольных ПК приведены в соответствующей таблице.
Ну а что дальше? Дальше – Ivy Bridge
Ivy Bridge – кодовое имя следующего кристалла CPU Intel, основанного на микроархитектуре Sandy Bridge, который будет изготавливаться по более "мелкому" техпроцессу с допусками 22 нм. Согласно планам Intel, новые процессоры будут выпущены к концу 2011 г. – началу 2012-го и должны будут сменить двухъядерные CPU начального уровня на четырехъядерные, а массовые и производительные четырехъядерные — на шести/восьмиядерные решения. Графическое ядро должно будет, наконец, получить поддержку API DirectX 11, а его производительность, естественно, будет вновь увеличена. При этом грядущие процессоры будут выпускаться во все той же упаковке LGA 1155.
Заключение
Выпустив на рынок микроархитектуру Sandy Bridge, Intel не только в очередной раз поднимает планку производительности, но и увеличивает степень интеграции, решая чисто экономические задачи. Теперь вычислительные ядра, контроллер памяти, контроллер шины PCI Express и графическое ядро не только расположены в одном корпусе с CPU, но и на едином кристалле. Помимо этого, новые процессоры с микроархитектурой Sandy Bridge принесли с собой новый процессорный разъем LGA 1155, новые наборы микросхем и, по всей видимости, стали концом эры оверклокинга в том виде, в котором мы знали его раньше. Все это, определенно, вызовет значительное "движение" на рынке, а значит, новый 2011 год обещает быть интересным.
Александр Гуриненко
Микроархитектура Sandy Bridge
Новая процессорная микроархитектура Sandy Bridge построена на 32-нм техпроцессе, освоенном и обкатанном еще на прошлом поколении – Nehalem (Westmere), преемницей которого она и является. Структура процессора, по сути, осталась прежней – он, как и раньше, содержит ряд вычислительных ядер, контроллер памяти, шины PCI Express, DMI и графическое ядро, но теперь все это размещено в едином кристалле, в то время как в Nehalem графическое ядро, контроллеры памяти и шины PCIe, хоть и располагались в корпусе CPU, физически были реализованы на отдельном кристалле. Однако компоновка элементов в Sandy Bridge была значительно переработана. Вычислительные ядра (Core), каждое из которых оснащено своей кэш-памятью уровней L1 и L2, подключены к общей кольцевой шине разрядностью 256 bit. К ней же подключены блоки общей кэш-памяти L3 (Last Level Cache), набор системной логики, получивший название System Agent и включающий в себя двухканальный контроллер памяти (IMC), а также графическое ядро (IGP).
Таким образом, интегрированный графический процессор теперь не только физически размещен на одном кристалле с остальными блоками CPU, но и подключен к общей кэш-памяти 3-го уровня, что поднимает скорость обмена с буфером кадра на новый уровень.
Помимо этого, использование единого кристалла решает и чисто экономические задачи, позволяя снизить себестоимость изготовления CPU, что увеличивает их конкурентоспособность и прибыль от производства. Обкатанный на Westmere 32-нм технологический процесс вполне позволяет выпускать хороший процент годных кремниевых пластин высокой сложности. К тому же практика изготовления и последующая упаковка в один корпус двух кристаллов, произведенных по различным техпроцессам, не только менее рентабельна, но и явно неудобна в организационном плане.
Используемые в составе Sandy Bridge вычислительные ядра были доработаны и получили поддержку новых инструкций для работы с векторными вычислениями – Advanced Vector Extensions (AVX) в дополнение к существующим SSE. Причем, в то время как набор инструкций SSE работал со 128- битными регистрами, разрядность регистров AVX составляет 256 бит. По заверениям Intel, использование AVX способно ускорить некоторые алгоритмы почти на 90%.
Помимо этого был значительно переработан блок предсказания ветвлений, увеличены буферы промежуточных данных и обновлен блок регистров, однако это мало о чем говорит даже продвинутым пользователям и хорошо понятно разве что специалистам, поэтому взглянем на более очевидные изменения.
Платформа LGA 1155. Чипсеты Р67 и Н67 Express
Как и заведено, вместе с новой процессорной микроархитектурой, Intel анонсировала и новый ряд наборов микросхем, вот уже второе поколение которых отвечает за поддержку такой периферии, как порты SATA, USB, карты расширения, сеть, звук и только. Все самое главное, как мы знаем, было размещено под крышкой CPU еще в решениях Nehalem. При этом Intel пока ограничилась лишь двумя чипсетами – P67 и H67 Express.
Зная особенности решений предыдущего поколения, нетрудно догадаться, что чипы Н67 и P67 отличаются только поддержкой встроенного графического ядра. У первого она есть, а у второго, соответственно, нет. И если раньше, когда на рынке присутствовали модели Core i7/i5 для платформы LGA 1156, не оснащенные встроенным графическим ядром, существование чипсета P55 еще можно было оправдать, то теперь в отношении Р67 это сделать сложнее. Ведь в то время, когда графика размещалась на отдельном кристалле, на самые мощные модели CPU, которые явно будут использоваться с дискретной видеокартой (а то и двумя), устанавливать ее не имело смысла. Но теперь GPU – неотъемлемая часть CPU, поэтому чипсет, не умеющий с ней работать, выглядит несколько странно.
Чтобы укрепить позиции P67 Express и аргументировать его присутствие на рынке, Intel приняла меры, хотя все они явно искусственные. Так, в отличие от Н67, чип Р67 позволяет разделять имеющиеся 16 линий контроллера PCI Express 2.0, расположенного в кристалле CPU, на две группы для поддержки конфигураций видеокарт SLI/Cross Fire. Второе отличие – на системе с Р67 доступен "официальный" разгон ядер процессоров (об этом дальше) и памяти, с H67 – нет. Зато чипсет Н67, в свою очередь, позволяет разгонять интегрированную графику.
Об особенностях P67 и H67 Express, касающихся поддержки периферии, мы поговорим позднее, в последующих обзорах соответствующих плат, поэтому, дабы не загромождать материал, пока что пропустим эту тему.
Однако реализованные в Sandy Bridge архитектурные изменения и особенности новых наборов микросхем не описывают очень важного обстоятельства. Дело в том, что новые процессоры выпускаются в новой упаковке – LGA 1155, а значит, физически несовместимы со старыми материнскими платами. Учитывая, что новые чипсеты, а значит и платы, не предлагают пользователям ничего принципиально нового, ведь даже порты SATA 6 Gb/s уже давно реализуются с помощью дискретных контроллеров, факт несовместимости процессоров Sandy Bridge со старыми платами выглядит печально.
Причина несовместимости CPU Sandy Bridge с платформой LGA 1156 лежит на поверхности и заключается в несоответствии схем питания. Новым процессорам Intel нужны три независимые линии питания, а не две, как раньше (подробности ниже). К тому же существенно отличаются и значения используемых напряжений. В любом случае, новые CPU не смогли бы работать на старых платах, поэтому, во избежание коллизий со стороны непосвященных пользователей, Intel намеренно пошла на реализацию разъема, физически несовместимого со старым.
Intel HD Graphics 3000/2000
Начать описание развития новой интегрированной графики Intel стоит с определения ее "места под солнцем". Не секрет, что абсолютное большинство существующих интегрированных графических процессоров все еще трудно назвать подходящими для современных игр, и эта ситуация вряд ли изменится даже в обозримом будущем. Ведь полноценный графический процессор для игр по сложности структуры вполне может тягаться с процессором центральным, не говоря уже об энергопотреблении, тепловыделении и цене. Именно поэтому реализация полноценного GPU в составе чипсета и тем более CPU не только затруднительна, но и нецелесообразна. По производительности обработки 3D-графики, как бы ни пытались убедить нас в обратном маркетологи, встроенное видео в лучшем случае способно сравниться с самыми слабыми и дешевыми дискретными видеокартами. Однако в глобальном соотношении для запуска игр со сложной 3D-графикой используются лишь считанные проценты существующих ПК. Ну а от подавляющего большинства оставшейся части в графическом плане требуется лишь качественный вывод изображения на экран и возможность полноценного отображения и обработки всевозможного медиаконтента. Скажем прямо – с этим на вполне приемлемом уровне справлялось и прежнее видеоядро Intel HD Graphics, используемое в составе микроархитектуры Nehalem.
Однако конкуренты – AMD и NVIDIA в данном случае задают темп, заметно отстать от которого означает потерять определенную долю рынка. Особенно заметное значение это имеет в секторе мобильных ПК, где жесткие рамки по энергопотреблению и тепловыделению не позволяют использовать дискретные видеокарты на основе мощных GPU, ввиду чего в их составе чаще всего применяются адаптеры на основе графики начального уровня. Думается, что завоевание позиций в этом секторе и явилось приоритетной задачей Intel при разработке ядра HD Graphics 3000.
Предварительные тесты HD Graphics 3000 показывают, что с этой задачей разработчики Intel справились, ибо теперь встроенное в центральные процессоры ядро вполне может тягаться в играх даже с дискретными адаптерами начального уровня. Очевидно, что не последнюю роль в этом сыграл и перенос графического ядра на один кристалл с CPU, что позволило ему использовать общий кэш L3 и прямой доступ к контроллеру оперативной памяти. Помимо этого, были значительно переработаны и сами вычислительные блоки GPU, хотя их количество по-прежнему равно 12. При этом ожидаемой реализации поддержки набора API DirectX 11 не произошло, но это вполне понятно. Игр с DX11 все еще не так много, а достойные внимания в графическом плане настолько тяжелы, что с ними под силу справиться даже не каждой дискретной карте.
Зато в HD Graphics 3000 был реализован мощный блок аппаратного ускорения кодирования и декодирования видео, что, как минимум, позволит высвободить ядра центрального процессора при необходимости выполнения этих задач.
Наконец, перенос GPU на один кристалл с процессором позволил реализовать полноценное управление его производительностью и, как следствие, энергопотреблением. Частота ядра HD Graphics 3000 может динамически меняться в диапазоне от 850 до 1350 МГц, в зависимости от нагрузки как на сам GPU, так и на ядра CPU.
Однако одного графического ядра для всех моделей маркетологам Intel показалось мало, поэтому в рамках Sandy Bridge появилось еще одно – HD Graphics 2000, содержащее наполовину меньше универсальных процессоров, чем HD Graphics 3000.
Intel Turbo Boost Technology 2.0
При разработке архитектуры Sandy Bridge значительное внимание Intel уделила и развитию технологии адаптивной подстройки производительности – Turbo Boost, новая редакция которой была проиндексирована как 2.0. Впервые технология Turbo Boost была применена Intel в процессорах Nehalem, но там все сводилось к простому увеличению множителя на одну-две единицы для всех ядер сразу в зависимости от текущего энергопотребления CPU. Алгоритм работы Turbo Boost 2.0, благодаря новому блоку PСU (Power Control Unit), не в пример сложнее и агрессивнее. При использовании только одного ядра коэффициент умножения его частоты может увеличиваться на целых четыре единицы, что дает результирующий прирост 400 МГц. И это довольно значительное увеличение. Если в работу включается второе, для обоих множитель становится больше на три единицы относительно номинала. При использовании трех ядер приращение коэффициента снижается до двух единиц, а четырех – до единицы. По поводу логики использования такого алгоритма можно высказать нижеследующие соображения.
Известная проблема многоядерных CPU – это более низкая производительность в однопоточных приложениях, чем у аналогичных по цене моделей с меньшим количеством ядер. Или даже так – человек, значительно переплативший за, например, четырехъядерный процессор в приложениях, плохо приспособленных к многопоточности, может вообще не заметить прироста скорости по сравнению со значительно более дешевым двухъядерным, потому как в нашем гипотетическом случае они будут работать на одной частоте. По всей видимости, разработчики Intel уловили этот момент и нашли довольно изящный выход из ситуации. Так, к примеру, модель со штатной частотой 3,3 ГГц и множителем 33 (Core i5 2500), при использовании технологии Turbo Boost 2.0 во время нагрузки на одно ядро, может повышать его клокинг на целых 400 МГц, а с "разрешенным" (об этом дальше) разгоном — и вовсе на 800 МГц. И это без риска перегрева и превышения номинального энергопотребления. С вовлечением в работу остальных ядер частота снижается, но даже при использовании 100% ресурсов клокинг в рассмотренном примере будет составлять 3.4 ГГц. Таким образом, четырехъядерный процессор с Turbo Boost 2.0 уже может тягаться с работающими на значительно более высокой частоте двухъядерными моделями даже в однопоточных приложениях, где первый не может полностью раскрыть потенциал всех ядер.
В то же время, поскольку за счет Turbo Boost 2.0 значительный разгон происходит только при использовании одного-двух ядер, общая температура и энергопотребление процессора при этом останутся в рамках номинала. Стоит отметить, что схема работы приращения в первую очередь зависит от модели CPU и заложенных в нее ограничений, зависящих от количества активных ядер, а уже во вторую – от текущего энергопотребления и температуры.
Электропитание
Думается, все помнят, что еще в процессорах с микроархитектурой Nehalem был реализован специальный блок управления электропитанием, представляющий собой довольно сложный микроконтроллер. Данный модуль, анализируя текущие температуры ядер и энергопотребление, "разрешал" использование режимов Turbo Boost, а в случае перегрева спасал процессор от выхода из строя путем снижения производительности. В составе микроархитектуры Sandy Bridge этот блок получил дальнейшее развитие. Кристалл процессора был разделен на три домена, каждый из которых имеет раздельное электропитание. Первым и самым энергоемким является домен, содержащий вычислительные ядра и кольцевую шину, вторым – графическое ядро, а в третий вошли контроллеры памяти, шин PCI Express, DMI и системный агент. Таким образом, управление производительностью и энергопотреблением вычислительных ядер и GPU осуществляется независимо от других компонентов.
В настольном сегменте это позволило развить технологию Turbo Boost, переведя приращение производительности на более высокий уровень. Ну а в мобильных ПК это позволяет еще более гибко управлять энергосбережением.
Разгон (теперь только с "разрешения" Intel)
Микроархитектура Sandy Bridge несет с собой плохие новости для оверклокеров, заключающиеся в значительных ограничениях разгона новых процессоров Intel. Традиционный и проверенный прием, ранее подходящий в абсолютном большинстве случаев – увеличение базовой частоты – теперь стал недоступен. Дело в том, что базовая частота новых CPU, составляющая 100 МГц, может повышаться в весьма ограниченных пределах, в среднем не более чем на 3-4% от номинала, а то и меньше. Связано это с тем, что все электрические шины тактуются единым тактовым генератором, интегрированным в кристалл процессора. Поэтому даже небольшое увеличение его частоты вызывает сбои в работе других компонентов, что делает систему неработоспособной. Таким образом, оверклокеры лишились своего главного инструмента для разгона, но остался второй – множитель, а вернее, учитывая, что все CPU теперь многоядерные – множители. Как известно, этот инструмент уже давно и полностью подконтролен производителю процессоров, поэтому разрешение на оверклокинг теперь "выдает" он. Применительно к настольным решениям с архитектурой Sandy Bridge разрешения выглядят следующим образом.
Как видно на иллюстрациях, с точки зрения разгона новые процессоры были разделены на две группы. Оверклокерам адресованы модели с суффиксом "К", обозначающим полностью разблокированный множитель, а те, что без оного – всем остальным. Впрочем, последние тоже можно немного разгонять благодаря тому, что их множитель все же "ограниченно" (терминология Intel) разблокирован. Относительно номинала, коэффициент умножения базовой частоты этих процессоров может быть увеличен на 4 единицы, для каждого из режимов Turbo Boost 2.0. В свою очередь, коэффициент моделей с идентификатором товарной позиции (SKU), содержащим суффикс "К", ограничен лишь цифрой 57. При штатной BCKL 100 МГц такой множитель может дать результирующую частоту 5.7 ГГц, чего вряд ли удастся достичь без применения экстремальных систем охлаждения.
Таким образом, традиционный трюк разумных оверклокеров, заключающийся в покупке относительно недорогой "не оверклокерской" модели процессора с заблокированным множителем и последующем разгоне его до уровня производительности старших CPU, с Sandy Bridge уже не пройдет. Единственное, что, по всей видимости, здесь под силу изменить производителям материнских плат, предоставив при этом возможность довольно значимого разгона модификаций без индекса "K" – это реализовать использование максимального приращения Turbo Boost 2.0 для всех ядер независимо от нагрузки.
Модельные ряды
На момент анонса микроархитектуры Sandy Bridge в модельных рядах Intel присутствовало 14 процессоров, предназначенных для настольных ПК, и 15 — для мобильных. Маркировки бренда Intel Core и модификаторов i3, i5 и i7 остались неизменны. Изменился лишь так называемый товарный номер (SKU – Stock Keeping Unit), в дополнение к которому был введен целый ряд суффиксов.
На сегодняшний день известны следующие варианты суффиксов со следующими значениями:
К – процессоры для настольных ПК с полностью разблокированным множителем;
S – процессоры для настольных ПК с пониженным до 65 Вт максимальным тепловыделением;
Т – процессоры для настольных ПК с пониженным до 45 Вт максимальным тепловыделением;
М – двухъядерные процессоры для мобильных ПК с максимальным тепловыделением 35 Вт;
QM – четырехъядерные процессоры для мобильных ПК с максимальным тепловыделением 45 Вт.
У "обыкновенных" процессоров для настольных ПК с ограниченно разблокированным множителем суффикс отсутствует. Характеристики анонсированных моделей новых CPU для настольных ПК приведены в соответствующей таблице.
Ну а что дальше? Дальше – Ivy Bridge
Ivy Bridge – кодовое имя следующего кристалла CPU Intel, основанного на микроархитектуре Sandy Bridge, который будет изготавливаться по более "мелкому" техпроцессу с допусками 22 нм. Согласно планам Intel, новые процессоры будут выпущены к концу 2011 г. – началу 2012-го и должны будут сменить двухъядерные CPU начального уровня на четырехъядерные, а массовые и производительные четырехъядерные — на шести/восьмиядерные решения. Графическое ядро должно будет, наконец, получить поддержку API DirectX 11, а его производительность, естественно, будет вновь увеличена. При этом грядущие процессоры будут выпускаться во все той же упаковке LGA 1155.
Заключение
Выпустив на рынок микроархитектуру Sandy Bridge, Intel не только в очередной раз поднимает планку производительности, но и увеличивает степень интеграции, решая чисто экономические задачи. Теперь вычислительные ядра, контроллер памяти, контроллер шины PCI Express и графическое ядро не только расположены в одном корпусе с CPU, но и на едином кристалле. Помимо этого, новые процессоры с микроархитектурой Sandy Bridge принесли с собой новый процессорный разъем LGA 1155, новые наборы микросхем и, по всей видимости, стали концом эры оверклокинга в том виде, в котором мы знали его раньше. Все это, определенно, вызовет значительное "движение" на рынке, а значит, новый 2011 год обещает быть интересным.
Александр Гуриненко
Компьютерная газета. Статья была опубликована в номере 04 за 2011 год в рубрике hard