Архітектура відеокарт Radeon Сayman

Автор работы: Пользователь скрыл имя, 29 Октября 2015 в 19:57, реферат

Краткое описание

Новая графическая архитектура от AMD имеет общие корни с предыдущими чипами. Cypress и другие чипы AMD остаются более эффективными по соотношению производительности и сложности GPU, а также по энергоэффективности, по сравнению с решениями конкурента, а двухчиповый Radeon HD 5970 до сих пор остаётся быстрейшей видеокартой.

Прикрепленные файлы: 1 файл

Информация2.docx

— 322.79 Кб (Скачать документ)

 

Введение

Новая графическая архитектура от AMD имеет общие корни с предыдущими чипами. Cypress и другие чипы AMD остаются более эффективными по соотношению производительности и сложности GPU, а также по энергоэффективности, по сравнению с решениями конкурента, а двухчиповый Radeon HD 5970 до сих пор остаётся быстрейшей видеокартой.

Переход пользователей на решения DirectX 11 не слишком быстрый. По статистике Steam Survey, из 30 миллионов систем пользователей этого сервиса 73% до сих пор основаны на GPU с поддержкой возможностей лишь DirectX 10, а ещё 13% пользователей имеют ещё более старые видеокарты DirectX 9.

Этих пользователей и собирается привлечь к своим новым решениям компания AMD.  Рассмотрим всю линейку решений компании AMD и позиционирование их на рынке по отношению к видеокартам NVIDIA.

Серия HD 5800 разделилась на две: HD 6800 и HD 6900, основанные на чипах Barts и Cayman. Линейка HD 5700 осталась на рынке в неизменном виде, HD 6800 немного спускается вниз по скорости (по отношению к HD 5800), а на смену HD 5800 в верхней части пришли анонсированные решения семейства HD 6900.

Серия Radeon HD 6800 выступает против нескольких вариантов GeForce GTX 460, а двухчиповый HD 5970 остаётся быстрейшим решением на рынке, конкурирующим с GTX 580. А HD 6970 будет бороться лишь с GTX 570, а HD 6950 и вовсе не имеет прямого конкурента.

Переходим к характеристикам анонсированных видеоплат серии Radeon HD 6900, основанных на новом чипе с кодовым названием «Cayman».

 

 

 

 

 

1. Аналитический  обзор аналогов

  • Кодовое имя чипа «Cayman»
  • Технология 40 нм
  • 2,64 млрд. транзисторов (почти на четверть больше, чем у Cypress и в 1,5 раза больше Barts)
  • Площадь кристалла 389 мм2 (в полтора раза больше, чем у Barts)
  • Унифицированная архитектура с массивом общих процессоров для потоковой обработки многочисленных видов данных: вершин, пикселей и др.
  • Аппаратная поддержка DirectX 11, в том числе и новой шейдерной модели — Shader Model 5.0
  • 256-битная шина памяти: четыре контроллера шириной по 64 бита с поддержкой памяти GDDR5
  • Частота ядра до 880 МГц (для Radeon HD 6970)
  • 24 SIMD-ядра, включающих 384 потоковых процессора, и в общем 1536 скалярных ALU для расчётов с плавающей точкой
  • 24 укрупненных текстурных блока, с поддержкой форматов FP16 и FP32
  • 96 блоков текстурной адресации и столько же блоков билинейной фильтрации, с возможностью фильтрации FP16-текстур на полной скорости и поддержкой трилинейной и анизотропной фильтрации для всех текстурных форматов
  • 32 блока ROP с поддержкой режимов антиалиасинга с возможностью программируемой выборки более чем 16 семплов на пиксель, в том числе при FP16- или FP32-формате буфера кадра. Пиковая производительность до 32 отсчетов за такт (в т. ч. для буферов формата FP16), а в режиме без цвета (Z only) — 128 отсчетов за такт
  • Интегрированная поддержка RAMDAC, шести портов Single Link или трёх портов Dual Link DVI, а также HDMI 1.4a и DisplayPort 1.2

 

  Спецификации видеокарт Radeon HD 6970/ HD 6950 Radeon HD 6970

Таблица 1 - Сравнение видеокарт

 

Radeon HD6970

Radeon HD6950

Частота ядра, МГц

880

800

Количество универсальных процессоров

1536

1408

Количество текстурных блоков

96

88

блоков блендинга

32

32

Эффективная частота памяти, ГГц

5,5

5

Объем памяти, Гб

2

2

Пропускная способность, ГБ в сек

176

160

Теоретическая максимальная скорость закраски, Гпикс в с

28,2

25,6

Теоретическая скорость выборки текстур Гпикс в с

84,5

70,4

Энергопотребление, Ватт

250

200

Цена, долл

369

299


       

 

Применение отработанного 40-нанометрового техпроцесса позволило компании AMD выпустить новый топовый GPU, пусть и не в таком виде, каким он мог быть на 32 нм. Сложность Cayman по сравнению с Cypress выросла менее чем на четверть, как и площадь ядра, но некоторые характеристики, влияющие на производительность, остались практически на том же уровне. Это и количество ALU, и неизменное число блоков ROP, да и пропускная способность видеопамяти не сильно выросла. Но всё же, во многом благодаря повышенным тактовым частотам и возросшей эффективности нового чипа AMD, он должен в среднем превзойти Cypress.

Принцип наименования моделей был несколько изменён с предыдущего поколения. По сравнению с предыдущей серией, у топовых решений поменялась не только первая, но и вторая цифра индекса. Radeon HD 6970 и HD 6950 являются наиболее производительными одночиповыми решениями и должны заместить видеокарты HD 5870 и HD 5850, становясь в линейке выше выпущенных недавно решений семейства HD 6800.

Что касается сравнения с конкурентом, то по указанным выше рекомендованным ценам уже должно быть понятно, что HD 6970 должен быть на уровне или несколько производительнее GeForce GTX 570, а вот HD

 

6950 конкурировать пока  особо не с чем.

Два варианта серии, как это принято у видеокарт AMD, отличаются как тактовыми частотами видеочипа и памяти, так и отключенной частью исполнительных блоков у младшей модели. На обе видеокарты новой серии устанавливается память типа GDDR5 одинакового объёма в 2 гигабайта. Это решение может быть обосновано скорее маркетинговыми причинами, ведь оптимальным объёмом памяти на сегодняшний день до сих пор является 1 гигабайт. Но, так как у конкурента на топовых моделях стоит 1,25—1,5 ГБ, ставить меньший объём компании AMD показалось неправильным.

Хотя также вполне возможно и то, что для топовых моделей такой объём оправдан, так как в каких-то случаях нехватка 1 ГБ памяти всё-таки будет наблюдаться, да и для игр на трёх мониторах (Eyefinity) экранный буфер такого объёма будет весьма полезен. Партнёры компании в будущем могут выпустить и модель Radeon HD 6950 с 1 ГБ видеопамяти, так как стоимость её будет ниже, а супервысокие разрешения на трёх мониторах нужны далеко не всем игрокам.

Обе видеокарты имеют двухслотовую систему охлаждения, закрытую привычным для всех современных плат AMD пластмассовым кожухом по всей длине карты. Энергопотребление младшей карты ниже, что позволило обойтись в её случае двумя 6-штырьковыми разъёмами питания. Кроме максимального энергопотребления AMD теперь указывает и типичное потребление в играх (typical gaming power) — показатель потребления, замеренный при тестировании в наборе из 25 популярных игр.

 

  1. Обзор архитектуры Cayman

При проектировании Cayman основными задачами инженеров AMD было создание эффективной графической и вычислительной архитектуры с новыми возможностями GPU, значительное увеличение производительности геометрических блоков, улучшения в алгоритмах, влияющих на качество рендеринга (текстурная фильтрация и полноэкранное сглаживание), а также улучшенное управление питанием.

Архитектуру Cayman можно назвать промежуточным решением между архитектурой Cypress и так и не рождённой 32-нанометровой архитектурой, так как в состав нового GPU были включены лишь некоторые возможности из неё. Цель инженеров по размеру Cayman была +15% к площади Cypress, что позволило потратить эти дополнительные транзисторы на некоторые новые вычислительные и графические возможности.

Архитектура имеет два блока по обработке геометрии и тесселяции (graphics engine, включающий растеризатор, тесселятор и некоторые другие блоки), а также сдвоенный диспетчер. Это одно из важнейших нововведений в Cayman, к которому сподвигло отставание по скорости обработки геометрии от конкурента, уже почти год имеющего распараллеленный графический конвейер.

Рисунок 2. – Архитектура Cayman

Важнейшим архитектурным изменением стала суперскалярная VLIW4 архитектура вычислительных процессоров, в отличие от VLIW5 в предыдущей. С одной стороны это может показаться ухудшением, ведь каждый из имеющихся процессоров теперь может выполнять меньше операций параллельно. Но с другой — это может увеличить эффективность использования (КПД) потоковых процессоров, так как подобрать четыре независимые команды явно проще, чем пять.

Новый графический процессор включает 24 SIMD-ядра, каждое из которых состоит из 16 процессоров, умеющих вычислять до четырех команд одновременно. Другими словами, всего вычислительных блоков в Cayman стало 24×16×4=1536 штук, что даже несколько меньше, чем у Cypress. Но так как КПД использования этих блоков должен увеличиться, то и производительность также вырастет.

Каждое SIMD-ядро нового графического процессора имеет по четыре блока текстурирования, как и в предыдущих GPU, то есть общее число текстурных процессоров — 96 TMU. Это несколько больше, чем у Cypress, и заметно больше, чем имеет топовый чип конкурента. Так, преимущество по текстурированию должно остаться за AMD. Другие численные характеристики мало отличаются от тех же HD 5800 и HD 6800, чип имеет четыре 64-битных контроллера памяти и 256-битную шину в целом, а также 32 блока ROP. Хотя они всё же отличаются от тех, что используются в предыдущих GPU.

 

           2.1 Архитектура потоковых процессоров

Новые потоковые процессоры отличаются от предыдущих тем, что умеют выполнять одновременно до четырёх независимых инструкций (4-way co-issue), и все четыре исполнительных устройства ALU в процессоре имеют одинаковые возможности, в отличие от предыдущей архитектуры.

Каждый потоковый процессор Cypress имеет четыре блока ALU + блок специального назначения SFU (также называемый «T-unit»), служащий для выполнения трансцендентных функций (синус, косинус, логарифм и т. д.), а Cayman выполняет такие команды при помощи трёх из четырёх «обычных» ALU.

Рисунок 2.1 – Архитектура потокового процессора

 

Всё вместе это теоретически даёт лучший показатель эффективности использования потоковых процессоров, по сравнению с VLIW5. Хотя VLIW5 обеспечивает достаточно высокий КПД во многих случаях, но средняя загрузка ALU получается явно ниже 100%, и часто лишь три или четыре блока из пяти заняты работой. Снижение количества ALU в каждом процессоре увеличивает их эффективность, и, по оценке компании AMD, улучшение соотношения скорости вычислений и площади чипа составляет порядка 10%. Плюс к этому, дополнительным бонусом идёт упрощение управляющих блоков: шедулера и управление регистрами.

Ещё одной важной деталью перехода от VLIW5 к VLIW4 является то, что для асимметричной архитектуры сложнее оптимизировать и скомпилировать эффективный код. А для симметричного VLIW4 блока работа компилятора упрощается. И в этом  виден пока что нераскрытый потенциал Cayman — скорее всего, компилятор пока оптимизирован для нового GPU недостаточно и в будущем весьма вероятны приросты по мере оптимизации компилятора для новой архитектуры.

Новая архитектура VLIW4 привела к увеличению производительности вычислений с двойной точностью. 64-битные вычисления теперь исполняются вчетверо медленнее, чем 32-битные. А у решений предыдущей архитектуры это соотношение было ниже — 1/5. Такое изменение позволило повысить пиковую производительность 64-битных вычислений нового Radeon HD 6970 до 675 GFLOPS (для сравнения — у HD 5870 этот показатель равен 544 GFLOPS).

 

    1. Изменения в блоках ROP

Блоки ROP в новом чипе компании AMD также получили некоторые усовершенствования. Cayman теперь умеет значительно быстрее обрабатывать данные в некоторых форматах, в числе которых 16-битный целочисленный (вдвое быстрее) и одно- или двухкомпонентный 32-битный (ускорение в два-четыре раза, в зависимости от количества компонентов). Это улучшение важнее всего для широко распространённых случаев отложенного (deferred) рендеринга, хотя применение 32-битных буферов в играх пока что ограничено.

Рисунок 2.2 – Блок ROP

 

    1. Неграфические вычисления на GPU

Больше всего изменений в Cayman произошло как раз в вычислительных возможностях. Прежде всего нужно отметить асинхронную отправку команд на выполнение и одновременное исполнение нескольких вычислительных процессов (kernel), каждый из которых имеет свою очередь команд и свою область защищённой виртуальной памяти. По сути, в Cayman появились возможности вычислений по принципу MPMD (Multiple Processor/Multiple Data) — когда несколько процессоров выполняют множество потоков данных.

В предыдущих архитектурах компании AMD была возможность одновременного запуска и распределения нескольких процессов (kernel), но они имели лишь один конвейер команд, что затрудняло одновременную работу вычислительных и графических приложений. GPU новой архитектуры способен эффективно выполнять несколько потоков команд одновременно. Потоки имеют свои отдельные кольцевые буферы и очереди, а очередность исполнения команд независима и асинхронна, и выполняются они в зависимости от приоритета. Это позволяет запускать вычисления и получать итоговый результат вне очереди.

Информация о работе Архітектура відеокарт Radeon Сayman