Архітектура відеокарт Radeon Сayman

Автор работы: Пользователь скрыл имя, 29 Октября 2015 в 19:57, реферат

Краткое описание

Новая графическая архитектура от AMD имеет общие корни с предыдущими чипами. Cypress и другие чипы AMD остаются более эффективными по соотношению производительности и сложности GPU, а также по энергоэффективности, по сравнению с решениями конкурента, а двухчиповый Radeon HD 5970 до сих пор остаётся быстрейшей видеокартой.

Прикрепленные файлы: 1 файл

Информация2.docx

— 322.79 Кб (Скачать документ)

Также для каждого kernel новый чип предоставляет независимую виртуальную память, и все потоки команд теперь защищены друг от друга. А в дополнение к асинхронной подаче команд, чип имеет два двунаправленных контроллера прямого доступа к памяти (DMA), что поможет увеличить пропускную способность в обоих направлениях.

 

Рисунок 2.3 – Архитектура GPU

Но и это ещё не все «вычислительные» изменения в Cayman. Появилась возможность выборки данных из памяти в обход ALU напрямую в локальную память, а оптимизированные чтение и комбинированная запись данных увеличила производительность подсистемы ввода-вывода. Также в новом GPU было улучшено управление потоком передачи данных (flow control) и многое другое.

 

    1. Параллельная обработка геометрии

Одним из основных архитектурных преимуществ конкурирующих решений от NVIDIA является распараллеленная обработка геометрии, применяемая во всех их современных решениях, которые весьма эффективны при использовании тесселяции. геометрические примитивы в топовых чипах конкурента AMD обрабатываются одновременно 16-ю блоками, в отличие от одного блока у Cypress и Barts, равно как и остальных предшествующих чипах.

Соответственно, AMD нужно было срочно улучшить производительность геометрических блоков. Частичный шаг был сделан ещё в Barts, оптимизации которого привели к повышению скорости обработки геометрии и тесселяции в полтора раза в лучшем случае. Но даже тесселятор седьмого поколения всё ещё серьёзно уступал тесселяторам Fermi первого же поколения.

Блоки обработки геометрии и тесселяции в Cayman названы уже восьмым поколением, и они получили установку геометрических примитивов (geometry setup) удвоенной скорости, улучшенную буферизацию геометрических данных и двойной блок обработки геометрии. Именно так, AMD тоже пришлось распараллеливать работу над геометрическими данными, хотя и не настолько радикально, как это сделано в GPU конкурента.

Рисунок 2.4 – Блок обработки геометрии

 

Двойной блок геометрии в Cayman обрабатывает два примитива за такт, то есть скорость трансформации и отбрасывания задних граней (backface culling) возросла вдвое, а нагрузка между блоками распределяется при помощи разбиения на тайлы. Вместе с улучшением буферизации, по данным AMD, это приводит к росту производительности тесселяции у топового решения Radeon HD 6970 до трёх раз, по сравнению с HD 5870.

Но всё же, чаще всего скорость обработки геометрии и тесселяции возросла вдвое, а не втрое. Даже по данным самой AMD. Они приводят и цифры из игр и бенчмарков с применением тесселяции, и приросты там достигают впечатляющих цифр порядка 30—70%, в зависимости от количества оттесселированных поверхностей и степени разбиения примитивов.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

    1. Технология AMD PowerTune

Одним из наиболее интересных изменений в Cayman, напрямую не связанным с 3D-графикой, является технология, получившая название PowerTune. Центральные процессоры давно умеют плавно или ступенчато изменять производительность и потребление, снижая некоторые параметры в простое и повышая при нагрузке. Да и видеочипы тоже умеют изменять указанные параметры, но до сих пор делали это ступенчато и не имели пределов, за которые нельзя было бы выйти.

Обычные игры и другие приложения, использующие вычисления на GPU, редко когда предъявляют повышенные требования к питанию и не подходят к опасным пределам энергопотребления, превышающим возможности системы. В отличие от тестов стабильности, вроде Furmark и OCCT, которые выжимают из системы всё до капли. Ещё в семействе Evergreen (серия Radeon HD 5000) был некий зачаток ограничителя производительности при превышении определённого уровня потребления, а в HD 6900 эта система перешла на качественно иной уровень.

Новый GPU имеет специальные датчики во всех блоках чипа, которые отслеживают параметры загрузки, таким образом графический процессор постоянно измеряет нагрузку и энергопотребление и не позволяет выйти последнему за определённый порог, автоматически регулируя частоту и напряжение так, чтобы параметры оставались в рамках указанного теплопакета. Эта технология помогает установить высокие частоты GPU и при этом не бояться, что видеокарта выйдет за безопасные пределы по энергопотреблению.

Наиболее требовательными 3D-приложениями являются средства тестирования стабильности и некоторые из синтетических тестов. А вот игры, даже самые тяжёлые, совсем не требуют максимальной энергии от GPU и не выходят за установленные рамки.

В отличие от ранних технологий управления питанием, PowerTune

 

обеспечивает прямой контроль над энергопотреблением GPU, по сравнению с косвенным управлением при помощи изменения частот и напряжений. И более не требуется ставить ограничитель для избранных приложений, технология будет работать с тем же успехом для всех программ.

Изменение тактовой частоты GPU и полученная при этом производительность при разных уровнях максимального потребления наглядно отображены на следующем графике. На нём указано изменение частоты GPU видеокарты Radeon HD 6950 в тесте Perlin Noise из набора 3DMark Vantage в трёх режимах: по умолчанию и с повышенным пределом по питанию на 5% и 10%. Этот график соответствует тому, что получится при работе наиболее требовательных к питанию приложений:

В режиме по умолчанию GPU не может постоянно работать на частоте в 800 МГц, не превысив установленной AMD границы потребления, и показывает результат на уровне 140 FPS. При добавлении 5% к максимальному потреблению частота GPU становится выше, но всё ещё часто не достигает максимально положенных 800 МГц, и в результате достигается скорость 155 FPS. В случае же добавленных 10% к пределу потребления, чип всегда работает на частоте около 800 МГц и не достигает изменённой границы потребления, показывая при этом 162 средних кадров в секунду.

Если рассматривать обратную ситуацию, когда нужно снизить потребление, то и в таком случае технология будет полезна. AMD приводит пример игры Aliens vs Predator и трёх режимов: по умолчанию, -10% от максимального потребления и -20%. Если в режимах по умолчанию и -10% разница получилась небольшой, то в последнем случае, при снижении потребления на 30 Вт можно получить вполне комфортные 40 FPS вместо 50 FPS при максимальном потреблении:

Таким образом, каждый пользователь может настроить PowerTune под себя (при условии отказа от гарантий, разумеется) и выбрать или меньшее

 

энергопотребление системы, или более высокую производительность в тех приложениях, в которых GPU становится весьма требовательным к питанию. Можно даже вручную настраивать меньшее потребление для постоянной работы и максимальное — для требовательных приложений.

 

  1. Сравнительный анализ видеокарт AMD и NVIDIA

На протяжении длительного времени считалось, что видеокарты Radeon обеспечивают наиболее красивую картинку на мониторе, а решения от NVIDIA обеспечивают максимальную производительность. Последние поколения видеокарт начали опровергать данную аксиому, так как видеокарты от AMD серии Radeon стали гораздо более производительными, а решения от NVIDIA начали обеспечивать достаточно высокое качество конечного изображения. Компания AMD продолжила усовершенствовать свои решения серии Radeon не только в плане повышения производительности, но и в плане улучшения качества итогового изображения.

В этом тесте определяется пиковая производительность выборки текстур (texel rate) в режиме FFP для разного числа текстур, накладываемых на один пиксель:

Рисунок 3. – результаты тесты Pixel Filling

В данном тесте фильтрации 32-битных (8 бит на цвет) текстур большинство видеокарт показывают цифры, далёкие от теоретически возможных.

Получается, что HD 6970 выбирает лишь 67 текселей за один такт из 32-битных текстур при билинейной фильтрации, что почти на треть ниже теоретической цифры в 96 отфильтрованных текселей. Для HD 6950 эти цифры соответствуют 62 текселям из 88 теоретических, то есть эффективность младшей модели получилась чуть выше, и это связано с небольшой разницей по пропускной способности видеопамяти, также влияющей на результаты.

Все карты AMD показывают такую высокую производительность и значительно опережают своих соперников из стана компании NVIDIA. У них ведь и теоретические показатели скорости текстурирования весьма высоки. А вот даже топовая GTX 580 имеет лишь 64 TMU и сильно уступает моделям на Cayman, имеющим 88—96 TMU, да ещё и работающих на более высоких частотах.

  Таблица -2 Сравнение видеокарт GeForce

 

GeForce GTX 580

GeForce GTX 590

Частота ядра, МГц

772

607

Количество универсальных процессоров

512

1024

Количество текстурных блоков

64

128

блоков блендинга

48

96

Эффективная частота памяти, ГГц

4

3,4

Объем памяти, Гб

1,5

3

Пропускная способность, ГБ в сек

192,4

328

Теоретическая максимальная скорость закраски, Гпикс в с

37,1

58

Теоретическая скорость выборки текстур Гпикс в с

49,4

78

Энергопотребление, Ватт

244

365

Цена, долл

499

699


       
         
         
         
         
         
         
         
       
       
       
       

Рисунок 3.1.– Графическое сравнение частоты ядра видеокарт

 

Рисунок 3.2.– Графическое сравнение обьема памяти

 видеокарт

Рисунок 3.3.– Графическое сравнение пропускной способности видеокарт

 

Таблица -3 Сравнение AMD и NVIDIA  видеокарт

 

Видеокарта AMD Radeon HD 6990 имеет большие размеры в отличие от NVIDIA, также отличаются выходы, она имеет четыре miniDP выхода и

один – DVI. Оснащена двумя восьмиконтактными разъёмами для дополнительного питания, установленными в верхней части видеокарты. Максимальная потребляемая мощность отличается незначительно: для Radeon HD 6990 она составляет 375 Вт. Рекомендуемый блок питания для флагмана AMD – мощностью не менее 750 Вт с двумя 150-ваттными разъёмами дополнительного питания, а для CrossFireX-тандема из двух таких видеокарт рекомендуется блок питания мощностью не менее 1200 Вт. Имеет один разъём для создания CrossFireX- или SLI-конфигураций, размещённый традиционно сверху в передней части.

Рядом с этим разъёмом соседствует маленький переключатель, который отвечает вовсе не за выбор основного или резервного BIOS, как это сделано на Radeon HD 6970 или HD 6950, а за частоту работы графического процессора видеокарты. При его включении в положение «2» частота графического процессора увеличивается на 50 МГц. На GeForce GTX 590 такого переключателя нет, а рядом с разъёмом MIO имеются три прорези в кожухе, через которые выбрасывается часть нагретого видеокартой воздуха.

Компоновка видеокарт принципиально одинакова. И у AMD, и у NVIDIA оба графических процессора располагаются на одной плате, но на немного разной высоте относительно продольной оси. Это следствие расположения микросхем памяти видеокарт, которые, кстати, размещены не только с лицевых, но и с обратных сторон печатных плат. На каждый графический процессор приходится по восемь микросхем видеопамяти.

На Radeon HD 6990 установлены два полноценных графических процессора «Cayman». Графические процессоры несут в себе по 1536 унифицированных шейдерных процессоров, 96 текстурных блоков и 32 блока растровых операций. Защитных крышек (теплораспределителей) у кристаллов процессоров видеокарты AMD традиционно нет, а у NVIDIA, также традиционно – есть.

Видеокарта оснащена графической памятью типа GDDR5, набранной 16 микросхемами в BGA-упаковке. На Radeon HD 6990 установлено в общей сложности 4 Гбайта видеопамяти (по 2 Гбайта на каждый графический процессор). На GeForce GTX 590 на каждый процессор приходится по 1,5 Гбайта памяти, а общий объём таким образом составляет 3 Гбайта. На эталонных видеокартах с процессорами «Cayman» AMD традиционно использует микросхемы Hynix с маркировкой H5GQ2H24MFR T2C и номинальным напряжением 1,5 В при теоретической эффективной частоте 5000 МГц, на которой память и функционирует. В 2D-режиме её частота снижается до 600 МГц. Ширина шины обмена с памятью видеокарты составляет 256 бит.

Информация о работе Архітектура відеокарт Radeon Сayman