Устройство современной видеокарты

Автор работы: Пользователь скрыл имя, 17 Сентября 2012 в 21:20, лекция

Краткое описание

Современные видеокарты — это одна из самых сложных и дорогих составляющих ПК. Фактически видеокарта представляет собой своеобразный компьютер в компьютере.
Плата видеокарты превосходит по сложности разводки и количеству слоев материнскую плату. На самой видеокарте имеется свой процессор и своя оперативная память.

Содержание

1. Устройство современной видеокарты
Графический процессор
Видеопамять
Цифроаналоговый преобразователь (ЦАП, RAMDAC)
Контроллер интерфейса
2. Технологии построения трехмерного изображения
Основные понятия
Технологии повышения реалистичности трехмерного изображения
3. Примеры видеокарт на графических процессорах NVIDIA
4. Примеры видеокарт на графических процессорах AMD
5. Технологии объединения видеокарт

Прикрепленные файлы: 1 файл

Л13_Видеокарты-2012,38(1).docx

— 3.70 Мб (Скачать документ)

Лекция 13

Видеокарты

 

1. Устройство современной  видеокарты

Графический процессор

Видеопамять

Цифроаналоговый преобразователь (ЦАП, RAMDAC)

Контроллер интерфейса

 

2. Технологии построения  трехмерного изображения

Основные понятия

Технологии повышения  реалистичности трехмерного изображения

 

3. Примеры видеокарт  на графических процессорах NVIDIA

 

4. Примеры видеокарт  на графических процессорах AMD

 

5. Технологии объединения  видеокарт

 

Современные видеокарты —  это одна из самых сложных и  дорогих составляющих ПК. Фактически видеокарта представляет собой своеобразный компьютер в компьютере.

Плата видеокарты превосходит  по сложности разводки и количеству слоев материнскую плату. На самой видеокарте имеется свой процессор и своя оперативная память.

Более того NVIDIA и AMD представили наборы инструментальных средств разработчика SDK (Software Development Kit), которые позволяют производить вычисления, характерные для центрального процессора, пользуясь исключительно возможностями графических чипов.

Если вспомнить, что в индустрии центральных процессоров произошла революция и графическое ядро переместилось на кристалл центрального процессора, то в технологическую мощь GPU (Graphics Processing Unit) уверуют все.

 

Сначала дадим представление о видеокарте и как формируется трехмерное изображение.

 

1. Устройство  современной видеокарты

Любая видеокарта включает в  себя следующие обязательные компоненты:

  • графический процессор;
  • микросхему BIOS;
  • видеопамять;
  • цифроаналоговый преобразователь (RAMDAC);
  • контроллер интерфейса.

 

►Графический процессор

На заре развития ПК видеокарты выполняли функцию кадрового буфера. Изображение формировалось ЦП компьютера и ПО, а карта отвечала за хранение в буфере памяти и вывод с определенной частотой кадров на монитор. Потом пришло понимание того факта, что центральный процессор ПК, то есть процессор общего назначения, не в состоянии эффективно решать специфические задачи формирования трехмерного изображения и для этих целей требуется специализированный графический процессор (GPU), который занимался бы исключительно расчетом трехмерного изображения.

Собственно, современные графические процессоры по сложности не уступают центральным процессорам (процессорам общего назначения) и разница заключается лишь в их «специализации», благодаря чему они могут более эффективно справляться с задачей формирования изображения, выводимого на экран монитора.

Как и центральные  процессоры, графические процессоры характеризуются такими параметрами, как ● микроархитектура, ● тактовая частота работы графического ядра и ● технологический процесс производства. Графические процессоры обладают и специфическими характеристиками:

● К примеру, одна из важнейших характеристик графического процессора — это число пиксельных конвейеров (Pixel Pipelines), которое определяет количество обрабатываемых пикселов за один такт. К примеру, количество пиксельных конвейеров может составлять 12 или даже 16.

Отметим, что для построения трехмерного изображения необходимо выполнить целый ряд операций: ▪ принять решение, какие объекты вообще должны присутствовать в сцене (видимые и невидимые), ▪ определить местоположение вершин, которое задает каждый из этих объектов,               ▪ построить по этим вершинам грани, ▪ заполнить получившиеся полигоны текстурами в соответствии с освещением, степенью детализации и с учетом перспективных искажений. Чем тщательнее делаются все расчеты, тем реалистичнее получится трехмерное изображение.

Повысить производительность этих рутинных операций можно, разбив их по стадиям и распараллелив. Именно такие функции и решают пиксельные конвейеры. На каждой стадии каждый пиксельный конвейер занимается тем, что просчитывает очередной пиксел конечного изображения с учетом многих факторов, включая освещение сцены. Для ускорения процесса расчета используют сразу несколько конвейеров. К примеру, если используется 16 пиксельных конвейеров, то первый конвейер обрабатывает 1-й, затем 17-й, затем 33-й пиксел и т.д.; второй конвейер — 2-й, 18-й и 34-й, соответственно.

  ● Количество конвейеров позволяет определить пиковую скорость заполне-ния видеокарты, которая рассчитывается как произведение частоты ядра на количество конвейеров. Если частота ядра 400 МГц, а количество пиксельных конвейеров равно 12, то скорость заполнения будет 4,8 Гпиксел/с.

● Помимо пиксельных конвейеров, различают также количество текстурных блоков в каждом конвейере. Число текстурных блоков определяет количество накладываемых текстур за один проход. К примеру, два текстурных блока могут накладывать от двух до четырех текстур за проход. Количество текстурных блоков позволяет определить скорость заполнения в мегатекселах (пикселах текстур).

● В графических процессорах присутствуют также вершинные конвейеры (Vertex Pipelines), которые отвечают за расчет геометрии трехмерного изображения.

Чтобы структуру  современного графического процессора, рассмотрим более детально процесс конвейерного расчета трехмерного изображения.

►На первом этапе данные о вершинах поступают в вершинные конвейеры, которые занимаются расчетом геометрии сцены. Здесь начинает свою работу т.н. блок T&L (Transform & Lighting), который отвечает за некоторые аспекты работы с геометрией и за освещение и работает в паре с конвейерами. Блок T&L имеет две определяющие характеристики: ● максимальное количество источников света и ● количество обрабатываемых полигонов.

Обработка данных в  вершинном конвейере происходит под управлением специализированной программы - вершинного шейдера (Vertex Shader).

►На следующем этапе задействуется Z-буфер для отсечения невидимых полигонов и граней каркасной модели трехмерного объекта.

►Далее происходит текстурирование объектов с фильтрацией текстур, для чего задействуются пиксельные конвейеры, работающие под управлением специализированной программы - пиксельного шейдера (Pixel Shader).

Необходимо помнить  о программных интерфейсах (Application Programming Interface, API) OpenGL и Direct3D. В них описаны стандарты для работы с трехмерными изображениями. Приложение вызывает стандартную функцию OpenGL или Direct3D, а шейдеры эту функцию выполняют.

►На последнем этапе данные передаются в буфер кадров.

►Видеопамять

Для графического процессора требуется видеопамять, играющая роль кадрового буфера, в который центральный процессор направляет видеоданные, а затем графический процессор считывает оттуда полученную информацию.

Кроме того, в видеопамяти  располагается Z-буфер и хранятся текстуры. Естественно, для обеспечения эффективной передачи данных важна пропускная способность видеопамяти.

Видеопамять графической  карты характеризуется теми же параметрами, что и ОП:

■ пропускная способность шины памяти (определяется разрядностью шины памяти (512-64 бита) и ее эффективной тактовой частотой - до 4 ГГц). Если ширина шины составляет 128 бит (16 байт), а тактовая частота памяти равна 250 МГц, то пропускная способность шины будет 4 Гбайт/с;

■ латентность видеопамяти, т.е. время выборки данных из памяти, определяется используемыми чипами памяти. Латентность современных микросхем видеопамяти составляет 2 нс и менее;

■ важен и объем памяти - минимально 128 Мбайт, а максимально — 2 Гбайт.

 

►ЦАП (RAMDAC)

После обработки  графическим процессором и формирования им изображения данные передаются в цифроаналоговый преобразователь (ЦАП), который отвечает за преобразование цифрового сигнала в аналоговый.

Еще несколько лет  назад значительная часть мониторов  была способна понимать сигнал только в аналоговом виде. Сейчас идет активная смена стандартов, и цифровые интерфейсы теснят аналоговые.

Мониторов и видеокарты показывают, что тренд нового поколения — это интерфейс DisplayPort. He забывают и об уже устоявшихся интерфейсах, таких как DVI и HDMI. Для современных ЖК-дисплеев цифровой сигнал является естественным. Они имеют цифровой видеовход и способны работать с видеосигналом без участия RAMDAC. Но пока на рынке присутствует целый парк моделей с аналоговыми входами, в целях совместимости даже новые видеокарты в обязательном порядке оснащаются цифроаналоговым преобразователем и поддерживают подключение аналоговых устройств.

Главные характеристики RAMDAC: ● тактовая частота и ● разрядность. Многие видеокарты поддерживают одновременную работу с двумя мониторами, поэтому в такие карты устанавливаются по два RAMDAC и соответственно по два разъема для подключения монитора.

 

►Контроллер интерфейса

Контроллер интерфейса отвечает за сопряжение видеокарты с материнской платой компьютера.

● Пользователи уже забыли популярный специализированный графический интерфейс AGP (Accelerated Graphic Port).

К примеру, видеокарты подключались

☻ по интерфейсу AGP 4х с пропускной способностью 1,06 Гбайт/с или

☻ по интерфейсу AGP 8х с пропускной способностью 2,10 Гбайт/с.

На рынке осталось мизерное количество предложений по ним.

 

● На смену AGP пришел более перспективный PCI Express, который уже успел увдвоить быстроту в PCI Expres 2.0. Для подключения графических карт используется версия PCI Express х16 либо х8. Теоретическая пропускная способность такой шины составляет до 8 Гбайт/с в обоих направлениях.

 

● Несмотря на выдающуюся пропускную способность и довольно молодой возраст, PCI Express 2.0 заменяется более скоростным PCI Express 3.0.

 

2. Технологии построения трехмерного  изображения

Основные  понятия

К ним относятся: вершина, полигон и текстура.

 

►Любой объект представляется в виде набора точек в трехмерном пространстве, называемых вершинами. Каждая вершина характеризуется тремя координатами, а система координат определяется тремя осями: горизонтальной (X), вертикальной (Y) и глубины (Z).

Соединяя вершины  между собой, можно любую трехмерную поверхность аппроксимировать набором полигонов (многоугольников), простейшими из которых являются треугольники. Положение этих полигонов и задается вершинами.

Для формирования изображения полигоны необходимо закрасить. Для этого прибегают к текстурам — двухмерным изображениям, которое может «натягиваться» на трехмерные объекты с учетом их формы и положения.

Текстура дает реализм и требует меньше вычислительных ресурсов, позволяя оперировать со всей стеной как с единой поверхностью.

Все текстуры хранятся в памяти, обычно установленной на видеокарте. 

►Чтобы придать реалистичность формируемому изображению, необходимо рассчитать, какие именно объекты должны выводиться на экран, а какие не должны попасть в иоле зрения. К примеру, если один объект находится спереди, а второй позади, то часть второго объекта должна быть невидимой.

Для решения этой задачи применяется метод Z-буферизации. В Z-буфере (глубины) хранятся значения глубины всех пикселов Z. Когда рассчитывается новый пиксел, его глубина сравнивается со значениями глубин уже рассчитанных пикселов с теми же X и Y. Если новый пиксел имеет значение глубины больше какого-либо значения в Z-буфере, то новый пиксел не записывается в буфер для отображения, если меньше — записывается.

►Процесс обработки текстур и информации кадрового буфера называется рендерингом (или процессом закраски).

Аппаратная реализация Z-буферизации значительно увеличивает производительность графической подсистемы. Главная характеристика Z-буфера — это его разрешающая способность. Она критична для высококачественного отображения сцен с большой глубиной. Чем выше разрешающая способность, тем выше дискретность Z-координат и точнее выполняется рендеринг удаленных объектов. Если при рендеринге разрешающей способности не хватает, может случиться, что два перекрывающихся объекта получат одну и ту же координату Z, что вызовет искажение изображения. Видеокарты имеют 32-разрядный Z-буфер.

►Необходимо учитывать эффект полупрозрачности, который создается путем объединения цвета исходного пиксела с пикселом, находящимся в буфере.

В результате цвет точки является комбинацией цветов переднего и заднего планов. Для  учета прозрачности объектов используется альфа-коэффициент прозрачности (от 0 до 1 для каждого цветового пиксела).

►Для создания реалистичной картины необходимо частое обновление  содержимого экрана. При формировании каждого следующего кадра ЗD-акселератор проходит весь путь подсчета заново, поэтому он должен обладать высоким быстродействием.

►В ЗD-графике применяются и другие методы придания плавности движению. Наиболее распространенный — метод двойной буферизации (Double Buffering).

Метод использует два  буфера кадров для получения изображения:

♦ один для отображения картинки,

♦ другой для рендеринга.

В то время как  отображается содержимое одного буфера, в другом происходит рендеринг. Когда  очередной кадр обработан, буферы переключаются (меняются местами).

Информация о работе Устройство современной видеокарты