Nvidia Geforce GTX 580

Direct3d 10: тесты геометрических шейдеров

В пакете RightMark3D 2.0 есть два теста скорости геометрических шейдеров, первый вариант носит название «Galaxy», техника аналогична «point sprites» из предыдущих версий Direct3D. В нем анимируется система частиц на GPU, геометрический шейдер из каждой точки создает четыре вершины, образующих частицу. Аналогичные алгоритмы должны получить широкое использование в будущих играх DirectX 10.

Изменение балансировки в тестах геометрических шейдеров не влияет на конечный результат рендеринга, итоговая картинка всегда абсолютно одинакова, изменяются лишь способы обработки сцены. Параметр «GS load» определяет, в каком из шейдеров производятся вычисления — в вершинном или геометрическом. Количество вычислений всегда одинаково.

Рассмотрим первый вариант теста «Galaxy», с вычислениями в вершинном шейдере, для трёх уровней геометрической сложности:

Соотношение скоростей при разной геометрической сложности сцен примерно одинаково для всех решений, производительность соответствует количеству точек, с каждым шагом падение FPS составляет около двух раз. Задача для современных видеокарт не особенно сложная, производительность в целом ограничена не только скоростью обработки геометрии, но и пропускной способностью памяти в какой-то мере.

Новый топовый графический процессор Nvidia показывает свою силу, во всех режимах заметно обгоняя конкурентов, в том числе даже и двухчиповую карту AMD. Как и ожидалось, выполнение геометрических шейдеров у GF110 осталось весьма эффективным, и новый чип быстрее предыдущего топа примерно на 20%. Посмотрим, как изменится ситуация при переносе части вычислений в геометрический шейдер:

При изменении нагрузки в этом тесте, цифры для решений и Nvidia и AMD почти не изменились. Видеокарты в данном тесте «не замечают» изменения параметра GS load, отвечающего за перенос части вычислений в геометрический шейдер, и показывают аналогичные предыдущей диаграмме результаты. Посмотрим, что изменится в следующем тесте, который предполагает большую нагрузку именно на геометрические шейдеры.

«Hyperlight» — это второй тест геометрических шейдеров, демонстрирующий использование сразу нескольких техник: instancing, stream output, buffer load. В нем используется динамическое создание геометрии при помощи отрисовки в два буфера, а также новая возможность Direct3D 10 — stream output. Первый шейдер генерирует направление лучей, скорость и направление их роста, эти данные помещаются в буфер, который используется вторым шейдером для отрисовки. По каждой точке луча строятся 14 вершин по кругу, всего до миллиона выходных точек.

Новый тип шейдерных программ используется для генерации «лучей», а с параметром «GS load», выставленном в «Heavy», — ещё и для их отрисовки. Иными словами, в режиме «Balanced» геометрические шейдеры используются только для создания и «роста» лучей, вывод осуществляется при помощи «instancing», а в режиме «Heavy» выводом также занимается геометрический шейдер. Сначала рассматриваем лёгкий режим:

Относительные результаты в разных режимах снова соответствуют нагрузке: во всех случаях производительность неплохо масштабируется и близка к теоретическим параметрам, по которым каждый следующий уровень «Polygon count» должен быть менее чем в два раза медленней.

Судя по всему, в этом тесте скорость рендеринга для всех решений не ограничена геометрической производительностью, по крайней мере явно. А результаты двухчипового HD 5970 просто некорректны. Зато новый Geforce GTX 580 является лидером теста и в этот раз превосходит GTX 480 в трёх режимах нагрузки по-разному, в лёгком — на 16%, в тяжелом — уже на 23%. И снова мы видим влияние оптимизаций, повлиявших на баланс в режимах с различной нагрузкой на GPU.

Впрочем, цифры должны сильно измениться на следующей диаграмме, в тесте с более активным использованием геометрических шейдеров. Также будет интересно сравнить друг с другом результаты, полученные в режимах «Balanced» и «Heavy».

Предлагаем ознакомиться  Rendering Quality

Вот в этом тесте мы видим явную разницу между чипами с традиционным графическим конвейером (Radeon) и топовыми чипами с архитектурой Fermi. Да, GF104 по скорости исполнения геометрических шейдеров отстаёт, но это и карта другого ценового диапазона. Зато GF100 и GF110 серьёзно опережают одиночный RV870 (результаты двухчиповой карты снова некорректны).

В общем, возможности топовых чипов Nvidia по обработке геометрии и скорости исполнения геометрических шейдеров явно значительно выше конкурирующих решений AMD. Новое решение GTX 580 в этом тесте опережает предшественника лишь на 11—13%, и в этот раз мы видим явное несоответствие теоретическим показателям. Или увеличение влияния пропускной способности памяти.

Direct3d 10: тесты пиксельных шейдеров ps 4.0 (вычисления)

Следующая пара тестов пиксельных шейдеров содержит минимальное количество текстурных выборок для снижения влияния производительности блоков TMU. В них используется большое количество арифметических операций, и измеряют они именно математическую производительность видеочипов, скорость выполнения арифметических инструкций в пиксельном шейдере.

Первый математический тест — Mineral. Это тест сложного процедурного текстурирования, в котором используются лишь две выборки из текстурных данных и 65 инструкций типа sin и cos.

Чисто математические тесты вряд ли будут особенно интересными в этот раз, так как графический процессор GF110 архитектурно не отличается от своего топового предшественника GF100. И разница в идеале должна соответствовать разнице в частотах и количестве ALU, то есть быть равной где-то около 17%.

Понятно, что решения AMD в таких математических тестах явно останутся значительно более быстрыми, так как в вычислительно сложных задачах разница с ними была явно большей, чем это значение. И современная архитектура AMD в таких случаях имеет большое преимущество перед конкурирующими видеокартами Nvidia.

Что касается сравнения GTX 580 и GTX 480, то тут всё ровно по теории — разница в скорости составила 16%. В общем, все решения расположились примерно соответственно теоретическим показателям, это касается как карт Nvidia, так и AMD. Рассмотрим второй тест шейдерных вычислений, который носит название Fire.

Direct3d 10: тесты пиксельных шейдеров ps 4.0 (текстурирование, циклы)

Во вторую версию RightMark3D вошли два знакомых PS 3.0 теста под Direct3D 9, которые были переписаны под DirectX 10, а также ещё два новых теста. В первую пару добавились возможности включения самозатенения и шейдерного суперсэмплинга, что дополнительно увеличивает нагрузку на видеочипы.

Данные тесты измеряют производительность выполнения пиксельных шейдеров с циклами, при большом количестве текстурных выборок (в самом тяжелом режиме до нескольких сотен выборок на пиксель) и сравнительно небольшой загрузке ALU. Иными словами, в них измеряется скорость текстурных выборок и эффективность ветвлений в пиксельном шейдере.

Первым тестом пиксельных шейдеров будет Fur. При самых низких настройках в нём используется от 15 до 30 текстурных выборок из карты высот и две выборки из основной текстуры. Режим Effect detail — «High» увеличивает количество выборок до 40—80, включение «шейдерного» суперсэмплинга — до 60—120 выборок, а режим «High» совместно с SSAA отличается максимальной «тяжестью» — от 160 до 320 выборок из карты высот.

Проверим сначала режимы без включенного суперсэмплинга, они относительно просты, и соотношение результатов в режимах «Low» и «High» должно быть примерно одинаковым.

Производительность в этом тесте зависит и от количества и эффективности блоков TMU, и от филлрейта с ПСП, хоть и в меньшей степени. Результаты в «High» получаются примерно в полтора раза ниже, чем в «Low», как и должно быть по теории. В Direct3D 10 тестах процедурной визуализации меха с большим количеством текстурных выборок решения Nvidia всегда были сильны, вот и в этот раз они впереди, несмотря на то, что последняя архитектура AMD к ним подтянулась.

В результате, GTX 580 опережает GTX 480 в этом тесте на 17% и почти догоняет двухчиповый Radeon HD 5970. Также отметим явное влияние эффективного филлрейта и ПСП, так как GTX 460 оказалась далеко позади. Посмотрим на результат этого же теста, но с включенным «шейдерным» суперсэмплингом, увеличивающим работу в четыре раза, возможно в такой ситуации что-то изменится и ПСП с филлрейтом будут влиять меньше:

Предлагаем ознакомиться  Идеальная сборка игрового компьютера для работающего человека. Не экономим на мелочах

Включение суперсэмплинга теоретически увеличивает нагрузку в четыре раза, и в этот раз решения Nvidia хоть и остаются сильнее, чем карты AMD, но разница уже меньше, и GTX 580 уже ближе к HD 5870 чем к HD 5970. GTX 460 провалилась вниз ещё дальше, ну а нас больше всего интересует разница между GF100 и GF110. И тут мы видим уже разницу 21—22%, что явно говорит о влиянии архитектурных изменений в виде z-cull-оптимизаций.

Второй тест измеряет производительность исполнения сложных пиксельных шейдеров с циклами при большом количестве текстурных выборок и называется Steep Parallax Mapping. При низких настройках он использует от 10 до 50 текстурных выборок из карты высот и три выборки из основных текстур. При включении тяжелого режима с самозатенением число выборок возрастает в два раза, а суперсэмплинг увеличивает это число в четыре раза.

Данный тест несколько интереснее с практической точки зрения, так как разновидности parallax mapping давно применяются в играх, а тяжелые варианты, вроде нашего steep parallax mapping, используются во многих проектах, например, в играх Crysis и Lost Planet. Кроме того, в нашем тесте, помимо суперсэмплинга, можно включить самозатенение, увеличивающее нагрузку на видеочип примерно в два раза, такой режим называется «High».

Диаграмма во многом похожа на предыдущую (без SSAA). В обновленном D3D10 варианте теста без суперсэмплинга, GTX 580 справляется с поставленной задачей лучше, чем одночиповый конкурент HD 5870, но хуже, чем двухчиповый HD 5970. Разница с GTX 480 снова получилась порядка 17%, то есть соответственно количеству исполнительных блоков и их тактовой частоте. Посмотрим, что изменит включение суперсэмплинга, ведь он снова должен вызвать большее падение скорости на картах Nvidia.

При включении суперсэмплинга и самозатенения задача получается ещё более тяжёлой, совместное включение сразу двух опций увеличивает нагрузку на карты почти в восемь раз, вызывая большое падение производительности. Разница между скоростными показателями протестированных видеокарт изменилась, включение суперсэмплинга сказывается как и в предыдущем случае — карты производства AMD явно улучшили свои показатели относительно решения Nvidia.

И теперь HD 5870 уже опережает GTX 480, а HD 5970 становится лидером в этом тесте. Новое решение Nvidia всё-таки опережает одночипового конкурента, но до HD 5970 ему ой как далеко. Зато очень интересными получились сравнительные цифры GTX 480 и GTX 580. Даже на диаграмме видно, что разница в лёгких условиях составила те же 21%, а вот в тяжёлых (режим High) она выросла уже до 39%! Вероятно, мы снова видим следствие неких архитектурных оптимизаций, ибо ничем другим такую разницу просто не объяснить.

Графический ускоритель серии geforce gtx 580

  • Кодовое имя чипа GF110;
  • Технология производства 40 нм;
  • Около 3 миллиардов транзисторов (примерно столько же, что и у GF100);
  • Унифицированная архитектура с массивом процессоров для потоковой обработки различных видов данных: вершин, пикселей и др.;
  • Аппаратная поддержка DirectX 11 API, в том числе шейдерной модели Shader Model 5.0, геометрических (geometry) и вычислительных (compute) шейдеров, а также тесселяции;
  • 384-битная шина памяти, шесть независимых контроллеров шириной по 64 бита каждый, с поддержкой памяти GDDR5;
  • Частота ядра 772 МГц;
  • Удвоенная частота ALU 1544 МГц;
  • 16 потоковых мультипроцессоров, включающих 512 скалярных ALU для расчётов с плавающей точкой (поддержка вычислений в целочисленном формате, с плавающей запятой, с FP32- и FP64-точностью в рамках стандарта IEEE 754-2008);
  • 64 блока текстурной адресации и фильтрации с поддержкой FP16- и FP32-компонент в текстурах и поддержкой трилинейной и анизотропной фильтрации для всех текстурных форматов;
  • 6 широких блоков ROP (48 пикселей) с поддержкой режимов антиалиасинга до 32 выборок на пиксель, в том числе при FP16- или FP32-формате буфера кадра. Каждый блок состоит из массива конфигурируемых ALU и отвечает за генерацию и сравнение Z, MSAA, блендинг;
  • Запись результатов до 8 буферов кадра одновременно (MRT);
  • Интегрированная поддержка RAMDAC, двух портов Dual Link DVI, а также HDMI и DisplayPort.
Предлагаем ознакомиться  Сегодня мы рассмотрим, как именно переключить на ноутбуке видеокарту с intel на nvidia

Спецификации референсной видеокарты geforce gtx 580

  • Частота ядра 772 МГц;
  • Частота универсальных процессоров 1544 МГц;
  • Количество универсальных процессоров 512;
  • Количество текстурных блоков — 64, блоков блендинга — 48;
  • Эффективная частота памяти 4008 (1002×4) МГц;
  • Тип памяти GDDR5, 384-битная шина памяти;
  • Объем памяти 1536 МБ;
  • Пропускная способность памяти 192,4 ГБ/с;
  • Теоретическая максимальная скорость закраски 37,1 гигапикселей в секунду;
  • Теоретическая скорость выборки текстур 49,4 гигатекселей в секунду;
  • Два разъема Dual Link DVI-I, один Mini HDMI, поддерживается вывод в разрешениях до 2560×1600;
  • Двойной SLI-разъем;
  • Шина PCI Express 2.0;
  • Поддержка HDCP, HDMI, DisplayPort;
  • Энергопотребление до 244 Вт (один 6-штырьковый и один 8-штырьковый разъёмы);
  • Двухслотовое исполнение;
  • Рекомендуемая цена для американского рынка $499 (для России — 17999 руб).

Новый графический процессор GF110 и видеокарта Geforce GTX 580 на его основе призваны со временем полностью заместить GTX 480 на базе GF100. Новый GPU также выполнен по 40-нанометровым технологическим нормам, как и предшествующий топовый видеочип. Ранние слухи присваивают ему наименование GF100B, что из-за немногочисленных модификаций вполне похоже на правду, но всё же чипу дали новый индекс — GF110.

Принцип наименования видеокарт Nvidia вроде бы не изменился, но свежему топу зачем-то дали цифру нового поколения — GTX 580. Другими словами, судя по индексу, это должна быть тоже топовая карта, но уже нового поколения. Хотя, на наш взгляд, намного логичнее было бы название GTX 485 (по аналогии с GTX 285)

, ведь в GF110 нет никаких радикальных архитектурных изменений. Хотя это действительно полностью переработанный чип, но по сравнению с GF100 функциональных изменений в нём явно недостаточно для отнесения к новому поколению. Впрочем, наименование видеокарт — всегда штука маркетинговая, на реальные технические характеристики не влияющая.

На основе чипа GF110 пока что выпущена только одна модель видеокарты — Geforce GTX 580, которая в будущем должна вытеснить GTX 480. Ожидаемой многими GTX 570 пока что не анонсировано, но оно и понятно — ведь нужно распродавать ещё и остатки GTX 470 и GTX 480. Предположительная рыночная цена новой модели видеокарты для североамериканских магазинов равна $499 (без учёта налогов), что является вполне предсказуемой и логичной цифрой.

Как и её предшественница GTX 480, новая модель имеет 384-битную шину памяти и соответствующий объём видеопамяти, равный 1536 МБ. Значение это единственно возможное, по сути, так как 768 МБ — это слишком мало, а 3 ГБ — уже чересчур много. Даже с учётом того, что от конкурентов ожидается выход топовой модели с 2 ГБ памяти, смысла в 3-гигабайтном варианте будет не очень много, так как полутора гигабайт должно хватать во всех режимах, и повышенная себестоимость 3 ГБ быстрой памяти просто не будет оправдана.

Установка и драйверы

Конфигурация тестового стенда:

  • Компьютер на базе Intel Core I7 CPU 975 (Socket 1366)
    • процессор Intel Core I7 CPU 975 (3340 МГц);
    • системная плата Asus P6T Deluxe на чипсете Intel X58;
    • оперативная память 6 ГБ DDR3 SDRAM Corsair 1600MHz;
    • жесткий диск WD Caviar SE WD1600JD 160 ГБ SATA;
    • блок питания Tagan TG900-BZ 900W.
  • операционная система Windows 7 64bit; DirectX 11;
  • монитор Dell 3007WFP (30″);
  • драйверы ATI версии Catalyst 10.10; Nvidia версии 262.99 / 260.99.


VSync отключен.

Оцените статью
Техничка
Adblock detector