Обзор и тестирование видеокарты Palit GeForce GTX 550 Ti Sonic

Direct3d 10: тесты геометрических шейдеров

В пакете RightMark3D 2.0 есть два теста скорости геометрических шейдеров, первый вариант носит название «Galaxy», техника аналогична «point sprites» из предыдущих версий Direct3D. В нем анимируется система частиц на GPU, геометрический шейдер из каждой точки создает четыре вершины, образующих частицу. Аналогичные алгоритмы должны получить широкое использование в будущих играх DirectX 10.

Изменение балансировки в тестах геометрических шейдеров не влияет на конечный результат рендеринга, итоговая картинка всегда абсолютно одинакова, изменяются лишь способы обработки сцены. Параметр «GS load» определяет, в каком из шейдеров производятся вычисления — в вершинном или геометрическом. Количество вычислений всегда одинаково.


Рассмотрим первый вариант теста «Galaxy», с вычислениями в вершинном шейдере, для трёх уровней геометрической сложности:

Соотношение скоростей при разной геометрической сложности сцен примерно одинаково для всех решений. Производительность соответствует количеству точек, с каждым шагом падение FPS составляет около двух раз. Задача для современных видеокарт не особенно сложная, производительность ограничена не только скоростью выполнения геометрических шейдеров, но и пропускной способностью памяти.

Geforce GTX 550 Ti снова оказался ровно посередине между GTX 460 и GTS 450, а разница между GTX 550 Ti и GTX 460 получилась около 22%. По сравнению с конкурентами, новая видеокарта Nvidia показала результат чуть выше, чем получилось у Radeon HD 5770, но в полтора раза ниже, чем у HD 6850. При этом HD 6850 не имеет большого количества блоков обработки геометрии. Это говорит о большом влиянии на результаты скорости блоков ROP и/или ПСП.

Также возможно, что у HD 6850 «сработала» оптимизация геометрических блоков, которые сделали инженеры AMD. В данном тесте скорость выполнения ей геометрических шейдеров оказалась даже выше, чем у GTX 460, что очень неплохо. Посмотрим, что изменится при переносе части вычислений в геометрический шейдер:

При изменении нагрузки в этом тесте, цифры для решений Nvidia и Radeon HD 6850 почти не изменились, а вот младшая видеокарта Radeon HD 5770 слегка подтянула свои результаты. А платы Nvidia в этом тесте вовсе не замечают изменения параметра GS load, отвечающего за перенос части вычислений в геометрический шейдер, и показывают аналогичные предыдущей диаграмме результаты.

«Hyperlight» — это второй тест геометрических шейдеров, демонстрирующий использование сразу нескольких техник: instancing, stream output, buffer load. В нем используется динамическое создание геометрии при помощи отрисовки в два буфера, а также новая возможность Direct3D 10 — stream output. Первый шейдер генерирует направление лучей, скорость и направление их роста, эти данные помещаются в буфер, который используется вторым шейдером для отрисовки. По каждой точке луча строятся 14 вершин по кругу, всего до миллиона выходных точек.

Новый тип шейдерных программ используется для генерации «лучей», а с параметром «GS load», выставленном в «Heavy» — ещё и для их отрисовки. Иными словами, в режиме «Balanced» геометрические шейдеры используются только для создания и «роста» лучей, вывод осуществляется при помощи «instancing», а в режиме «Heavy» выводом также занимается геометрический шейдер. Сначала рассматриваем лёгкий режим:

Относительные результаты в разных режимах снова соответствуют нагрузке: во всех случаях производительность неплохо масштабируется и близка к теоретическим параметрам, по которым каждый следующий уровень «Polygon count» должен быть менее чем в два раза медленней.

В этом тесте при сбалансированной загрузке скорость рендеринга для всех решений менее явно ограничена геометрической производительностью, и цифры говорят о явном упоре в ПСП. Новый Geforce GTX 550 Ti в этот раз уже ближе к GTX 460 (разница составляет лишь 9–13%), и с ростом сложности геометрии его отставание всё меньше и меньше. Что интересно, теперь новое решение Nvidia показывает результат ровно между двумя видеокартами AMD.

Цифры должны измениться на следующей диаграмме, в тесте с более активным использованием геометрических шейдеров. Также будет интересно сравнить друг с другом результаты, полученные в режимах «Balanced» и «Heavy».

Предлагаем ознакомиться  Оперативная память Kingston ValueRAM [KVR13N9S8/4] 4 ГБ

А вот в этом тесте разница между GF116 и GF104 стала ближе к теоретически обоснованной — порядка 25%. К сожалению, у GF116 нет преимуществ по скорости исполнения геометрических шейдеров, так как он имеет в своём составе лишь один растеризатор, в отличие от двух у GF114 и GF104. Да и оптимизированная обработка геометрии в Barts позволила Radeon HD 6850 оказаться заметно впереди.

Сравнение с видеокартами AMD показывает, что производительность GTX 550 Ti в этом тесте находится на уровне лишь младшей модели — HD 5770. А вот более новое решение компании — HD 6850 — неожиданно стало лидером теста, обогнав даже карту на GF104, имеющей два блока растеризации.

На основе тестов геометрических шейдеров делаем вывод о том, что скорость растеризации и triangle setup может стать потенциально слабым показателем GF116 для общей производительности в некоторых современных играх с большим количеством геометрии. Хотя для решения такого низкого уровня показанные результаты неплохи, но стоящий столько же Radeon HD 6850 явно показал себя лучше.

Direct3d 10: тесты пиксельных шейдеров ps 4.0 (вычисления)

Следующая пара тестов пиксельных шейдеров содержит минимальное количество текстурных выборок для снижения влияния производительности блоков TMU. В них используется большое количество арифметических операций, и измеряют они именно математическую производительность видеочипов, скорость выполнения арифметических инструкций в пиксельном шейдере.

Первый математический тест — Mineral. Это тест сложного процедурного текстурирования, в котором используются лишь две выборки из текстурных данных и 65 инструкций типа sin и cos.

Чисто математические тесты подтверждают, что графический процессор GF116 архитектурно не отличается от своего предшественника GF106, разница между GTX 550 Ti и GTS 450 почти соответствует теоретическим 15% по сравнительной производительности блоков ALU. Практический разрыв между решениями несколько больше из-за влияния ПСП, особенно на младшую модель. Все остальные решения также расположились примерно соответственно теоретическим показателям.

Видеокарты AMD в этом синтетическом тесте традиционно значительно быстрее, так как в вычислительно сложных задачах современная архитектура AMD имеет просто огромное преимущество перед конкурирующими видеокартами Nvidia, даже несмотря на меньший КПД. Вот и в этот раз разница между картами Nvidia и AMD остаётся весьма большой, HD 6850 и HD 5770 показывают результаты примерно вдвое выше, чем GTX 550 Ti, что соответствует теории. Новая модель отстаёт от GTX 460 на близкие к теоретическим 27%.

В наших прошлых исследованиях мы отметили, что данный тест не полностью зависит от скорости ALU, производительные решения ограничиваются ещё и скоростью видеопамяти. Поэтому рассмотрим второй тест шейдерных вычислений, который носит название Fire. Он ещё тяжелее для ALU, и текстурная выборка в нём только одна, а количество инструкций типа sin и cos увеличено вдвое, до 130. Посмотрим, что изменилось при увеличении нагрузки:

Изменений в расположении карт по ранжиру немного, только разница между HD 6850 и HD 5770 немного сократилась. Во втором математическом подтесте скорость рендеринга ограничена почти исключительно производительностью шейдерных блоков, и разница между GTX 550 Ti и GTS 450 уменьшилась, хотя и осталась выше теоретической. Между новой моделью и GTX 460 лишь 27% разницы, хотя по теории должно быть чуть больше.

Итог по математическим вычислениям всё тот же — у решений компании AMD есть явное преимущество, объясняемое большим количеством блоков ALU. Далее мы рассмотрим результаты тестирования геометрических шейдеров, они нам будут интересны потому, что основным ограничителем производительности в них часто является скорость обработки геометрии, и будет интересно сравнить GTX 550 Ti с конкурентами.

Direct3d 10: тесты пиксельных шейдеров ps 4.0 (текстурирование, циклы)


Во вторую версию RightMark3D вошли два знакомых PS 3.0 теста под Direct3D 9, которые были переписаны под DirectX 10, а также ещё два новых теста. В первую пару добавились возможности включения самозатенения и шейдерного суперсэмплинга, что дополнительно увеличивает нагрузку на видеочипы.

Данные тесты измеряют производительность выполнения пиксельных шейдеров с циклами, при большом количестве текстурных выборок (в самом тяжелом режиме до нескольких сотен выборок на пиксель) и сравнительно небольшой загрузке ALU. Иными словами, в них измеряется скорость текстурных выборок и эффективность ветвлений в пиксельном шейдере.

Предлагаем ознакомиться  Типы разъемов DVI и их технические характеристики (2013 г.) ― Компьютер

Первым тестом пиксельных шейдеров будет Fur. При самых низких настройках в нём используется от 15 до 30 текстурных выборок из карты высот и две выборки из основной текстуры. Режим Effect detail — «High» увеличивает количество выборок до 40–80, включение «шейдерного» суперсэмплинга — до 60–120 выборок, а режим «High» совместно с SSAA отличается максимальной «тяжестью» — от 160 до 320 выборок из карты высот.

Проверим сначала режимы без включенного суперсэмплинга, они относительно просты, и соотношение результатов в режимах «Low» и «High» должно быть примерно одинаковым.

Производительность в этом тесте зависит не только от количества и эффективности блоков TMU, но и от филлрейта. Результаты в режиме «High» получаются примерно в полтора раза ниже, чем в «Low», как и должно быть по теории. В Direct3D 10 тестах процедурной визуализации меха с большим количеством текстурных выборок решения Nvidia ранее были сильнее, но последняя архитектура AMD показывает схожие результаты.

В результате, новая видеокарта Nvidia немного отстаёт от младшего Radeon и очень сильно уступает старшей модели конкурента, которая и стала лидером теста. Это говорит о явном влиянии ПСП на скорость рендеринга, этот показатель у HD 6850 максимален. А в случае GTX 550 Ti и GTX 460 разница в скорости соответствует теоретической разнице в скорости ALU и TMU — чуть выше 30%.

Посмотрим на результат этого же теста, но с включенным «шейдерным» суперсэмплингом, увеличивающим работу в четыре раза, возможно в такой ситуации что-то изменится и ПСП с филлрейтом будут влиять иначе:

Включение суперсэмплинга увеличивает теоретическую нагрузку вчетверо, и в таком случае все решения Nvidia сдают позиции, а обе видеокарты AMD выглядят ещё сильнее. Теперь оба Radeon выигрывают у всех карт Nvidia. При этом HD 6850 значительно опережает HD 5770. Вероятно, производительность ограничивается всё же производительностью ROP, которая у HD 6850 заметно выше. А вот в случае карт Nvidia всё иначе, GTX 550 Ti отстаёт от GTX 460, несмотря на большую ПСП и филлрейт.

Второй тест, измеряющий производительность выполнения сложных пиксельных шейдеров с циклами при большом количестве текстурных выборок, называется Steep Parallax Mapping. При низких настройках он использует от 10 до 50 текстурных выборок из карты высот и три выборки из основных текстур. При включении тяжелого режима с самозатенением, число выборок возрастает в два раза, а суперсэмплинг увеличивает это число в четыре раза.

Этот тест интереснее с практической точки зрения, так как многие разновидности parallax mapping давно применяются в играх, а тяжелые варианты, вроде нашего steep parallax mapping используются во многих проектах, например, в играх серий Crysis и Lost Planet. Кроме того, в нашем тесте, помимо суперсэмплинга, можно включить и самозатенение, увеличивающее нагрузку на видеочип примерно в два раза — такой режим называется «High».

Диаграмма весьма похожа на предыдущую (также без SSAA), и результаты близки даже по абсолютным цифрам. В обновленном D3D10 варианте данного теста без включения суперсэмплинга, новая модель GTX 550 Ti справляется с данной задачей примерно на 30% медленнее, чем GTX 460, основанная на чипе GF104. В этом тесте она явно ближе к GTS 450 по скорости, так как скорость текстурирования и математических вычислений у неё ближе к младшей модели.

От обеих видеокарт производства AMD всё так же отстают обе платы на чипах GF106 и GF116, и только GTX 460 конкурирует с Radeon HD 5770. Ну а явным лидером снова становится HD 6850, основанная на чипе Barts. Данная видеокарта имеет явное преимущество по теоретическим характеристикам филлрейта и ПСП. Поглядим, что изменит включение суперсэмплинга.

При включении SSAA и самозатенения задача получилась заметно более тяжёлой, совместное включение сразу этих двух опций увеличивает нагрузку на карты почти в восемь раз, вызывая большое падение производительности. Разница между скоростными показателями нескольких видеокарт изменилась, включение суперсэмплинга сказывается как и в предыдущем случае — карты производства AMD ещё больше упрочили свои показатели относительно решений Nvidia.

Предлагаем ознакомиться  Совместимость первых плат на LGA 1155 c Ivy Bridge. Опыты.

Radeon HD 6850 остаётся впереди без вариантов, а второе место забирает HD 5770. Наш сегодняшний герой GTX 550 Ti отстаёт от обоих конкурентов и традиционно расположился между GTS 450 и GTX 460. Не очень высокий результат, хотя от платы на чипе GF104 новая видеокарта Nvidia отстаёт ровно на всё близкие к теоретическим 25–27%.

Графические ускорители серии geforce gtx 550 ti

  • Кодовое имя чипа GF116;
  • Технология производства 40 нм;
  • 1,17 миллиарда транзисторов;
  • Унифицированная архитектура с массивом процессоров для потоковой обработки различных видов данных: вершин, пикселей и др.;
  • Аппаратная поддержка DirectX 11 API, в том числе шейдерной модели Shader Model 5.0, геометрических (geometry) и вычислительных (compute) шейдеров, а также тесселяции;
  • 192-битная шина памяти, три независимых контроллера шириной по 64 бита каждый, с поддержкой GDDR5 памяти в микросхемах смешанной плотности;
  • Частота ядра 900 МГц;
  • Удвоенная частота ALU 1800 МГц;
  • 4 потоковых мультипроцессора, включающих 192 скалярных ALU для расчётов с плавающей точкой (поддержка вычислений в целочисленном формате, с плавающей запятой, с FP32 и FP64 точностью в рамках стандарта IEEE 754-2008);
  • 32 блока текстурной адресации и фильтрации с поддержкой FP16 и FP32 компонент в текстурах и поддержкой трилинейной и анизотропной фильтрации для всех текстурных форматов;
  • 3 широких блока ROP (24 пикселя) с поддержкой режимов антиалиасинга до 32 выборок на пиксель, в том числе при FP16 или FP32 формате буфера кадра. Каждый блок состоит из массива конфигурируемых ALU и отвечает за генерацию и сравнение Z, MSAA, блендинг;
  • Запись результатов до восьми буферов кадра одновременно (MRT);
  • Интегрированная поддержка RAMDAC, двух портов Dual Link DVI, а также HDMI и DisplayPort.

Спецификации референсной видеокарты geforce gtx 550 ti

  • Частота ядра 900 МГц;
  • Частота универсальных процессоров 1800 МГц;
  • Количество универсальных процессоров 192;
  • Количество текстурных блоков — 32, блоков блендинга — 24;
  • Эффективная частота памяти 4104 (1026×4) МГц;
  • Тип памяти GDDR5, 192-битная шина памяти;
  • Объем памяти 1024 МБ;
  • Пропускная способность памяти 98,5 ГБ/с;
  • Теоретическая максимальная скорость закраски 21,6 гигапикселей в секунду;
  • Теоретическая скорость выборки текстур 28,8 гигатекселей в секунду;
  • Два разъема Dual Link DVI-I и один Mini HDMI;
  • Один SLI-разъем;
  • Шина PCI Express 2.0;
  • Поддержка HDCP, HDMI, DisplayPort;
  • Энергопотребление до 116 Вт (один 6-штырьковый разъём);
  • Двухслотовое исполнение;
  • Рекомендованная цена для России — 5999 руб (для США — $149).

Новая модель Geforce GTX 550 Ti, выполненная на основе улучшенного графического процессора GF116, не заменит на рынке видеокарту Geforce GTS 450. В начале своего пути эти две модели будут сосуществовать в линейке компании вместе. Обновленный GPU выполнен по всё тем же технологическим нормам 40 нм, как и другие видеочипы этого поколения, а улучшение его характеристик стало возможным из-за отладки 40-нанометрового техпроцесса и глубокой переработки GPU.

Принцип наименования видеокарты снова немного изменился. Обновленная модель теперь не просто принадлежит к новому пятому поколению, и по сравнению с GTS 450 добавился не только суффикс Ti. По какой-то причине Nvidia решила перевести выпущенное решение на основе чипа GF116 в более высокий класс GTX, по сравнению с предшествующей аналогичной картой, относящейся к классу GTS. Неужели 192-битной шины достаточно для этого?

На базе видеочипа GF116 сегодня была выпущена единственная модель — GTX 550 Ti, и продавать её будут на североамериканском рынке по ценам от $149. Конкурентами данной платы одновременно являются и Radeon HD 5770 и Radeon HD 6850. Компания AMD предусмотрительно снизила рекомендованные цены перед анонсом конкурирующего решения, и теперь новая цена для HD 5770 равна $129, а для HD 6850 — $149.

Установка и драйверы


Конфигурация тестового стенда:

  • Компьютер на базе Intel Core i7-975 (Socket 1366)
    • процессор Intel Core i7-975 (3340 МГц);
    • системная плата Asus P6T Deluxe на чипсете Intel X58;
    • оперативная память 6 ГБ DDR3 SDRAM Corsair 1600 МГц;
    • жесткий диск WD Caviar SE WD1600JD 160 ГБ SATA;
    • блок питания Tagan TG900-BZ 900W.
  • операционная система Windows 7 64 бит; DirectX 11;
  • монитор Dell 3007WFP (30″);
  • драйверы ATI версии Catalyst 11.2; Nvidia версии 266.58/266.66/267.59.

VSync отключен.

Оцените статью
Техничка
Adblock detector