Gamers-Life.ru
Российский веб-сайт о видеоиграх

Масштабирование DLSS от Nvidia

Исследование рабочих нагрузок графических процессоров Nvidia показывает, что тензорные ядра загружаются, просто невероятно быстро.

Nvidia имеет форму, когда дело доходит до блокирования старых графических процессоров от новых технологий и функций. Поэтому, когда компания выпустила технологию масштабирования DLSS, ограничив ее новейшей на тот момент архитектурой GPU, всегда возникал вопрос о том, было ли это строго необходимо. Если, возможно, DLSS могли бы работать на более старых графических процессорах, просто Nvidia предпочла помочь росту продаж поколений, ограничив технологию более новым оборудованием.

Это подозрение только усиливается тем фактом, что как для масштабирования FSR от AMD, так и для XeSS от Intel могут работать на гораздо более широком спектре графических процессоров, включая графические процессоры конкурентов (для полной ясности, XeSS от Intel выпускался в двух вариантах: один широко совместим, для другого требуются графические процессоры Intel Arc). Таким образом, все это сводится к вопросу о том, действительно ли масштабирование DLSS сильно зависит от этих тензорных ядер, ускоряющих AI, как утверждает Nvidia.

Что ж, теперь у нас, похоже, есть своего рода ответ. И оказывается, DLSS действительно нужны эти тензорные ядра.

В бесстрашном постере Reddit под названием Bluedot55 использовались инструменты Nvidia Nsight Systems для измерения параметров графического процессора для детализации рабочих нагрузок, выполняемых на различных частях графического процессора Nvidia RTX 4090.

Bluedot55 запускал как DLSS, так и масштабируемые устройства сторонних производителей на Nvidia RTX 4090 и измерял загрузку тензорных ядер. Если посмотреть на среднее использование тензорных ядер, показатели по DLSS были чрезвычайно низкими, менее 1%.

Первоначальные исследования показали, что даже пиковая загрузка зарегистрирована в диапазоне 4-9%, подразумевая, что, хотя тензорные ядра использовались, они, вероятно, на самом деле не были существенными. Однако увеличение частоты опроса показало, что пиковая загрузка фактически превышает 90%, но только в течение коротких периодов, измеряемых микросекундами.

Если подумать, в этом есть смысл. Процесс масштабирования должен быть сверхбыстрым, если мы не хотим снизить общую частоту кадров. Он должен взять визуализированный кадр, обработать его, выполнить все вычисления, необходимые для масштабирования, и вывести полный масштабированный кадр, прежде чем 3D-конвейер успеет сгенерировать новый кадр.

Итак, вы ожидали бы увидеть именно то, что наблюдал Bluedot55. Невероятно короткий, но интенсивный всплеск активности внутри тензорных ядер при включении масштабирования DLSS.

Конечно, графические процессоры Nvidia предлагают тензорные ядра на протяжении трех поколений, и вам придется вернуться к серии GTX 10, чтобы найти графический процессор Nvidia, который вообще не поддерживает DLSS. Однако, поскольку Nvidia добавляет новые функции к общему набору DLSS, такие как генерация кадров, более новое оборудование остается позади.

Это исследование показывает, что, хотя возникает соблазн усомниться в мотивах Nvidia всякий раз, когда кажется, что она блокирует старые графические процессоры от новой функции, реальность может быть просто такова, что новые графические процессоры могут делать то, чего не могут старые. Для вас это прогресс.

Комментарии закрыты, но трэкбэки и Pingbacks открыты.