Notebookcheck Logo

CheckMag | Великое замедление работы GPU

Будущее графических процессоров: Переосмысление инноваций за пределами кремниевых границ (Источник изображения: AI-generated)
Будущее графических процессоров: Переосмысление инноваций за пределами кремниевых границ (Источник изображения: AI-generated)
По мере того, как графические процессоры достигают пределов кремния, прирост сырой производительности замедляется, и внимание переключается на архитектурные инновации и реальные показатели, такие как задержка кадров. Такие технологии, как рендеринг на основе искусственного интеллекта и 3D-стекинг, обещают новую эру, в которой эффективность и плавность игрового процесса переопределят способы измерения и достижения производительности GPU.
Личное мнение от Sebastian Jankowski
Мысли, высказываемые в этой статье, принадлежат автору и могут не представлять политику редакторского состава Notebookcheck.

На протяжении десятилетий графические процессоры революционизировали вычисления, обеспечивая невероятный скачок производительности с каждым новым поколением. Однако по мере того, как индустрия приближается к физическим и финансовым пределам производства кремния, эти достижения замедляются, что заставляет изменить подход к достижению и измерению производительности. Изучение тенденций поколений выявляет этот сдвиг и подчеркивает необходимость новых стратегий для поддержания инноваций в технологии GPU.

В качестве примера рассмотрим эволюцию компании Nvidia. Серия RTX 20 (Turing) представила трассировку лучей в реальном времени, что стало важной архитектурной вехой, а серия Серия RTX 30 (Ampere) и Серия RTX 40 (Ada Lovelace) подняли вычислительную мощность на новую высоту. Однако темпы роста производительности замедлились. Ежемесячный прирост снизился с ~2,68% во время перехода от RTX 20 к RTX 30 до ~0,96% для предстоящей серии RTX 50. История AMD повторяет аналогичную картину: RDNA 2 (серия RX 6000) демонстрирует замечательный ежемесячный прирост в ~6,25%, который RDNA 3 не может сравниться с ~2,60%.

Ежемесячный прирост поколения для AMD по результатам бенчмарков, проведенных Notebookcheck (Источник изображения: Sebastian Jankowski / Notebookcheck)
Ежемесячный прирост поколения для AMD по результатам бенчмарков, проведенных Notebookcheck (Источник изображения: Sebastian Jankowski / Notebookcheck)
Ежемесячный прирост поколения для Nvidia по результатам бенчмарков, проведенных Notebookcheck (Источник изображения: Sebastian Jankowski / Notebookcheck)
Ежемесячный прирост поколения для Nvidia по результатам бенчмарков, проведенных Notebookcheck (Источник изображения: Sebastian Jankowski / Notebookcheck)

Этот спад вызван не отсутствием амбиций, а растущими проблемами масштабирования кремния. Такие технологические узлы, как 7 нм и 4 нм, открыли необычайные возможности, но дальнейшая миниатюризация сталкивается с серьезными техническими и финансовыми барьерами. Эпоха экспоненциального роста аппаратного обеспечения уступает место сосредоточению на архитектурных инновациях как главной движущей силе прогресса.

Архитектурные усовершенствования, такие как DLSS от Nvidia и многочиповые конструкции от AMD, представляют собой это новое направление. Эти новые технологии используют ИИ, расширенную интеграцию памяти и программную оптимизацию для повышения производительности в реальных сценариях. Появляющиеся концепции, такие как архитектуры чиплетов и 3D-стекинг, также обещают изменить дизайн GPU, позволяя производителям преодолеть ограничения монолитных чипов и достичь более высокой производительности в рамках существующих ограничений.

По мере того, как инновации в области аппаратного обеспечения замедляются, наше понимание производительности должно меняться. Традиционные бенчмарки, такие как терафлопсы и результаты синтетических тестов, все еще имеют ценность, но часто не отражают реальный пользовательский опыт, особенно в играх. Более значимый подход - сосредоточиться на задержке кадров, которая измеряет время, необходимое графическому процессору для рендеринга и отображения отдельных кадров. Эта метрика лучше отражает плавность и отзывчивость игрового процесса.

Потребности в задержках также существенно различаются в разных игровых жанрах. Быстро развивающиеся шутеры (FPS) требуют сверхнизкой задержки для плавной визуализации и точного управления во время напряженных действий. С другой стороны, в ролевых играх (RPG) приоритет отдается насыщенным, захватывающим визуальным эффектам, где допустимо немного большее время задержки. Стратегические игры или казуальные игры могут выдержать еще большую задержку без ущерба для удовлетворенности пользователей. Признание этих различий позволяет разработчикам и производителям оптимизировать графические адаптеры и программное обеспечение для конкретных случаев использования, обеспечивая наилучший опыт в различных игровых приложениях.

Задержка кадров напрямую влияет на плавность и отзывчивость игры, особенно в графически интенсивных сценариях или сценариях с высокой частотой кадров. Измерение графических процессоров на основе задержки и стабильности дает более четкое представление об их реальной производительности. Графический процессор со скромной мощностью может превзойти конкурента с более высоким рейтингом за счет минимизации замираний и падений кадров во время напряженного игрового процесса. Делая акцент на таких показателях, производители могут лучше оправдать ожидания как геймеров, так и профессионалов.

Индустрия графических процессоров находится на переломном этапе. Поскольку традиционное масштабирование кремния дает все меньшую отдачу, будущее за сочетанием инновационных аппаратных разработок с более разумными подходами к измерению производительности. Рендеринг с использованием искусственного интеллекта, более разумное распределение ресурсов и усовершенствованные архитектуры памяти станут движущей силой следующей волны эволюции GPU. В то же время, принятие таких показателей, как задержка кадров, гарантирует, что эти достижения принесут значимые и ощутимые улучшения конечным пользователям.

Следующая глава для GPU - это не просто повышение скорости или уменьшение размеров кремния. Речь идет о том, чтобы переосмыслить подход к вычислениям как таковым - сосредоточиться на творчестве, эффективности и пользовательском опыте, чтобы стимулировать инновации в мире, где границы кремния больше не являются границами возможностей.

Таблица производительности графических процессоров Nvidia

Серия GPU Архитектура Технологический узел 3DMark Time Spy Экстремальный результат % разницы по сравнению с предыдущим поколением Месяцы между запусками Среднемесячный % прироста
Серия Nvidia RTX 50 (Quadro, GeForce,...) Blackwell 4 нм TSMC (4NP) Предполагается: 25 000 +25% Ожидается: 26 месяцев ~0,96% в месяц
Nvidia RTX 40 series (Quadro, GeForce,...) Ada Lovelace 4 нм TSMC 20 692 (RTX 4090) +80% 23 месяца ~3,48% в месяц
Серия Nvidia RTX 30 (Quadro, GeForce,...) Ampere 8 нм Samsung 11,441 (RTX 3080 Ti) +63% 24 месяца ~2.63% в месяц
Серия Nvidia RTX 20 (Quadro, GeForce,...) Turing 12 нм 7,000 (RTX 2080 Ti) +75% 28 месяцев ~2.68% в месяц
Серия Nvidia GTX 10 (Quadro, GeForce,...) Pascal 16 нм 4,000 (GTX 1080 Ti) N/A 19 месяцев N/A

Таблица производительности графических процессоров AMD

Серия GPU Архитектура Процессорный узел 3DMark Time Spy Экстремальный результат % разницы по сравнению с предыдущим поколением Месяцы между запусками Среднемесячный % прироста
Серия AMD RX 9000 RDNA 4 4 нм TSMC (N4P) Предполагается: 22 000 +25% Ожидается: 24 месяца ~1,04% в месяц
AMD RX 7000 series RDNA 3 5-нм TSMC 19,857 (RX 7900 XTX) +65% 25 месяцев ~2.60% в месяц
AMD RX 6000 series RDNA 2 7-нм TSMC 12,054 (RX 6900 XT) +100% 16 месяцев ~6.25% в месяц
Серия AMD RX 5000 RDNA 7 нм TSMC 6,000 (RX 5700 XT) +50% 26 месяцев ~1.92% в месяц
Серия AMD RX Vega Vega 14 нм 4,000 (RX Vega 64) N/A 16 месяцев N/A

Источник(и)

Этот важный материал точно понравится твоим друзьям в социальных сетях!
Mail Logo