Maxwell (микроархитектура)


Maxwell
Дата выпуска Февраль 2014
Производители TSMC

Maxwell — кодовое название микроархитектуры графических процессоров, разработанной Nvidia в качестве преемника микроархитектуры Kepler. Архитектура Maxwell была введена в более поздних моделях GeForce 700 Series, а также используется в GeForce 800M Series, GeForce 900 Series и Quadro Mxxx serie. Nvidia для новой архитектуры Maxwell взяла в качестве основы Kepler и доработала её в нескольких областях. В архитектуре Maxwell потоковый мультипроцессор SMX был переименован в SMM (англ. Streaming Maxwell Multiprocessor), делящийся на четыре блока по 32 потоковых процессора. В общей сложности кластер SMM содержит 128 потоковых процессоров. Менее сложная логика управления обеспечивает более эффективное распределение задач по ядрам CUDA. Площадь чипа увеличилась на 25 % с 118 мм² до 148 мм². В то же время количество транзисторов выросло с 1,3 млрд до 1,87 млрд, что соответствует приросту на 44 %. Причина кроется в изменении компоновки чипа.

Микроархитектура названа в честь Джеймса Клерка Максвелла, основателя теории электромагнитного излучения.

Особенности архитектуры Nvidia Maxwell

Увеличенная выделенная общая память

В архитектуре Maxwell предусмотрено 64 Кбайт распределённой (регистровой) памяти, в то время как в Fermi или Kepler эта память делится между L1-кэшем и распределённой памятью. В Maxwell один блок может использовать до 48 Кбайт распределённой памяти, причём увеличение общего объёма этой памяти может привести к увеличению нагрузки мультипроцессора. Это стало возможным благодаря сочетанию функциональности L1-кэша и текстурного кэша в отдельном блоке.

Более быстрые атомарные операции в разделённой памяти

В архитектуре Maxwell появились встроенные атомарные операции над 32-битными целыми числами в распределённой памяти, а также CAS-операции над 32-битными и 64-битными значениями в памяти — с помощью них можно реализовать другие атомарные функции. В случае Kepler и Fermi приходилось использовать сложный принцип «Lock / Update / Unlock», что приводило к дополнительным расходам.

Динамический параллелизм

Динамический параллелизм, который появился в Kepler GK110, позволяет GPU самому создавать задачи для себя. Поддержка этой функции была впервые добавлена в CUDA 5.0, позволяя потокам на GK110 запускать дополнительные ядра на том же GPU.

Тайловый рендеринг

Впервые для Nvidia и серии видеокарт GeForce была введена технология тайлового рендеринга для увеличения производительности и уменьшения нагрузки на память.[1][2] В то же время у конкурентов в лице AMD её практически нет, данная технология отсутствует до сих пор по настоящее время, исключением лишь является серия VEGA с HBM памятью.

Сравнение Kepler и Maxwell

Характеристики Kepler Maxwell
GPU GK107 (Kepler) GM107 (Maxwell)
Ядра CUDA 384 640
Базовая частота 1058 МГц 1020 МГц
Boost-частота GPU н/д 1085 МГц
Гигафлопс 812,5 1305,6
Вычислительные возможности 3.0 5.0
Распределённая память / SM 16 КБ / 48 КБ 64 КБ
Размер регистрового файла / SM 256 КБ 256 КБ
Максимальное количество блоков 16 32
Частота памяти 5000 МГц 5400 МГц
Размер L2-кэша 256 КБ 2048 КБ
TDP 64 Вт 60 Вт
Транзисторы 1,3 млрд 1,87 млрд.
Площадь кристалла 118 мм² 148 мм²
Техпроцесс 28 нм 28 нм

Преемник

Следующая архитектура после Maxwell появилась под кодовым названием Pascal.[3]

Примечания

  1. Раскрыт главный секрет эффективности новых архитектур NVIDIA. 3DNews - Daily Digital Digest. Дата обращения: 1 марта 2019. Архивировано 2 марта 2019 года.
  2. Тайловый рендеринг – секретный рецепт архитектуры Maxwell/Pascal. www.hardwareluxx.ru. Дата обращения: 1 марта 2019. Архивировано 2 марта 2019 года.
  3. NVIDIA Updates GPU Roadmap; Announces Pascal Архивная копия от 25 марта 2014 на Wayback Machine // Официальный блог NVIDIA, 25 марта 2014 г