Search
Пятница 22 Июнь 2018
  • :
  • :

Nvidia пришлось подробно объяснить, почему GeForce GTX 970 не может работать быстро со всеми 4 ГБ памяти

Как известно, недавно стало известно, что скорость работы 3D-карты Nvidia GeForce GTX 970 с памятью радикально падает на рубеже 3,5 ГБ. Компания Nvidia сразу же заверила, что разработчики уже разбираются с ситуацией и постараются решить проблему как можно скорее. Вскоре было опубликовано сообщение, в котором Nvidia объяснила медленную работу 3D-карт GeForce GTX 970 с частью памяти компромиссом при проектировании GPU. При этом описание ситуации практически исключало надежду на исправление обновлением прошивки или драйвера. Впрочем, по словам производителя, снижение производительности является незначительным.

Однако ограничиться этим не удалось — активность владельцев 3D-карт и тематических ресурсов заставила производителя опубликовать дополнительные технические данные, окончательно объясняющие суть проблемы.

Конфигурация GeForce GTX 970 включает 13 потоковых процессоров (SMM в терминах Nvidia) из 16 возможных в GM204, каждый из которых имеет 128 ядер CUDA. Процессоры обращаются к видеопамяти через кэш-память, при этом потоки данных проходят через коммутатор, имеющий в полной конфигурации восемь портов для подключения к кэш-памяти второго уровня. Как оказалось, GeForce GTX 970 имеет всего семь портов, что видно на иллюстрации, где серым показаны отключенные блоки. Отсутствующий порт означает меньший объем кэш-памяти и меньшее число блоков растровых операций.

Таким образом, вопреки информации, распространенной в момент выпуска GTX 970, число блоков ROP равно не 64, а 56, а объем кэш-памяти L2 равен 1972 КБ, а не 2048 КБ, как у GTX 980. Уточним, что узким местом является не число ROP, поскольку 13 потоковых процессоров в любом случае могут выдать только 52 пикселя за такт, тогда как 56 блоков ROP могут обработать 56 пикселей.

В GTX 980 каждый блок L2/ROP прямо обращается к 32-разрядному контроллеру памяти и сегменту памяти размером 512 МБ. В GTX 970 пришлось подключить к одному порту два сегмента. Если бы при этом все контроллеры работали со всей памятью, этот перегруженный участок привел бы к замедлению работы подсистемы памяти в два раза. Избежать такой ситуации удалось, разделив память на два сегмента размером 3,5 и 0,5 ГБ. Работа с первым выполняется, как в GTX 980, а второй работает в семь раз медленнее.

Очевидно, что указанная особенность GPU имеет аппаратный характер, проявляется во всех экземплярах 3D-карт GeForce GTX 970 и не может быть исправлена с помощью ПО. Вероятно, Nvidia стоило рассказать о ней раньше.

Источник: iXBT.com




Добавить комментарий

Ваш e-mail не будет опубликован. Обязательные поля помечены *