Компьютерра, 2008 № 07 (723) | страница 74
Каждый ALU в R600 выполняет одну инструкцию, а число потоков равно 64, то есть числу суперскалярных процессоров. И хотя в G80 вдвое больше потоков, в R600 количество операций за такт может достигать 320, что означает гораздо более высокую скорость обработки шейдеров. Но только теоретически: все зависит от "оптимальности" кода и от эффективности работы диспетчера, ведь в худшем случае производительность может упасть до 64 операций за такт.
Иными словами, в определенном смысле архитектура R600 уступает архитектуре G80, где производительность практически не зависит от эффективности кода. К тому же у R600 всего 16 текстурных блоков, а у G80 - вдвое больше, что дает процессору nVidia неоспоримое преимущество в играх с относительно простой графикой, не перегруженной шейдерами.
Унифицированная архитектура отлично масштабируется, то есть добавляя процессоры или урезая их количество, можно конструировать более мощные или менее мощные видеоускорители. Так, в чипе среднего уровня RV630 мы видим 120 потоковых процессоров, а в бюджетном RV610 - всего лишь 40. Разумеется, этим отличия не исчерпываются, и в младших модификациях отсутствуют некоторые блоки, которые бесполезны в процессоре, не обладающем достаточной производительностью.
Необычным нововведением для компьютерных видеоускорителей стал программируемый блок тесселяции, то есть разбиения поверхностей на полигоны.
Этот модуль, который инженеры AMD позаимствовали из процессора ATI Xenos для игровой приставки Microsoft Xbox, позволяет аппаратно повышать детализацию изображения без дополнительной нагрузки на центральный процессор. Единственное "но" - для его использования разработчики игр должны заложить в шейдеры соответствующие алгоритмы.
Еще одна конструктивная особенность R600, отсутствующая в RV610/630, - кольцевая шина памяти, которая существенно доработана по сравнению с вариантом предыдущего поколения, реализованным в процессорах серии R520 (семейство X1xxx).
Создавая кольцевую шину, инженеры AMD/ATI стремились минимизировать задержки и повысить надежность доступа к видеопамяти. Главное отличие новой кольцевой шины от старой - двунаправленность (раньше запросы графического ядра шли непосредственно к памяти, а по кольцевой шине отправлялись только ответы).
В процессоре R600 кольцевая шина с фактической шириной 1024 бита (512 бит в двух направлениях) соединяет восемь 64-битных каналов памяти и при использовании памяти типа GDDR3 обеспечивает пропускную способность более 100 Гбайт/с.