Компьютерра PDA N119 (02.07.2011-08.07.2011) | страница 46
Графический процессор Cayman претерпел наибольшие изменения по сравнению с чипами Cypress предыдущего поколения, и они затронули не только чисто количественные показатели, но и саму архитектуру микросхемы. Для оптимизации энергопотребления и упрощения конструкции было принято решения отказаться от суперскалярной архитектуры VLIW5, в который каждый потоковый процессор оснащался пятью вычислительными блоками ALU: четыре из них были рассчитаны на выполнение простых арифметических операций, а пятый ("трансцендентный") - на сложные алгебраические вычисления. Эта схема была разработана ещё инженерами ATI, но спустя годы стало очевидно, что она неоправданно усложняет чипы, не принося существенного прироста производительности.
В Cayman применяются потоковые процессоры нового типа на базе архитектуры VLIW4, состоящие из четырёх одинаковых вычислительных модулей ALU. При этом сложные операции выполняются тремя из четырёх модулей, что теоретически снижает общую производительность, однако заметно упрощает микросхему и уменьшает её площадь. Зато распределять задачи по одинаковым модулям значительно проще, а значит, и быстрее, в особенности при вычислениях с двойной точностью.
Кроме того, для подъёма производительности в Cayman используется целый ряд новых конструктивных решений. Процессор состоит из 24 SIMD-ядра с 16-ю блоками процессоров по 4 ALU в каждом. Флагман получил сразу 16 текстурных блоков для обработки геометрии и два блока тесселяции уже восьмого поколения. По данным самой AMD, это позволило втрое повысить скорость тесселяции у Radeon HD 6970 по сравнению с предыдущим флагманом HD 5870.
В чипах Cayman также реализован новый алгоритм сглаживания Enhanced Quality Anti-Aliasing (EQAA) и обеспечивающий значительно более высокое качество изображения, чем MSAA при существенно меньшей потери производительности, составляющей не более нескольких процентов.
Наконец, последняя из важнейших новых технологий, появившихся в Cayman, это технология динамического управления рабочими частотами и напряжением графического ускорителя AMD PowerTune. Благодаря датчикам, встроенным во все блоки микросхемы, управляющий модуль постоянно отслеживает нагрузку, температуру и напряжение и при превышении установленных значений снижать частоты и напряжение, предотвращая повреждение чипа. Через утилиту ATI Overdrive можно устанавливать свои предельные значения, но, разумеется, под ответственность пользователя.