Компьютерра, 2005 № 27-28 (599-600) | страница 52



Да что там шейдеры третьей версии! Unified Shader Architecture с ее универсальными вычислительными ресурсами графического процессора - это шаг вперед, от DirectX 9 (с которым мы живем вот уже больше трех лет, постепенно переходя от версии 9.0a к 9.0b и свежей 9.0c) к «десятому» поколению DirectX (более известному как DirectX.Next или Windows Graphics Foundation 2.0), которое должно лечь в основу ОС Longhorn. Причем объясняется этот «переход» отнюдь не маркетинговыми соображениями, а возможностью использования ускорителя архитектуры USA в качестве практически полноценного и самодостаточного программируемого процессора! Попросту говоря, Xenos позволяет за один такт исполнить до 48 произвольных скалярных и 48 произвольных векторных инструкций, а что за данные при этом обрабатываются - закрашивается ли треугольник, рассчитывается ли сложная геометрическая сцена или производится моделирование процессов сворачивания белка, - ему все равно. Все необходимые для подобного «нецелевого» использования библиотеки (ATI Modeling Engine) канадская компания разработчикам уже предоставила.


***

Еще одна интересная «фича» R500 - наличие 10 Мбайт интегрированной видеопамяти, играющей роль быстродействующего (256 Мбайт/с) объемистого кэша. ATI утверждает, что эти самые десять «быстрых» мегабайт позволят реализовывать на Xenus качественный полноэкранный антиалисинг ценой потери всего лишь… 1-5% скорости! Отнюдь не лишний бонус для приставки, предназначенной для совместной работы с телевизорами и мониторами высокого разрешения. Правда, 10 Мбайт кэш-памяти - это и весьма впечатляющее (несколько десятков миллионов) количество транзисторов, и здоровенный кусок кристалла GPU, так что в итоге кристалл и без того немаленького Xenos оказался столь громоздким, что технологи разделили его на два независимых чипа, ставящихся на одну подложку. «Базовый» чип - это собственно и есть сам R500 с его 48 универсальными конвейерами, обслуживающей их логикой и контроллером видеопамяти; существенно меньших размеров «дочерний» кристалл - те самые 10 Мбайт буфера видеопамяти и блоки растровых операций ROP (Raster Operations), которые выполняют запись рассчитанных графическими конвейерами данных во фрейм-буфер, ведают отсечением невидимых пикселов (z-test), смешением полупрозрачных цветов (блендингом) и тому подобными «вспомогательными» операциями. Пропускная способность шины, соединяющей чипы, - «всего лишь» 30 Гбайт/с, однако для передачи предварительно сжатых, еще «недообработанных» данных этого, видимо, достаточно.