Вот и дождались обещанного: 6 февраля компания Nvidia представила две линейки новых видеокарт на базе графических процессоров NV25 и NV17. В этой статье речь пойдет о чипе NV25 и продуктах на его основе.

За прошедшие полгода инженеры Nvidia серьезно поработали над развитием процессора NV20 и выпустили на рынок куда более совершенный продукт — NV25 (рис. 1). Теперь даже там, где раньше компания проигрывала своему основному конкуренту ATI, благодаря новому видеоядру достигнуты впечатляющие результаты. В недалеком будущем это позволит перевести рынок массовых 3D-акселераторов на Рис. 1качественно новый уровень.

В настоящий момент на рынке появились первые образцы карт, выпущенные на базе новых графических процессоров (GPU) NV25. Это модели Nvidia GeForce4 Ti 4600 и GeForce4 Ti 4400. Основной их отличительной особенностью являются скоростные характеристики:

GeForce 4 Ti4600 — 300-МГц ядро, до 128 Мб 325 (650) МГц DDR-памяти;

GeForce 4 Ti4400 — 275-МГц ядро, до 128 Мб 275 (550) МГц DDR-памяти.

Нововведения

Основным преимуществом видеоядер NV25 является усовершенствованная архитектура доступа к графической памяти —Light Speed Memory Architecture II. LMA II стала продолжением реализованной в линейке GeForce3 архитектуры LMA, которая позволяет использовать текстуры больших размеров, а также многое другое. Из этого другого можно выделить:

кэш вершин — позволяет хранить параметры вершин сцены, к которым происходит частое обращение при перерисовке сцены. Таким образом разгружается шина AGP;

кэш примитивов — используется для сохранения параметров вершин, прошедших стадию наложения теней, для последующей передачи и наложения образовавшихся примитивов на треугольники;

двойной текстурный кэш — алгоритмы этого кэша позволяют предугадывать текстурирование сцены при ее изменениях. Лучше всего проявляет себя во время обработки и фильтрации сложных сцен, а также мультитекстурирования. Впервые был реализован в GeForce3;

кэш пикселей — конечный кэш рендерящего конвейера. Пиксели сохраняются в нем перед выдачей на экран для отображения. После прорисовки одной «порции» пикселей из кэша считывается другая «партия» и т. д.

Каждый кэш работает независимо от других, и каждый оптимизирован под свой собственный набор инструкций. Помимо этого преимущества, видеопроцессоры NV25 имеют следующие особенности для повышения скорости работы (все они являются составными частям архитектуры LMA II):

Lossless Z-Buffer Compression — технология, дающая возможность без потерь сжимать данные, содержащиеся в Z-буфере, в соотношении 4:1. Это достигается благодаря новому усовершенствованному алгоритму сжатия;

Visibility Subsystem — Z-Occlusion Culling — алгоритм, позволяющий благодаря значениям Z-буфера, определять видимость данного пикселя на экране и обрабатывать его, если пиксель отображается на экране, или не делать этого, если он не будет отображен;

очистка Z–буфера — функция, ранее реализованная в процессорах фирмы ATI, позволяющая в начале каждого кадра быстро очищать Z-буфер. Благодаря этому не загружается шина, что благотворно сказывается на общей скорости работы карты;

Auto Pre-charge — новинка для видеопамяти, которая при записи новой порции информации должна быть готова принять очередные данные. Для этого предусмотрен алгоритм подготовки банков памяти к записи или считыванию информации. Банки памяти, благодаря использованию Auto Pre-charge, заранее готовятся к циклу записи или считывания информации. За счет этого, по данным Nvidia, можно добиться сокращения простоя GPU после подачи сигнала считывания или записи информации в 5-6 раз.

Набор преимуществ выпущенного NVidia чипа не исчерпывается перечисленным. NV25 обзавелся полноценной поддержкой двух мониторов — системой nView. Возможно подключение аналоговых и цифровых дисплеев, имеются 2 RAMDAC с частотой преобразования видеосигнала 350 МГц.

После появления в прошлом году на рынке GeForce3, Nvidia представила HRAA (high resolution anti aliasing) систему, которая отвечала за качественное полноэкранное сглаживание изображений. Фирма не преминула развить данное направление и в GeForce4. Теперь новый метод антиалайсинга (АА) получил лаконичное название Accuview. Он поддерживает анизотропную фильтрацию для улучшения Рис. 2изображений, простирающихся от переднего до заднего планов.

По-прежнему используется и Quincunx AA. Впрочем, была разработана новая технология 4xS, призванная улучшить мультисемплинговый антиалайсинг и уменьшить количество ошибок, возникших при использовании Quincunx AA. К сожалению, 4хS поддерживает только набором инструкций к DirectX и не работает в OpenGL.

Блок-схема процессора NV25 приведена на рисунке 2. Основные параметры видеокарты GeForce4 Ti 4600 на базе этого чипа можно увидеть в таблице 1. А лицезреть саму карту GeForce4 Ti 4600 во всей красе на рисунке 3.

В тестах

Начнем с новомодных шейдеров. Тестирование в 3DMark-2001 показывает явное преимущество двух вершинных шейдеров GeForce4 Ti 4600 над аналогичным блоком Таблица.основного конкурента — Radeon 8500. При разрешении 800х600 количество обрабатываемых Ti 4600 полигонов в секунду в 1.4 раза больше. Впрочем, при усложнении сцены (использовании большего числа источников света и большего количества полигонов) скорость вывода полигонов у GeForce4 Ti 4600 существенно падает, но все же остается самой высокой среди представленных на рынке массовых видеокарт.

Что касается пиксельных шейдерах, то их скорость обработки, судя по тесту 3DMark-2001, повторяет картину с шейдерами вершин. В невысоких разрешениях скорость обработки кадров у GeForce4 Ti 4600 значительно превосходит показатели Radeon 8500. Впрочем, при усложнении сцены быстрота работы вновь незначительно падает, хотя все же остается выше, чем у Radeon 8500.

Играючи

Карта показала себя в играх очень хорошо. Движок Aquanox (DirectX) достаточно обильно использует пиксельные и вершинные шейдеры. При наибольшей загрузке GPU (разрешение 1280х1024 при 32-битном цвете) карта Ti 4600 «развила» скорость в 1.5 раза выше, чем ближайший конкурент — ATI Radeon 8500 (53.4 против 34.6 кадров в секунду, по результатам полученным на http://www.tomshardware.com, —прим. ред.). Такого преимущество удалось достичь за счет использования двух шейдеров вершин, а также четырех пиксельных шейдеров.

В любимой многими игре Quake 3 (OpenGL) GeForce4 Ti 4600 также показывает впечатляющие результаты. И лидерство здесь дается почти так же легко, как это было в случае с DirectX. При разрешении 1600х1200 и 32-битном цвете GeForce4 Ti 4600 обгоняет Radeon 8500 на 36.5 % (тот же источник —Рис. 3прим. ред.).

Заключение

Подводя итог, можно сказать, что прошедшие полгода инженеры Nvidia не сидели сложа руки, а работали с максимальной отдачей. За этот достаточно короткий срок им вновь удалось вырваться далеко вперед по многим параметрам «фирменных» GPU, что наверняка приведет к укреплению лидирующего положения компании Nvidia на рынке. Даже невзирая на то, что цены на карту GeForce4 Ti 4600 с 128 Мб памяти установлены на уровне $399. Конечно, для подавляющего большинства пользователей подобная цена является очень высокой. Радует только то, что появление такого графического монстра приведет к удешевлению карт GeForce2 и GeForce3, что в конце концов, сделает их более доступными для потребителя.

P. S. Оставайтесь с нами. В следующем номере — обзор более дешевых моделей GeForce4 МХ на основе процессора NV17.