Вот и дождались обещанного: 6 февраля компания Nvidia представила две линейки новых видеокарт на базе графических процессоров NV25 и NV17. В этой статье речь пойдет о чипе NV25 и продуктах на его основе.
За прошедшие полгода инженеры Nvidia серьезно поработали над развитием процессора NV20 и выпустили на рынок куда более совершенный продукт NV25 (рис. 1). Теперь даже там, где раньше компания проигрывала своему основному конкуренту ATI, благодаря новому видеоядру достигнуты впечатляющие результаты. В недалеком будущем это позволит перевести рынок массовых 3D-акселераторов на качественно новый уровень.
В настоящий момент на рынке появились первые образцы карт, выпущенные на базе новых графических процессоров (GPU) NV25. Это модели Nvidia GeForce4 Ti 4600 и GeForce4 Ti 4400. Основной их отличительной особенностью являются скоростные характеристики:
Основным преимуществом видеоядер NV25 является усовершенствованная архитектура доступа к графической памяти Light Speed Memory Architecture II. LMA II стала продолжением реализованной в линейке GeForce3 архитектуры LMA, которая позволяет использовать текстуры больших размеров, а также многое другое. Из этого другого можно выделить:
кэш вершин позволяет хранить параметры вершин сцены, к которым происходит частое обращение при перерисовке сцены. Таким образом разгружается шина AGP;
кэш примитивов используется для сохранения параметров вершин, прошедших стадию наложения теней, для последующей передачи и наложения образовавшихся примитивов на треугольники;
двойной текстурный кэш алгоритмы этого кэша позволяют предугадывать текстурирование сцены при ее изменениях. Лучше всего проявляет себя во время обработки и фильтрации сложных сцен, а также мультитекстурирования. Впервые был реализован в GeForce3;
кэш пикселей конечный кэш рендерящего конвейера. Пиксели сохраняются в нем перед выдачей на экран для отображения. После прорисовки одной «порции» пикселей из кэша считывается другая «партия» и т. д.
Каждый кэш работает независимо от других, и каждый оптимизирован под свой собственный набор инструкций. Помимо этого преимущества, видеопроцессоры NV25 имеют следующие особенности для повышения скорости работы (все они являются составными частям архитектуры LMA II):
Lossless Z-Buffer Compression технология, дающая возможность без потерь сжимать данные, содержащиеся в Z-буфере, в соотношении 4:1. Это достигается благодаря новому усовершенствованному алгоритму сжатия;
Visibility Subsystem Z-Occlusion Culling алгоритм, позволяющий благодаря значениям Z-буфера, определять видимость данного пикселя на экране и обрабатывать его, если пиксель отображается на экране, или не делать этого, если он не будет отображен;
очистка Zбуфера функция, ранее реализованная в процессорах фирмы ATI, позволяющая в начале каждого кадра быстро очищать Z-буфер. Благодаря этому не загружается шина, что благотворно сказывается на общей скорости работы карты;
Auto Pre-charge новинка для видеопамяти, которая при записи новой порции информации должна быть готова принять очередные данные. Для этого предусмотрен алгоритм подготовки банков памяти к записи или считыванию информации. Банки памяти, благодаря использованию Auto Pre-charge, заранее готовятся к циклу записи или считывания информации. За счет этого, по данным Nvidia, можно добиться сокращения простоя GPU после подачи сигнала считывания или записи информации в 5-6 раз.
Набор преимуществ выпущенного NVidia чипа не исчерпывается перечисленным. NV25 обзавелся полноценной поддержкой двух мониторов системой nView. Возможно подключение аналоговых и цифровых дисплеев, имеются 2 RAMDAC с частотой преобразования видеосигнала 350 МГц.
После появления в прошлом году на рынке GeForce3, Nvidia представила HRAA (high resolution anti aliasing) систему, которая отвечала за качественное полноэкранное сглаживание изображений. Фирма не преминула развить данное направление и в GeForce4. Теперь новый метод антиалайсинга (АА) получил лаконичное название Accuview. Он поддерживает анизотропную фильтрацию для улучшения изображений, простирающихся от переднего до заднего планов.
По-прежнему используется и Quincunx AA. Впрочем, была разработана новая технология 4xS, призванная улучшить мультисемплинговый антиалайсинг и уменьшить количество ошибок, возникших при использовании Quincunx AA. К сожалению, 4хS поддерживает только набором инструкций к DirectX и не работает в OpenGL.
Блок-схема процессора NV25 приведена на рисунке 2. Основные параметры видеокарты GeForce4 Ti 4600 на базе этого чипа можно увидеть в таблице 1. А лицезреть саму карту GeForce4 Ti 4600 во всей красе на рисунке 3.
В тестах
Начнем с новомодных шейдеров. Тестирование в 3DMark-2001 показывает явное преимущество двух вершинных шейдеров GeForce4 Ti 4600 над аналогичным блоком основного конкурента Radeon 8500. При разрешении 800х600 количество обрабатываемых Ti 4600 полигонов в секунду в 1.4 раза больше. Впрочем, при усложнении сцены (использовании большего числа источников света и большего количества полигонов) скорость вывода полигонов у GeForce4 Ti 4600 существенно падает, но все же остается самой высокой среди представленных на рынке массовых видеокарт.
Что касается пиксельных шейдерах, то их скорость обработки, судя по тесту 3DMark-2001, повторяет картину с шейдерами вершин. В невысоких разрешениях скорость обработки кадров у GeForce4 Ti 4600 значительно превосходит показатели Radeon 8500. Впрочем, при усложнении сцены быстрота работы вновь незначительно падает, хотя все же остается выше, чем у Radeon 8500.
Играючи
Карта показала себя в играх очень хорошо. Движок Aquanox (DirectX) достаточно обильно использует пиксельные и вершинные шейдеры. При наибольшей загрузке GPU (разрешение 1280х1024 при 32-битном цвете) карта Ti 4600 «развила» скорость в 1.5 раза выше, чем ближайший конкурент ATI Radeon 8500 (53.4 против 34.6 кадров в секунду, по результатам полученным на http://www.tomshardware.com, прим. ред.). Такого преимущество удалось достичь за счет использования двух шейдеров вершин, а также четырех пиксельных шейдеров.
В любимой многими игре Quake 3 (OpenGL) GeForce4 Ti 4600 также показывает впечатляющие результаты. И лидерство здесь дается почти так же легко, как это было в случае с DirectX. При разрешении 1600х1200 и 32-битном цвете GeForce4 Ti 4600 обгоняет Radeon 8500 на 36.5 % (тот же источник прим. ред.).
Заключение
Подводя итог, можно сказать, что прошедшие полгода инженеры Nvidia не сидели сложа руки, а работали с максимальной отдачей. За этот достаточно короткий срок им вновь удалось вырваться далеко вперед по многим параметрам «фирменных» GPU, что наверняка приведет к укреплению лидирующего положения компании Nvidia на рынке. Даже невзирая на то, что цены на карту GeForce4 Ti 4600 с 128 Мб памяти установлены на уровне $399. Конечно, для подавляющего большинства пользователей подобная цена является очень высокой. Радует только то, что появление такого графического монстра приведет к удешевлению карт GeForce2 и GeForce3, что в конце концов, сделает их более доступными для потребителя.
P. S. Оставайтесь с нами. В следующем номере обзор более дешевых моделей GeForce4 МХ на основе процессора NV17.