АРХИВ СТАТЕЙ ЖУРНАЛА «МОЙ КОМПЬЮТЕР» ЗА 2003 ГОД

Дай Бог памяти

Все журналы \ Номер 25/248 `2003 от 23.06.2003 \ Дай Бог памяти

Александр КОНДАУРОВ, начальник отдела научно-технической информации K-Trade

Продолжение, начало в №23 (246).

И наконец, параметр модулей памяти трудно формализуемый, однако неплохо видимый невооруженным глазом, —качество исполнения. При том, что в наши дни ни одна уважающая себя фирма, предоставляющая гарантию на товары, не продает память, не соответствующую стандартам (обмен по гарантии обходится дороже, чем можно «наиграть» при продаже некондиции), качество исполнения линейки может сказаться в условиях, чуть более сложных, чем обычные. В традиционном варианте, когда в плате стоит одна линейка памяти, работающая при таймингах, полученных из SPD, можно с большой долей уверенности сказать, что правильно работать будет любая исправная память в любой исправной системной плате (разве что за очень редкими исключениями, когда некоторые серии материнских плат начинают «привередничать»). Однако не исключено, что потом придется докупать память к уже существующей или попытаться задать более агрессивные тайминги. Тогда линейки, изготовленные по «упрощенному» варианту, могут уже создать сложности, вплоть до полного отказа работать в комбинации с другими линейками.

Для примера мы приводим фотографии линейки памяти, изготовленной «по всем правилам» (рис. 1). Итак, на плате присутствуют и разделительные емкости при каждой линии питания каждого чипа. Также опять-таки при каждом чипе памяти в наличии согласовывающие уровни сигналов резисторные сборки. Есть и полная заводская маркировка изготовителя модуля (в нашем случае это оригинальный модуль памяти от Samsung). А теперь предлагаем взглянуть на линейки, выпущенные по «упрощенному» варианту (рис. 2) неким «безымянным» производителем. Очевидно, что на количестве конденсаторов заметно сэкономили, вместо согласующих резисторов — просто мазки токопроводящего лака. При всех внешних различиях в стандартной конфигурации эти две линейки работают совершенно одинаково. Но вот стоит системе нагреться чуть выше допустимого или попытаться заполнить памятью все три слота — тут уже все упрощения и дают о себе знать.

А что с другой стороны?

Загляни под крышку!

Из надоевшей рекламы

Чем отличаются друг от друга такие вроде бы похожие модули памяти, мы разобрались. Теперь пришла пора обратить свои взоры к другой стороне слота памяти — к системным платам. При всем их кажущемся разнообразии, с точки зрения памяти, все оказывается гораздо проще и однотипнее. Так как память всегда и везде взаимодействует только со своим контроллером (чаще всего в его роли выступает северный мост чипсета), то и разница замечается исключительно, если у вас разные чипсеты. (Случаи отсутствия или некачественного изготовления необходимой обвязки настолько редки, что останавливаться на них нет особого смысла, то же самое относится и к попыткам производителя «выжать» что-либо недокументированное из чипсета.) В то же время особенности чипсета могут наложить достаточно серьезные ограничения на выбор памяти.

Шина памяти — традиционно одно из самых «узких» мест в архитектуре современного персонального компьютера. Довольно жесткие ограничения, накладываемые сегодняшней технологией, не позволяют беспредельно поднимать тактовую частоту, на которой работают модули памяти. В первую очередь, из-за необходимости их менять, соответственно, использовать другие разъемы. Недаром несменная память, распаянная на платах видеокарт, работает на частотах вдвое более высоких, чем модули оперативной памяти, устанавливаемые на системные платы. Внедрение DDR-памяти, конечно, помогло слегка (вдвое) увеличить пропускную способность шины ОЗУ, однако до полного удовлетворения всех потребностей дело так и не дошло.

Давайте посмотрим, а какая же пропускная способность шины памяти нужна? Главный потребитель, естественно, процессор. Внутри него данные перемалываются с огромной скоростью, тактовые частоты его счетных блоков превосходят частоты памяти даже не в разы — в десятки раз. Оперативная память за ЦПУ не поспевает, и он пользуется по мере возможности кэшами. Казалось бы, сколько ему ни дай — сожрет все, еще и добавки попросит. Но не тут-то было. «Съесть» больше, чем «пролезет» по процессорной шине, вся эта прожорливая махина не сумеет ни при каких обстоятельствах. А частота процессорной шины зачастую не так уж и велика: у продукции AMD — 200, 266, 333 и 400 МГц (DDR), у Intel — 400, 533 и 800 (QDR). Соответственно, если бы память обслуживала только процессор, то «накормить», например чипы от AMD, она была бы вполне в состоянии. Но ЦПУ не монопольно владеет памятью, кроме него есть тоже желающие откусить кусочек пирога. В первую очередь, это — встроенное видео. В совсем старых платах встроенное видео представляло собой просто распаянную на системной плате традиционную видеокарту — со своим процессором и отдельной памятью. Это позволяло двум главным потребителям ресурсов памяти работать каждому со своей памятью и друг другу мешать не сильно. Однако времена таких плат уже давным-давно канули в Лету, и теперь видеоакселератор не только встраивают сразу в северный мост чипсета, но и заставляют его «столоваться» в той же памяти, что и процессор. Экономия налицо — меньше кристаллов, соответственно, дешевле плата, но... Даже та самая, впритык обеспечивающая нужды процессора шина памяти теперь делится между двумя устройствами, каждое из которых вполне в состоянии «проглотить все». Если мы посмотрим на платы для Pentium 4, то увидим, что там картина еще менее оптимистична. Здесь процессор работает на еще вдвое более производительной шине, ему и одному-то мало, а тут еще и видео требует своего.

Если же видеокарта все же вынесена в AGP-слот, ситуация становится несколько проще, хотя все равно далека от идеала. Допустим, видеоконтроллер со своими непомерными аппетитами работает со своей собственной памятью, но данные то ему все равно передавать нужно, и их объем оказывается весьма ненулевым.

Кроме видеокарты, с памятью работает еще большая куча устройств, подключенных к контроллеру через PCI-шину. Да и о новой моде встраивать поддержку гигабитной локальной сети в северный мост тоже забывать не стоит. Конечно, в сумме эти потребители не добираются до «прожорливости» процессора. (AGP 4x может пропустить через себя только один гигабайт в секунду, да и не используется на полную мощность практически никогда. У PCI — 132 Мб/с на все устройства подключенные к шине.) Однако вспомним и о задержках в памяти — устройства обращаются к разным адресам и увеличивают общее время простоев контроллера.

Дело значительно упростилось с появлением двухканальных контроллеров памяти. Основные игроки на рынке чипсетов выпустили уже по второму, а Intel — так и вообще третье поколение чипсетов, решающих проблему «бутылочного горлышка» добавлением второго канала памяти. Теперь не просто одни процессы могут работать с одним банком, в то время как другие — со вторым, друг другу не мешая. Появился «умный» контроллер, умеющий работать в тандеме и предоставляющий даже одному процессу удвоенную пропускную способность — до 6.4 Гб/с. С появлением чипсета i875 и позже его «младшего брата» i865 потока данных из памяти стало хватать даже самому активному процессору — Pentium 4, с шиной 800 МГц. Две линейки DDR400-памяти, работающие в параллель, вполне соответствуют процессорной шине, и системы на базе такой связки действительно демонстрируют чудеса производительности.

Однако двухсотдолларовые платы и еще более дорогие процессоры сегодня встретишь не в каждом доме. И если мы внимательно посмотрим на более «народные» конфигурации, то заметим, что в большинстве случаев у нас и процессорная шина поуже, и на памяти сэкономить желательно. Стратегия подхода к выбору памяти вроде бы понятна — всем хочется получить максимальное быстродействие за разумные деньги или, другими словами, оптимизировать отношение цена/производительность. А вот как этого достичь — зависит уже от тактики, которая определяется, в первую очередь, выбором платформы.

Для платформы Intel тактика по большей части оказывается простейшей. В этом случае ширина процессорной шины самого слабого процессора соответствует ширине шины памяти самой быстродействующей памяти (P4 Celeron работает с шиной 400 МГц, которой по производительности соответствует PC3200 — DDR400). В результате в качестве первого приближения вполне можно доверять максимальной частоте шины памяти, которую поддерживает чипсет при заданной частоте шины процессора. Означает ли это, что толку от более быстрой памяти не будет в принципе? Конечно же, нет — вспомним о таймингах и возможности несколько «поджать» их, если оперативка работает на частоте ниже номинальной. Однако более быстрая память стоит дороже, и 2-процентный прирост быстродействия обходится 15-процентным увеличением цены на память. С другой стороны, лишних $10–20 нужно заплатить один раз, а 2% производительности — это лишний кадр в секунду, а то и два. Для систем с встроенным видео выигрыш может быть и побольше — до 5%. В случае чипсета с двухканальным контроллером памяти ситуация практически не меняется. Celeron в такую плату ставить смысла все равно нет, равно как и старые «пеньки» с 400-мегагерцовой шиной, да и на фоне цены платы экономить на скорости памяти уже как бы и не получается.

В таблице приведены результаты тестирования с помощью 3DMark 2003 (build 330) Hi-End системы, собранной из платы AOpen AX4C Max (чипсет i875), видеокарты HIS Excalibur Radeon 9800 Pro, процессора Intel Pentium 4 2.8C ГГц (FSB 800 МГц QDR) и Pentium 4 2.8 ГГц (FSB 533 МГц QDR). Поведение системы с памятью Samsung трех типов — PC2100, PC2700 и PC3200 — достаточно наглядно демонстрирует принцип, чем больше, тем лучше.

На конкурирующей платформе AMD все выглядит значительно занятнее. С одной стороны, мы имеем примерный паритет шин, с другой — незначительную разницу в цене процессоров «народного» класса. С третьей — тучу чипсетов, способных работать как с быстрой, так и с медленной памятью, не говоря уже о настоящем фаворите современности nForce2 в разных модификациях. Тут уже приходится просчитывать массу вариантов даже без учета возможного разгона, ведь на ту самую десятидолларовую разницу вполне можно купить процессор помощнее. (Кстати, как ни странно, но на выбор памяти желание разогнать систему оказывает прямо-таки катастрофическое влияние: нужно брать память, самую быструю из доступных.)

И тем не менее, некоторые отправные точки в этом почти детективном процессе обрисовать вполне можно. Во-первых, стоит уменьшить «потери» в самом чипсете. Как только система начинает работать в асинхронном режиме (тактовая частота памяти не совпадает с тактовой частотой процессорной шины), к задержкам памяти сразу же добавляются задержки в буферах чипсетов и задержки синхронизации.

На диаграмме 1 приведены результаты тестирования системы, состоящей из платы Soltek SL-75FRN2-L на базе чипсета nVidia nForce2, процессора AMD Athlon XP 2400+ (FSB 266 МГц DDR), видеокарты HIS Excalibur Radeon 9000 Pro 64 VIVO и памяти трех типов — Samsung PC2100, PC2700 и PC3200. В качестве теста применялся 3DMark2001 SE. Видно, что чем больше различаются тактовые частоты шин памяти и процессора, тем медленнее работает система, несмотря на то, что память работает как бы быстрее. То есть стартовый пункт — это равенство частот шин.

Следующий момент, требующий обязательного внимания — встроенное видео. Так как видеоконтроллер в нашем случае встроен в чипсет, то он вполне может пользоваться памятью в те моменты, пока чипсет синхронизирует данные между процессором и памятью. В итоге, применение более быстрой памяти в этом случае может оказаться вполне оправданным. Кстати, для чипсетов nForce2 — это единственный вариант, когда оправдано использование двухканальной памяти. Получается, что каждый из мощных потребителей работает со своим каналом синхронно с памятью, и таким образом процессор и видеоконтроллер мешают друг другу минимально. Но допустим, в системе установлена внешняя видеокарта. Тогда значительно эффективнее воспользоваться одноканальной модификацией чипсета nVidia nForce2 400, например на плате Soltek SL-NV400-64, и использовать память на частоте, равной частоте процессорной шины.

По сравнению с тактовой частотой, влияние таймингов на быстродействие системы не столь велико, однако определенные процентики и на этом можно выиграть. Так как их влияние в относительных величинах практически не зависит ни от чипсета, ни от тактовой частоты. Поэтому ради экономии места на диаграмме 2 приводятся усредненные значения относительного прироста быстродействия системы. Проводилось измерение времени архивирования 200-Мб каталога документов Word и Excel, расположенного на виртуальном диске в памяти. 100% соответствует времени, затраченному на архивирование при самых медленных настройках. Обозначения таймингов идут в следующем порядке: CAS Latency Time — RAS-to-CAS Delay — RAS Precharge — Precharge Delay.

На диаграмме видно, что наибольшее влияние на скорость подсистемы памяти оказывают первые две задержки — CAS Latency Time и RAS-to-CAS Delay, в то время как остальные два параметра «отвечают» за доли процентов. Отметим, что наш тест работает практически только с ОЗУ. Исходные данные лежат фактически в памяти, временный файл и файл результата — там же, а сам процесс архивирования состоит в основном из массированных пересылок данных из одних участков оперативки в другие.

Третий, вовсе даже не лишний

...а на седьмой день пришел лесник.

из рассказа старого партизана

Наверное, в заключение нашего теоретического экскурса стоит вспомнить о третьем участнике всей этой «вечеринки». Догадались, что это? Правильно — софт. Особо внимательный читатель, наверняка, заметил, что разница между крайними значениями в тесте с архиватором составила почти 7% только на таймингах. В то время как тестирование с помощью 3DMark2003 продемонстрировало в процентном отношении много меньший разброс на разных типах памяти.

Да, как это ни удивительно, но быстродействие системы в целом зависит от массы параметров. И производительность подсистемы памяти — одна из важных, но далеко не единственная причина, которая может всерьез помочь или осложнить жизнь.

Сжатие архиватором хорошо структурированных данных, находящихся на виртуальном диске, — это в чистом виде тест подсистемы памяти. Математики как таковой здесь не очень много, а размещение всех данных в памяти исключает ожидание медленных устройств типа винчестера. Отсутствие же сколь-нибудь серьезных изменений картинки на мониторе практически не отвлекает систему на отрисовку графики. К тому же тут мы замеряем прямой параметр — время работы.

Игровые тесты типа 3DMark, хоть и не пользуются при составлении своих рейтингов дисковой подсистемой, тем не менее, в очень большой степени зависят еще как минимум от двух подсистем — графической и процессора. К тому же финальный результат — количество кадров в секунду — в разных частях этих тестов складывается с разными весовыми коэффициентами. В результате чего на выходе мы получаем некую синтетическую цифру. Причем влияние подсистемы памяти на итоговые показатели оказывается значительно меньшим.

Однако не стоит забывать, что каждый десяток «попугайчиков» от «бешеного лука» (сегодняшняя фирма FutureMark, разработчик 3DMark2003, еще год назад называлась MadOnion) — это лишний кадр, а то и два в секунду в одной из популярных игр. И даже если вдруг именно эта игра оставила вас безразличным, вполне возможно, что ваша любимая игрушка построена на том же или аналогичном движке (а каждый из тестов 3DMark базируется на четырех движках, охватывающих большую долю всего рынка игр). Если вы кодируете mp3 или занимаетесь цифровым видео — то хранение данных на диске, конечно же, уменьшит ту семипроцентную разницу. Да и значительно более сложная обработка данных процессором тоже уполовинит цифры. Но если вдруг задача будет требовать ВСЕХ ресурсов системы, то даже одного процента прироста быстродействия может оказаться достаточным на то, чтобы, например, при оцифровке не затерялся нужный кадр.

(Продолжение следует)

Рекомендуем ещё прочитать:

Автобаны Интернет. (№4/227 `2003) Виктор Бондарь
Образумь загребущий принтер. (№4/227 `2003) Андрей Голота, Инженер Сервисного Центра
ПоДУдим? (№7/230 `2003) Александр Кузьмюк
Однажды в Америке. (№11/234 `2003) Сергей Н. Мишко
Укрощение видяхи. (№11/234 `2003) Владимир Некрасов
Легкое дыхание. (№26/249 `2003) Андрей Денисов
Биос и его настройки. (№27/250 `2003) Виталий Якусевич
Мышиная возня. (№33/256 `2003) Владимир Сирота
Фотоолимпиада. (№42/265 `2003) Олег Федоров
Музыка в стиле флэш. (№44/267 `2003) Виталий Клецко

Предыдущая статья Назад К списку журналов Следующая статья