Узнать частоту системной шины. Прочие параметры процессоров. Кэш и частота шины процессоров

  • Новейший 6 ядерный Core i5 - по цене 4 ядерного i3 8350K ">Новейший 6 ядерный Core i5 - по цене 4 ядерного i3 8350K
  • GTX 1080 Ti ASUS ROG STRIX Gaming дешево в XPERT.RU
  • XPERT.RU НЕРЕАЛЬНО ОБРУШИЛ ЦЕНУ НА 8700К . ДЕЛАЙ ЗАКАЗ!!!"> XPERT.RU НЕРЕАЛЬНО ОБРУШИЛ ЦЕНУ НА 8700К . ДЕЛАЙ ЗАКАЗ!!!
  • Распродажа 8 ядерника - цена тебя удивит!

Вы можете отметить интересные вам фрагменты текста,
которые будут доступны по уникальной ссылке в адресной строке браузера.

По-прежнему существует большая разница между прототипами зданий и продуктами в промышленном масштабе. Эта проблема становится более серьезной здесь, на северо-востоке, из-за высокой средней температуры. Некоторые компьютеры имеют функцию контроля температуры, которая, если она достигает определенного предела, выдает предупреждение и т.д. в моем конкретном случае установка имеет эту информацию. Они измеряют внутреннюю температуру корпуса, температуру процессора и скорость вращения кулеров. С помощью программного обеспечения для мониторинга пользователь может быть немедленно предупрежден о проблемах с нагревом и вентиляторами кулеров.

Зависимость производительности от частоты шины и параметров памяти на ASUS A7N8X-X (nForce2 400)

Enot 19.02.2004 01:45 | версия для печати | архив

Эта работа была прислана на наш "бессрочный" конкурс статей , однако не вызвала особого интереса и подверглась лёгкой критике в конференции . Автор учёл замечания, доработал и дополнил статью, так что сейчас вы читаете обновлённую версию.

Программы мониторинга зависят от платы, поэтому вы не должны использовать программу для мониторинга платы, отличной от той, которая поставляется с ней. Используйте охладитель большей емкости с более высокой массой алюминия и предпочтительно с 2 или 3 вентиляторами. Разгон опасен и может испортить ваш процессор. Даже в тех случаях, когда он не повредит, это заставляет компьютер терять надежность, увеличивая вероятность сбоев. Кто хочет рисковать, есть те, кто учить. Одна вещь для пользователя с аппаратными знаниями, чтобы знать все плюсы и минусы и разгонять на свой страх и риск.

Целью статьи является определение влияния частоты системной шины процессора и параметров памяти на производительность. Особое внимание уделено провалу производительности на частоте 183 МГц и параметру памяти Active Precharge Delay.

Материнская плата ASUS A7N8X-X обладает некоторыми специфическими "особенностями", которые не позволяют распространять результаты на все платы nForce2. Тем не менее, общие выводы применимы к большинству других материнских плат.

Другое дело, что ничего не подозревающий пользователь должен воспринимать поверхностные знания, не зная опасности для компьютера и разрешая разгон. Для тех, кто хочет разгоняться, зная риски, в Интернете есть вся информация. Разгон не соответствует безопасности. Разве это недостаточно для исследования? Эти источники имеют дополнительный 12-вольтовый высокоточный разъем.

Более низкие значения приводят к более высокой производительности, но также могут сделать компьютер неустойчивым. Ответ: Если напряжение на плате достигает 2, 5 вольта, забудьте об этом. Процессор может гореть, если он подключен к более высокому напряжению, и его работа не гарантируется. Другой важной проблемой являются внешние часы и множитель.

Тестовая система.

  • Процессор – AMD Athlon 1700+ Thoroughbred-B. Максимальный разгон – 2200 МГц при 1,85 В.
  • Память – PC3200, 1х512 МБ, 5-2-2-2,5, Nanya. Работает синхронно с процессором.
  • Материнская плата – nForce2 400, ASUS A7N8X-X, BIOS 1007. CPU Interface = Optimal (заблокирован в данной прошивке). Bus Disconnect = off. Максимальный разгон – 208 МГц.
  • Видеокарта – Radeon 9000, 64 МБ, 128 bit.
  • Жёсткий диск – WD400JB.
  • Операционная система – MS Windows 2000 SP4.

Материнская плата ничем не отличается от A7N8X кроме одноканальности и отсутствия дополнительных контроллеров. У них даже номера прошивок BIOS и внесённые изменения совпадают. Разница в производительности с двухканальной системой, в большинстве случаев, находится в пределах нескольких процентов. Хорошая статья про влияние двухканальности на производительность – http://www.lostcircuits.com/motherboard/asus_a7n8x-x/ .

Вероятно, вы заметите небольшую разницу. Какое отношение нужно предпринять, несмотря на то, что прошло уже год? Вам нужно будет списать счет, чтобы потребовать обмен. Вам нужно проверить, была ли модель, которую вы действительно купили, рекламой. Нажмите «Мой компьютер» правой кнопкой мыши и выберите «Свойства» в меню. Является ли медлительность платы из-за низкой шины?

Если он не сжигает их, как мне следует выполнять такие настройки шины и множителя, так как их руководство не ведет меня? Слабость может быть вызвана другими причинами. Компьютер представляет собой набор деталей, и каждый из них имеет значение в определенных действиях. Проблема в том, что в зависимости от версии карты могут быть предоставлены различные версии модемов. Мне нужна ваша помощь, если это возможно. Производитель не может обрабатывать пластинки как общие, торгуя своими комбинациями, заявляя, что «все равно».

Какие тесты использовались?

Очевидно, падение производительности на 183 МГц не связано с процессором. Поэтому использовались программы, интенсивно работающие с большими объёмами данных и сильно загружающие подсистему памяти. Были выбраны два архиватора: 7-zip (алгоритм LZMA) и RKC (алгоритм PPM). Размер файла для сжатия – 20 МБ. Пиковое использование оперативной памяти для RKC - 400 МБ, для 7-zip – 200 МБ. В 7-zip при увеличении размера слова большую роль играет процессор, поэтому тесты выполнялись при размере слова 255 и 64.

Несмотря на это, рынок является рынком. Но обещание одного бренда и установка другого неверны. В списке нет проблем с совместимостью. Вы должны проверить, хорошо ли связаны воспоминания и адекватны ли они. Случаи, в которых компьютер не включается, как правило, являются результатом грубых ошибок, например, о напряжении питания, плохо подключенной или неисправной памяти, перевернутых кабелях, монтажных платах с винтами шкафа и т.д. То же самое не работает с этими функциями. Ответ: То, что вы сделали, правильно, но работает только в том случае, если все оборудование совместимо.

Дополнительно использовался Unreal Tournament 2003 (UT2003). Эта игра является одной из лучших программ для оценки общей производительности домашнего компьютера. В отличие от 3DMark, результаты меньше зависят от видеокарты, а увеличенное до 32 количество ботов заставляет процессор больше времени тратить на работу искусственного интеллекта и физику. Для увеличения точности, время выполнения теста было увеличено до 240 секунд (около 7 минут реального времени).

Используемые часы являются результатом умножения внешнего такта, независимо от его значения, на коэффициент умножения. Не забывайте, что вам нужно запрограммировать перемычки, определяющие напряжение процессора. Это влияет на жизнь процессора? Ответ: Разгон никогда не бывает безопасным. Он всегда ставит процессор под угрозу горения и снижает надежность компьютера. Кроме того, для разгона работают некоторые приемы. Нельзя забывать, что разгон - это рискованная практика, которая должна выполняться под ответственность пользователя.

В вашем случае компьютер имел постоянные сбои и неустойчивости. Это возможности при разгоне. Это влияет на срок службы процессора, который может гореть через год или два, а может быть, через месяц или два. Фактически они будут работать с той же запрограммированной тактовой частотой, что и ваш процессор. Наличие двух сокетов не означает, что он выполняет многопроцессорную обработку. Таким образом, карта будет совместима с обоими типами процессоров, но не позволяет устанавливать оба одновременно. Это дорогие, сложные платы и предназначены для случаев, когда стоимость не является проблемой, а производительностью.

Для измерения пропускной способности и задержек памяти использовался ScienceMark 2.0. Выбор именно этой программы обусловлен тем, что она сразу представляет задержки памяти в абсолютном значении в наносекундах и формирует лог-файл. Для лучшего восприятия, на графиках и диаграммах приводятся не задержки, а величины, обратные задержкам.

Рад, что вы спросили раньше, потому что, если вы подключите два процессора на этой плате, вы рискуете сжечь их вместе с доской. На протяжении многих лет модули с плавающей точкой действительно развивались. В дополнение к архитектурным усовершенствованиям, увеличение часов приводит к пропорциональному увеличению производительности. В прошлом воспоминания были медленными, но не влияли на скорость вычислений, так как даже с медленностью считывание данных из памяти было быстрым по сравнению с численной обработкой.

Воспоминания были быстрее, но их эволюция намного медленнее, чем процессоры. Таким образом, доступ к памяти, необходимый для получения данных, подлежащих обработке в их симуляции, может занять значительное количество времени по сравнению с временем обработки этих данных.

Итак, использовались:

  • 7-zip, fb=255. Параметры командной строки -mx=9 -mfb=255 .
  • 7-zip, fb=64. Параметры командной строки -mx=9 -mfb=64 .
  • RKC. Параметры командной строки -mxx -M420m .
  • UT2003. Настройки качества – все на максимум. Разрешение 640х480х32. Параметры командной строки dm-antalus?spectatoronly=true?numbots=32?quickstart=true -benchmark -seconds=240 -exec=..\Benchmark\Stuff\botmatchexec.txt .
  • ScienceMark 2.0.

Насколько можно доверять результатам?

Примите во внимание, хотя он не всегда существует со стороны производителей программного обеспечения, что крайне важно для оптимизации производительности. Наконец, помните, что не все симуляции сильно выполняются процессором числа. Те, которые не используют вычисления с плавающей запятой, в основном зависят от нечислового раздела, и особенно от памяти, и поэтому подвержены медлительности. Оказывается, что шина памяти и 133 МГц, но материнская плата работает только со скоростью до 100 МГц для связи с памятью.

Интересно, есть ли какие-либо проблемы при использовании этой памяти на этом компьютере. В любом случае мы всегда можем использовать память быстрее, чем требуемая карточкой. Существует риск возникновения сбоев, сбоев в работе компьютера или других аномалий. Всякий раз, когда два компонента разной скорости работают вместе, скорость медленнее должна преобладать. Мои друзья, которые «понимают» предмет, говорят, что мой прирост производительности будет минимальным: от 400 МГц до 650 МГц, например, из-за уменьшения кеша.

Изучение встроенного теста 7-zip выявило такую особенность. Во-первых, первые результаты после перезагрузки очень сильно отличаются (до 5%). Во-вторых, на экране отображаются результаты только первого прохода, что не логично. Приходится постоянно нажимать кнопку "Restart" и вручную усреднять результаты каждого прохода, которые также имеют большой разброс. Поэтому тестирование выполнялось при помощи консольной версии и утилиты timer 3.01.

Каким будет увеличение производительности? Ответ: У нас есть две технические ошибки. Они определяются внутри самого процессора. Затем вы можете установить более быстрые процессоры. Критической проблемой является напряжение ядра процессора, используемое вашей доской.

Другая ошибка - проблема с пропускной способностью кеша. Если да, то какова будет качественная карта, которая будет удерживать этот процессор? Будет ли такая конфигурация быстрой для такого рода работ? Ответ: Не впечатляйте, это «разговор продавца». Обычно они используют этот тип претензии, когда у него нет продукта, которого хочет клиент.

В ScienceMark 2.0 тест выполнялся несколько раз, до получения стабильных задержек памяти. Значения задержек могут отличаться на один такт процессора.

Информация о частоте шины и процессора получалась при помощи CPU-Z. Устанавливаемая в BIOS частота может немного отличаться от реальной (до 1 МГц). Причем было замечено, что для частоты 200 МГц в BIOS, если FSB Spread Spectrum = Disabled, то реальная частота была 200,5 МГц, а если FSB Spread Spectrum = 0,50%, то реальная частота была 199,2 МГц. Достаточно хитрая "особенность".

Видеокарты и память, которые вы указали, являются хорошим выбором. Где проблема на материнской плате или процессоре? Эти воспоминания используют метод двойной скорости передачи данных для достижения более высоких ставок. Таким образом, с подсистемой памяти, работающей на теоретической максимальной скорости в два раза, мы достигли хорошего увеличения производительности компьютера. Процессор работает не быстрее, но он может быстрее передавать данные из памяти, что помогает повысить общую производительность.

Одним из основных подключаемых модулей или сокетов, встроенных в материнскую плату компьютера, является процессорный разъем. Процессор или центральный процессор - это диспетчер задач всех сложных операций, которые происходят на компьютере, и для этого тысячи команд выполняются им.

Полученные результаты отличаются весьма незначительно. Поэтому на всех графиках и диаграммах приведен интервал 80%-100% или 90%-100%. В реальной жизни такие различия почти незаметны и представляют интерес больше для любителей разгона и тонкой настройки. Для оценки погрешности измерения, на двух разных частотах тесты были запущены несколько раз и взята максимальная разница между результатами. Конечно, такая разница не является строгой погрешностью, но для оценки её порядка этого вполне достаточно.

По мере развития технологии появились новые модели процессоров, способные выполнять все больше и больше инструкций за меньшие промежутки времени. Базовая архитектура процессора в настоящее время 64-битная, но есть еще 32-разрядные процессоры. Но какова будет эта архитектура и какое влияние на систему?

С технической точки зрения, 32-разрядные процессоры способны обрабатывать инструкции до 32 бит за один раз, то есть на одной дорожке, такой как ширина дороги, вмещающей 32 автомобиля на одной дорожке. 64-разрядный процессор имеет в два раза большую вычислительную мощность 32-разрядного процессора.


Зависимость производительности от параметров памяти.

Сначала определим влияние каждого из параметров на производительность. Однако тут возникли некоторые затруднения с материнской платой ASUS A7N8X-X. Дело в том, что изменение CAS Latency с 2,5 до 3 не приводило к изменению результатов при конфигурации 200х9,5. А при 160x12,5 (минимальная частота работы при CAS Latency = 2), не было разницы между 2 и 2,5. При этом CPU-Z показывал, что значение CAS Latency изменено. Поэтому тестирование проводилось при такой странной конфигурации 180х11, на которой все нормально работало. Такая "особенность" не всегда принимается во внимание. Например, www.terralab.ru при изучении влияния параметров памяти на материнской плате ASUS A7N8X сделала ошибочный вывод о том, что CAS Latency почти не влияет на производительность. Конечно, такого быть не может. При конфигурации 180х11 заметная разница есть, а при 200х9,5 – вдруг исчезала.

Однако эти современные системы также имеют 64-битные версии. Затем, в момент приобретения процессора, необходимо также учитывать, какая система должна быть выбрана для установки на машине совместимым образом. 32-разрядные процессоры не поддерживают 64-разрядные системы, но 64-разрядные системы поддерживают 32-разрядные процессоры, но не в полной мере используют их производительность.

Но откуда вы узнаете, имеет ли процессор, который вы собираетесь приобрести, 32-битную или 64-битную архитектуру? Найдите техническую информацию, которая определяет эту архитектуру. Очень осторожно, чтобы не путать архитектуру размера, измеренную в «нм» или нанометрах, с количеством бит.


В основном, влияние оказывают параметры RAS to CAS Latency и CAS Latency. Причем RAS to CAS немного большее. RAS Precharge имеет гораздо меньшее значение, а увеличение Active Precharge Delay может даже незначительно повышать производительность.

Рассмотрим Active Precharge Delay подробнее. Неплохую информацию об этом можно найти здесь . Кстати, там же можно почитать и про CMD Rate. Вместо выражения "Active Precharge Delay" (в документации на материнскую плату - SDRAM Active Precharge Delay, Row-Active Delay) производитель памяти Mushkin использует "tRAS". Смысл этого параметра достаточно сложен для понимания и адекватного перевода. Вот оригинальное определение: "... tRAS short for the RAS Pulse width. Historically, tRAS was defined as the time needed to establish the necessary potential between a bitline pair within the memory array until it was safe to write back the data to the memory cells of origin after a (destructive) read."

На настольном компьютере процессор - это элемент, который потребляет наибольшую энергию и, следовательно, больше всего нагревается. Неконтролируемое нагревание приводит к потере производительности, сокращению срока службы компонентов и даже неисправностей. Когда компьютер испытывает такие проблемы, как выключение питания, например, когда машина выключается или перезагружается, эти проблемы могут быть связаны с защитой материнской платы, чтобы предотвратить сжигание процессора, или процессор буквально «обжаривает» из-за высокой температуры, Для этого в нынешних моделях есть инструкции по защите, которые при определенной температуре отключаются сами по себе, предотвращая ее сжигание.

Active Precharge Delay (tRAS) = RAS to CAS Latency (tRCD) + CAS Latency + 2

В теории максимальная производительность для конфигурации памяти Х-2-2-2,5 (Х - Active Precharge Delay) должна быть при значении Active Precharge Delay не менее 2 + 2,5 + 2 = 7. Проверим это на практике.


Заметно реагирует на изменения параметра только UT2003. В остальных приложениях разница очень мала. Но везде максимум находится в районе Active Precharge Delay = 8. По сообщениям в форумах, разница в пропускной способности памяти должна быть больше. Возможно, это объясняется одноканальным режимом работы.

Рисунок двух кулеров и их раковин. Чтобы управлять этими высокими температурами, есть набор деталей, которые должны быть установлены вместе в качестве процессора и прикреплены к материнской плате. Для каждого гнезда есть набор кулеров и совместимых стоков.

Обычно, покупая процессор, есть возможность купить «ящик», то есть в процессорной коробке уже включен этот комплект охлаждения: кулер, радиатор и даже термопаста. Стыковка на материнской плате зависит от модели и обычно используется в металлических дюбелях или даже специальных винтах, присутствующих в самой части. Кроме того, есть инструкции по эксплуатации, которые иллюстрируют и объясняют установку этих частей.

Теперь увеличим RAS to CAS Latency на 3. В теории это должно привести к смещению максимума производительности на 3 позиции. Учитывая, что только в UT2003 есть заметные изменения, остальные тесты не использовались. На диаграмме для сравнения приведены предыдущие результаты.


Смещение очень невыразительное, но есть. Максимум находится в районе Active Precharge Delay = 9. Хорошо заметно увеличение падения производительности при минимальных значениях Active Precharge Delay 4 и 5, а также небольшое уменьшение падения при максимальных значениях 13 и 14. Такие изменения вызваны смещением максимума вправо. Все это согласуется с теорией, но приведенную формулу можно использовать только как приблизительную.

Зависимость производительности от частоты шины.

Для исследования влияния частоты шины можно воспользоваться простым методом, когда при фиксированном коэффициенте процессора меняется частота шины. В идеальном случае должна получиться прямая линия с коэффициентом 1. По отклонению от линейности можно найти и оценить провалы в производительности. Однако данный метод не учитывает, что при фиксированной частоте процессора производительность растет нелинейно от частоты шины. Практическая ценность такого метода невелика. Поэтому использовался другой метод.

Исследование проводилось с фиксированной частотой процессора. Учитывая, что при разных частотах шины нельзя точно подобрать коэффициенты умножения, использовалась линейная интерполяция. Т.е. получались результаты при частоте процессора выше требуемой фиксированной и ниже, и далее использовалась формула:

Рез = (Част2 – Част) * (Рез2 – Рез1)/(Част2 – Част1) + Рез1

Первоначально предполагалось выполнить исследование при частотах 166 МГц, 182 МГц, 183 МГц, 200 МГц и получить результаты, лежащие на двух параллельных прямых. Разница между этими прямыми должна быть равна провалу производительности на 183 МГц. Но в процессе предварительного тестирования результаты сильно разошлись с теорией. Поэтому было выполнено исследование всего диапазона от 166 МГц до 205 МГц с шагом в 5 МГц. Тесты не выполнялись при частотах шины 182 МГц и 183 МГц. Провести исследование с шагом в 1МГц нереально. Однако падение производительности происходит именно здесь.

К сожалению, "особенности" A7N8X-X не позволили использовать только интерполяцию. На частоте 185 МГц возникли две проблемы. Во-первых, не все коэффициенты были доступны. Во-вторых, при коэффициентах х8,5 и х9,5 задержки памяти и производительность приложений были значительно ниже, чем при х11 и х11,5. Поэтому была подобрана удобная фиксированная частота процессора 1900 МГц. Результаты при коэффициентах х8,5 и х9,5 приводятся отдельно. Когда невозможно было использовать интерполяцию, использовалась экстраполяция (частоты процессора, лежали одновременно выше или ниже фиксированной частоты 1900 МГц), причем для 185х11, 195х11,5, 200х11,5 коэффициент наклона линии брался от результатов на 190 МГц. Точность при этом значительно снизилась.


Недоступность некоторых коэффициентов процессора при частоте выше 182 МГц свойственно многим материнским платам и обсуждалось в форумах. Различия в производительности при разных коэффициентах наблюдалось на материнской плате Abit NF7 rev. 2.0. Для памяти 5-2-2-2 приводятся такие результаты:

Athlon XP 3000+ (333MHz FSB) Athlon XP 3000+ (400MHz FSB) Athlon XP 3200+ (400MHz FSB)
Dual DDR333 SDRAM Dual DDR400 SDRAM
Latency, ns 96 81 85

А теперь сравните с полученными результатами:

nForce2 400 ASUS A7N8X-X, PC3200 5-2-2-2.5
Конфигурация Частота шины, МГц Частота процессора, МГц Пропускная способность памяти (ScienceMark 2.0), МБ/с Задержки памяти (ScienceMark 2.0), нс
166x11 167.00 1837.6 2 406 97.41
166x11.5 167.00 1921.0 2 421 96.30
200x11 200.50 2205.1 2 872 82.54
200x9.5 200.50 1904.3 2 700 91.37

Итак, результаты низкоуровневых тестов.

На частоте 185 МГц (на самом деле на 183 МГц) происходит небольшое падение производительности. Точнее, для коэффициентов х10,5 – х11,5 прирост отсутствует. В остальном, все линейно от частоты шины с коэффициентом близким к единице.

А теперь результаты приложений.

Как видно, падение производительности происходит не только на 185 МГц, но и на 190 МГц. Графики выглядят довольно странно.

Почему так происходит?

Провал в производительности происходит из-за изменения параметров чипсета nForce2. Другого объяснения нет. Примечательна частота 183 МГц. Это как раз середина между 166 МГц и 200 МГц. Т.е. до 183 МГц используются параметры 166 МГц, а после 183 МГц используются более медленные параметры 200 МГц. Падение на 190 МГц, возможно, связано с замедлением работы nForce2 DASP. Такие изменения параметров чипсета необходимы для стабильной работы на высоких частотах и далеко не бесполезны. Например, на тестовой системе энергосберегающий режим Suspend To Ram на частоте 182 МГц работает с CAS Latency 3, а на частоте 183 МГц с CAS Latency 2,5.

Для изучения вопроса с параметрами чипсета использовалась программа WPCREDIT 1.2a , которая позволяет просматривать и изменять конфигурационные регистры PCI устройств.

К сожалению, разобраться без документации в параметрах, относящихся к памяти, затруднительно. Даже при небольшом изменении частоты шины в BIOS содержимое регистров сильно меняется. Что уж говорить о значительных изменениях частоты.


Но оказалось возможным сначала сохранить содержимое регистров на одной частоте, а затем загрузить их на другой. Правда это не относится к устройству с Device ID 01E0, которое, вероятно, отвечает за установку текущей частоты шины. Если попытаться загрузить данные в его регистры, то происходит зависание системы. При загрузке в регистры устройства с Device ID 01EE, вероятно, происходит нарушение работы AGP. В UT2003 появляется мусор из треугольников.

Тем не менее, при загрузке регистров на частоте 200 МГц данными, сохранёнными при 133 МГц, наблюдается стабильное увеличение производительности. Кроме того, было выяснено, что утилита ClockGen при изменении частоты почти не меняет содержимое конфигурационных регистров. Если изменить частоту шины при помощи этой утилиты с первоначальных 133 МГц до 200 МГц, то результаты совпадают с результатами, полученными при загрузке регистров (по тесту 7-zip). Проблем в UT2003 при этом не возникает. Поэтому в дальнейшем использовался только ClockGen и подразумевается, что если написано "параметры от 133 МГц", то это значит, что частота шины была установлена в 133 МГц из BIOS, а затем из Windows увеличена при помощи ClockGen.

Было проведено исследование влияния внутренних параметров чипсета nForce2 на производительность. При частоте шины 200 МГц были использованы параметры чипсета от стандартных частот 200 МГц, 166 МГц, 133 МГц. Параметры чипсета от 100 МГц вызывали зависание. Состав тестовых программ был немного изменён. Вместо ScienceMark 2.0 использовался CacheMem 2.6. Вместо RKC, 7-zip fb=255 и 7-zip fb=64 использовался 7-zip fb=64 с большим размером исходного файла для архивирования.

Итак, результаты:


Вот она, потерянная производительность. Причем, если после перехода с 133 МГц на 166 МГц падение незначительно, то после перехода с 166 МГц на 200 МГц падение достигает 3%. Несмотря на то, что при коэффициенте х9,5 задержки памяти значительно уменьшились, они все равно немного отличаются от задержек при коэффициенте х11: 82,97 нс для х9,5 и 80,28 нс для х11. Полученное значение задержек памяти для х11 совпадает с теоретическим значением 80,67 нс, рассчитанным линейно от 96,89 нс на 166 МГц.

Теперь рассмотрим частоты 180 МГц и 190 МГц, на которых происходит падение. Если использовать конфигурацию 182х11,5 и 190х11, то частота процессора будет совпадать (разница 0,12%), и использование интерполяции не потребуется.


Если просто изменить конфигурацию с 182х11,5 на 190х11 в BIOS, то низкоуровневые характеристики памяти изменяются на 2%, вместо теоретических 4,5%. Скорость 7-zip и UT2003 просто падает (пресловутое падение производительности). Однако, если при 190х11 установить параметры чипсета от 182 МГц, то все становится на свои места. Везде есть прирост. Низкоуровневые характеристики памяти выросли немного больше чем 4,5%. Частично это можно списать на относительно большую для низкоуровневых тестов памяти погрешность.

Совершенно случайно было найдено объяснение особенностям RKC. Если посмотреть на график, то в отличие от 7-zip и UT2003, разница в результатах между х8,5 - х9,5 и х10,5 – х11,5 у него почти отсутствует. Чтобы понять, почему так происходит достаточно взглянуть на таблицу:

Block size 8 Мб, 512 byte stride 200х11, задержки памяти 200х9,5, задержки памяти
cycles нс cycles нс
ScienceMark 2.0 183 82,99 174 91,37
CPU-Z 1.20a 183 82,99 159 83,50

Как видно, ScienceMark 2.0 и CPU-Z 1.20a используют несколько разные алгоритмы для определения задержек. При изменении коэффициента с х11 на х9,5 CPU-Z 1.20a, равно как и RKC, почти не "замечают" разницы. Получается, что ScienceMark 2.0 и CPU-Z 1.20a не отражают реальной картины и их результаты относительны. Вот ScienceMark 2.0 показывает, что задержки сильно изменились, а реальное приложение RKC, чувствительное к задержкам, на это почти не реагирует. И наоборот, CPU-Z 1.20a показывает, что разница небольшая, а результаты 7-zip и UT2003 отличаются значительно. Результаты CacheMem 2.6 совпадают с результатами ScienceMark 2.0. Назвать какую-либо программу "неправильной" нельзя. Они просто измеряют задержки по-разному.

Попытки объяснения недоступности некоторых коэффициентов и низкой производительности при х8,5 и х9,5 путём изменения параметров чипсета ни к чему не привели. Возможно, это связано с некоторыми регистрами устройства с Device ID 01E0. Значения этих регистров просто не поддавались корректировке.

Насколько результаты исследования можно распространять на другие материнские платы nForce2?

Если взять две материнские платы разных производителей на одном и том же чипсете, то при одинаковой конфигурации они должны показывать идентичные результаты. Ведь собственно сам чипсет – это тот же процессор (набор контроллеров) и работает синхронно с задающим генератором. В отличие от центрального процессора, чипсет имеет большое количество настраиваемых параметров. Эти параметры определяются разработчиком чипсета. Значения этих параметров, обеспечивающие стабильную работу с максимальной производительностью, могут зависеть не только от конфигурации, но и от конкретного экземпляра. Учитывая, что для разработчиков более важной является стабильность, рекомендованные значения параметров чипсета стараются брать с запасом, чтобы гарантировать устойчивую работу даже при неблагоприятных условиях. В большинстве случаев, можно безболезненно изменять некоторые параметры в сторону увеличения производительности.

Несмотря на отсутствие документации, можно утверждать, что изменение параметров, вызывающее провал производительности на 183 МГц, является рекомендованным разработчиком чипсета nForce2. В пользу этого говорит и то, что такой провал есть на одной из первых плат на nForce2 ASUS A7N8X (напомню, A7N8X-X является его урезанной версией), которая создавалась в плотном сотрудничестве с nVidia. Да и "притормаживать" свою продукцию производители вряд ли догадались самостоятельно. Кроме того, падение на 183 МГц точно есть на плате Soltek 75FRN-L, и было впервые обнаружено именно на ней. Но в конечном итоге, все зависит только от производителя, конкретной модели платы и даже версии BIOS.

Для изучения этого вопроса было проведено небольшое исследование обзоров материнских плат на nForce2. При этом был учтен момент с завышением реальных частот и соответственно завышением результатов некоторыми непорядочными производителями. Именно о непорядочности говорит такой факт, что сам nForce2 имеет встроенный генератор частоты, и поэтому на всех материнских платах на этом чипсете частоты должны точно совпадать. Например, по данным www.anandtech.com плата Gigabyte 7NNXP имеет частоту 202,77 МГц, DFI NFII Ultra LANParty – 201,35 МГц вместо положенных 200 МГц или 200,5 МГц (200,5 МГц является типовой частотой на других платах nForce2). А это уже около 1%.

Из немногочисленных обзоров был выбран http://www.3dnews.ru/motherboard/nforce2u400-roundup . К сожалению, в нём не указаны реальные частоты. Если отбросить результаты Gigabyte 7NNXP, MSI K7N2 Delta, Acorp 7NFU400, то получится следующая картина. Все платы идут очень кучно и немного отстают от Epox 8RDA+. Причем приблизительно разница получается для Sandra2002 Int MEM - 5%, для Quake III - 3%. На основании этого можно сделать предположение, что на большинстве плат на частоте 200 МГц используются более медленные параметры чипсета, а на Epox 8RDA+ более быстрые. Возможно это совпадение, и объясняется отклонениями частоты шины, но больно хорошо это согласуется с полученными выше результатами. Кроме того, в конференции kv0 пишет, что на Epox 8RDA "увеличение fsb с 166 до 198 МГц приводило к линейному росту производительности без каких-либо скачков".

Таким образом, с большой долей уверенности, можно предположить, что на большинстве материнских плат падение производительности и описанный характер этого падения существует. В том числе и на таких платах как Abit NF7-S rev2.0, Epox 8RDA3+, Gigabyte 7N400. На Epox 8RDA+ падения нет, но для обычного пользователя это скорее минус, т.к. стабильность на высоких частотах снижена.

Итоги.

Материнская плата ASUS A7N8X-X обладает некоторыми "особенностями". Не всегда можно изменить параметр CAS Latency. После частоты шины 182 МГц не работают некоторые коэффициенты умножения процессора. При разных коэффициентах производительность может отличаться. Сильно ругать A7N8X-X нельзя, у других материнских плат "особенностей" тоже хватает.

Наибольшее влияние на производительность памяти оказывают параметры RAS to CAS Latency и CAS Latency. Причем, вопреки все ещё бытующему мнению, RAS to CAS Latency имеет большее значение, чем CAS Latency (это справедливо для DDR SDRAM). Оптимальное значение Active Precharge Delay вычисляется как RAS to CAS Latency + CAS latency + 2. Использование минимальных значений является распространённой ошибкой и вызывает падение производительности до 1%.

На большинстве материнских плат nForce2 на частоте шины 183 МГц наступает значительный провал в производительности. Только где-то на 200 МГц производительность достигает уровня 182 МГц. Это происходит из-за изменения параметров чипсета nForce2 и необходимо для стабильной работы на высоких частотах.

Если на частоте шины 200 МГц установить параметры чипсета от 133 МГц, то можно получить прирост производительности (на ASUS A7N8X-X - порядка 3%) за счет некоторого уменьшения стабильности. Это легко проделать, установив в BIOS частоту шины 133 МГц и, затем, увеличив частоту шины из Windows при помощи утилиты ClockGen до 200 МГц. Но не стоит забывать, что после выхода из режимов энергосбережения параметры чипсета будут восстановлены.

Enot
09/03/2004

У этой статьи есть продолжение "Немного о DDR SDRAM и параметре tRAS ".

  • Распродажа Gigabyte GTX 980 - в два раза дешевле чем другие!
  • FSB - наверняка, многие пользователи не раз слышали о таком компьютерном термине. Это название носит один из важнейших компонентов материнской платы – системная шина.

    Как известно, сердцем любого персонального компьютера является центральный процессор. Но не только процессор определяет архитектуру ПК. Она также во многом зависит и от используемого на материнской плате набора вспомогательных микросхем (чипсета). Кроме того, процессор не может функционировать и без внутренних шин, представляющих собой набор сигнальных проводников на системной плате. В функции шин входит передача информации между различными устройствами компьютера и центральным процессором. Характеристики внутренних шин, в частности, их пропускная способность и частота во многом определяют и характеристики самого компьютера.

    Пожалуй, наиболее важной из шин, от которой больше всего зависит производительность компьютера, является шина FSB. Аббревиатура FSB расшифровывается как Front Side Bus, что можно перевести как «передняя» шина. В основные функции шины входит передача данных между процессором и чипсетом. Точнее говоря, FSB располагается между процессором и микросхемой «северного моста» материнской платы, где находится контроллер оперативной памяти.

    Связь же между северным мостом и другой важной микросхемой чипсета, называемой «южным мостом» и содержащей контроллеры устройств ввода-вывода, в современных компьютерах обычно осуществляется при помощи другой шины, которая носит наименование Direct Media Interface.

    Как правило, процессор и шина имеют одну и ту же базовую частоту, которая называется опорной или реальной. В случае процессора его конечная частота определяется произведением опорной частоты на определенный множитель. Вообще говоря, реальная частота FSB обычно является основной частотой материнской платы, при помощи которой определяются рабочие частоты всех остальных устройств.

    В большинстве старых компьютеров реальная частота системной шины определяла и частоту оперативной памяти, однако сейчас память часто может иметь и другую частоту – в том случае, если контроллер памяти располагается в самом процессоре. Кроме того, следует иметь в виду, что реальная частота шины не эквивалентна ее эффективной частоте, которая определяется количеством передаваемых бит информации в секунду.

    В настоящее время данная шина считается устаревшей и постепенно заменяется более новыми – QuickPath и HyperTransport. Системная шина QuickPath является разработкой фирмы Intel, а HyperTransport – компании AMD.

    Front Side Bus в традиционной архитектуре чипсета

    QuickPath

    Шина QuickPath Interconnect (QPI) была разработана Intel в 2008 г. для замены традиционной шины FSB. Первоначально QPI использовалась в компьютерах на основе процессоров Xeon и Itanium. Разработка QPI была призвана бросить вызов уже использовавшейся в течение некоторого времени в чипсетах AMD шине Hypertransport.

    Хотя QPI принято называть шиной, тем не менее, ее свойства существенно отличаются от свойств традиционной системной шины, и по своему устройству она представляет собой проводное соединение типа interconnect. QPI является неотъемлемой частью технологии, которую Intel называет архитектурой QuickPath. Всего QPI имеет в своем составе 20 линий данных, а общее количество проводников шины QPI равно 84. Как и Hypertransport, технология QuickPath подразумевает, что контроллер памяти встроен в сам центральный процессор, поэтому она используется лишь для связи процессора с контроллером ввода-вывода. Шина QuickPath может работать на частотах в 2.4, 2.93, 3.2, 4.0 или 4.8 ГГц.

    Схема расположения QuickPath Interconnect

    Hypertransport

    Шина Hypertransport является разработкой AMD. Hypertransport имеет рабочие характеристики, сближающие ее с шиной QuickPath, но при этом она была создана на несколько лет раньше последней. Шину отличают оригинальные архитектура и топология, совершенно непохожие на архитектуру и топологию FSB. В основе шины Hypertransport лежат такие составные элементы, как тоннели, мосты, линки и цепи. Архитектура шины призвана исключить узкие места в схеме соединений между отдельными устройствами материнской платы и передавать информацию с высокой скоростью и небольшим количеством задержек.

    Существует несколько версий Hypertransport, работающих на разной тактовой частоте – от 200 МГц до 3,2 ГГц. Максимальная пропускная способность шины для версии 3.1 составляет более 51 ГБ/с (в обоих направлениях). Шина используется как для замены шины FSB в однопроцессорных системах, так и в качестве основной шины в многопроцессорных компьютерах.

    Схема расположения шины Hypertransport

    Direct Media Interface

    Пару слов стоит сказать и о такой разновидности системной шины, как Direct Media Interface (DMI). DMI предназначена для соединения между двумя основными микросхемами чипсета – северным и южным мостами. Впервые шина типа DMI была использована в чипсетах Intel в 2004 г.

    Шина DMI имеет свойства архитектуры, объединяющие ее с такой шиной для подключения периферийных устройств, как PCI Express. В частности, DMI использует линии с последовательной передачей данных, а также имеет отдельные проводники для передачи и приема данных.

    Место DMI (обозначена красным) в архитектуре компьютера.

    Оригинальная реализация DMI обеспечивала передачу данных до 10 ГБит/c в каждом направлении. Современная же версия шины, DMI 2.0, может поддерживать скорость в 20 ГБ/c в обоих направлениях. Многие мобильные версии DMI имеют вдвое меньшее количество сигнальных линий по сравнению с версиями DMI для настольных систем.

    Заключение

    Системная шина является своеобразной кровеносной «артерией» любого компьютера, обеспечивающей передачу данных от «сердца» материнской платы – процессора к остальным микросхемам материнской платы и, прежде всего, к северному мосту, управляющем работой оперативной памяти. В настоящее время в различных архитектурах материнских плат можно встретить как традиционную шину FSB, так и имеющие сложные топологии высокоэффективные шины Hypertransport и QPI. Характеристики, производительность и архитектура системной шины являются важными факторами, которые определяют потенциальные возможности компьютера.