Rtl iol что это
Разгон оперативной памяти DDR4 на AMD Ryzen и Intel Core
На github.com кто-то заморочился и сделал полноценный гайд по разгону оперативной памяти DDR4 на Intel и AMD Ryzen. А в качестве базовой информации в дополнении к нашему видео он будет полезен каждому.
Делимся переводом, приятного прочтения.
Содержание
Подготовка
Ожидания и ограничения
В этом разделе рассматриваются 3 компонента, влияющие на процесс разгона: микросхемы (чипы памяти), материнская плата и встроенный контроллер памяти (IMC).
Материнская плата
Замечено также, что дешёвые материнские платы могут не разогнаться, возможно по причине низкого качества печатной платы и недостаточного количества слоёв (?).
Микросхемы (чипы памяти)
Отчёты Thaiphoon Burner
По общему мнению, свои отбракованные низкосортные чипы Micron реализует под брендом SpecTek. Многие стали называть этот чип “Micron E-die” или даже просто “E-die”. Если в первом случае ещё куда ни шло, то во втором уже возникает путаница, поскольку подобная маркировка («буква-die») используется у микросхем Samsung, например – “4 Гб Samsung E-die”. Под “E-die” обычно подразумевается чип Samsung, поэтому стоит уточнять производителя, говоря о чипах Micron Rev. E как об “E-die”.
Масштабирование напряжения попросту означает, как чип реагирует на изменение напряжения. Во многих микросхемах tCL масштабируется с напряжением, что означает, что увеличение напряжения может позволить вам снизить tCL. В то время как tRCD и tRP на большинстве микросхем, как правило, не масштабируются с напряжением, а это означает, что независимо от того, какое напряжение вы подаёте, эти тайминги не меняются. Насколько я знаю, tCL, tRCD, tRP и, возможно, tRFC могут (либо не могут) видеть масштабирование напряжения. Аналогичным образом, если тайминг масштабируется с напряжением, это означает, что вы можете увеличить напряжение, чтобы соответствующий тайминг работал на более высокой частоте.
Масштабирование напряжения CL11
На графике видно, что tCL у CJR 8 Гб масштабируется с напряжением почти ровно до 2533 МГц. У B-die мы видим идеально-ровное масштабирование tCL с напряжением.
Некоторые старые чипы Micron (до Rev. E) известны своим отрицательным масштабированием с напряжением. То есть при повышении напряжения (как правило, выше 1,35 В) они становятся нестабильными на тех же таймингах и частоте. Ниже приведена таблица некоторых популярных чипов, показывающая, какие тайминги в них масштабируются с напряжением, а какие нет:
Чип | tCL | tRCD | tRP | tRFC |
8 Гб AFR | Да | Нет | Нет | ? |
8 Гб CJR | Да | Нет | Нет | Да |
8 Гб Rev. E | Да | Нет | Да | ? |
8 Гб B-die | Да | Да | Да | Да |
Тайминги, которые не масштабируются с напряжением, как правило необходимо увеличивать с частотой. Масштабирование напряжения tRFC у B-die.
Примечание: Шкала tRFC в тактах (тиках), не во времени (нс).
Ожидаемая максимальная частота
Ниже приведена таблица предполагаемых максимальных частот некоторых популярных чипов:
Чип | Ожидаемая максимальная частота (МГц) |
8 Гб AFR | 3600 |
8 Гб CJR | 4000* |
8 Гб Rev. E | 4000+ |
8 Гб B-die | 4000+ |
* – результаты тестирования CJR у меня получились несколько противоречивыми. Я тестировал 3 одинаковых планки RipJaws V 3600 CL19 8 Гб. Одна из них работала на частоте 3600 МГц, другая – на 3800 МГц, а последняя смогла работать на 4000 МГц. Тестирование проводилось на CL16 с 1,45 В.
Не ждите, что одинаковые, но разнородные по качеству, чипы производителя одинаково хорошо разгонятся. Это особенно справедливо для B-die.
Суть биннинга заключается в разделении производителем полученной на выходе продукции «по сортам», качеству. Как правило, сортировка производится по демонстрируемой при тестировании частоте.
Чипы, показывающие одну частоту, производитель отделяет в одну «коробку», другую частоту – в другую «коробку». Отсюда и название процедуры – “binning” (bin – ящик, коробка).
B-die из коробки «2400 15-15-15» намного хуже чем из коробки «3200 14-14-14» или даже из «3000 14-14-14». Так что не ждите, что третьесортный B-die даст образцовые показатели масштабирования напряжения.
Чтобы выяснить, какой из одинаковых чипов обладает лучшими характеристиками на одном и том же напряжении, нужно найти немасштабируемый с напряжением тайминг.
Просто разделите частоту на этот тайминг, и чем выше значение, тем выше качество чипа. Например, Crucial Ballistix 3000 15-16-16 и 3200 16-18-18 оба на чипах Micron Rev. E. Если мы разделим частоту на масштабируемый с напряжением тайминг tCL, мы получим одинаковое значение (200). Значит ли это, что обе планки – одного сорта? Нет.
А вот tRCD не масштабируется с напряжением, значит его необходимо увеличивать по мере увеличения частоты. 3000/16 = 187,5 против 3200/18 = 177,78.
Как видите, 3000 15-16-16 более качественный чип, нежели 3200 16-18-18. Это означает, что чипы 3000 15-16-16 очевидно смогут работать и как 3200 16-18-18, а вот смогут ли 3200 16-18-18 работать как 3000 15-16-16 – не факт. В этом примере разница в частоте и таймингах невелика, так что разгон этих планок будет, скорее всего, очень похожим.
Максимальное рекомендованное повседневное напряжение
Спецификация JEDEC указывает (стр. 174), что абсолютный максимум составляет 1,50 В
Напряжения, превышающие приведенные в разделе «Абсолютные максимальные значения», могут привести к выходу устройства из строя. Это только номинальная нагрузка, и функциональная работа устройства при этих или любых других условиях выше тех, которые указаны в соответствующих разделах данной спецификации, не подразумевается. Воздействие абсолютных максимальных номинальных значений в течение длительного периода может повлиять на надежность.
Я бы советовал использовать 1,5 В только на B-die, поскольку известно, что он выдерживает высокое напряжение. Во всяком случае, у большинства популярных чипов (4/8 Гб AFR, 8 Гб CJR, 8 Гб Rev. E, 4/8 Гб MFR) максимальное рекомендуемое напряжение составляет 1,45 В. Сообщалось, что некоторые из менее известных чипов, таких как 8 Гб C-die, имеют отрицательное масштабирование или даже сгорают при напряжении выше 1,20 В. Впрочем, решать вам.
Ниже показано, как самые распространенные чипы ранжируются с точки зрения частоты и таймингов.
Встроенный контроллер памяти (IMC)
IMC от Intel достаточно устойчивый, поэтому при разгоне он не должен быть узким местом. Ну а чего ещё ждать от 14+++++ нм?
Для разгона RAM необходимо изменить два напряжения: System Agent (VCCSA) и IO (VCCIO). Не оставляйте их в режиме “Auto”, так как они могут подать опасные уровни напряжения на IMC, что может ухудшить его работу или даже спалить его. Большую часть времени можно держать VCCSA и VCCIO одинаковыми, но иногда перенапряжение может нанести ущерб стабильности, что видно из скриншота:
предоставлено: Silent_Scone.
Я не рекомендовал бы подниматься выше 1,25 В на обоих.
Ниже – предлагаемые мной значения VCCSA и VCCIO для двух одноранговых модулей DIMM:
Частота (МГц) | VCCSA/VCCIO (В) |
3000-3600 | 1,10 – 1,15 |
3600-4000 | 1,15 – 1,20 |
4000+ | 1,20 – 1,25 |
Если модулей больше, и/или используются двуранговые модули, то может потребоваться более высокое напряжение VCCSA и VCCIO.
tRCD и tRP взаимосвязаны, то есть, если вы установите tRCD на 16, а tRP на 17, то оба будут работать с более высоким таймингом (17). Это ограничение объясняет, почему многие чипы работают не очень хорошо на Intel и почему для Intel лучше подходит B-die.
В UEFI Asrock и EVGA оба тайминга объединены в tRCDtRP. В UEFI ASUS tRP скрыт. В UEFI MSI и Gigabyte tRCD и tRP видны, но попытка установить для них разные значения приведет просто к установке более высокого значения для обоих.
Ожидаемый диапазон латентности памяти: 40-50 нс.
В Ryzen 1000 и 2000 IMC несколько привередлив к разгону и может не дать столь же высоких частот, как Intel. IMC Ryzen 3000 намного лучше и более-менее наравне с Intel.
SoC voltage – это напряжение для IMC, и, как и в случае с Intel, не рекомендуется оставлять его в “Auto” режиме. Тут достаточно 1,0 – 1,1 В, поднимать выше смысла нет.
На Ryzen 2000 (а возможно и на 1000 и 3000), вольтаж выше 1,15 В может отрицательно повлиять на разгон.
«На разных процессорах контроллер памяти ведет себя по-разному. Большинство процессоров будут работать на частоте 3466 МГц и выше при напряжении SoC 1,05 В, однако разница заключается в том, как разные процессоры реагируют на напряжение. Одни выглядят масштабируемыми с повышенным напряжением SoC, в то время как другие просто отказываются масштабироваться или вовсе демонстрируют отрицательное масштабирование. Все протестированные экземпляры демонстрировали отрицательное масштабирование при использовании SoC более 1,15 В. Во всех случаях максимальная частота памяти была достигнута при напряжении SoC = GDM вкл CR 1T > GDM откл CR 2T.
У процессоров Ryzen 3000 с одним CCD (процессоры серий ниже 3900X) пропускная способность записи вдвое меньше.
«В пропускной способности памяти мы видим нечто странное: скорость записи у AMD 3700X – у которого скорость записи благодаря соединению кристаллов CDD и IOD составляет 16 байт/такт – вдвое меньше, чем у 3900X. AMD заявляет, что это позволяет экономить электроэнергию, снизить нагрев процессора (TDP), к чему так стремится AMD. AMD говорит, что приложения редко делают чистые операции записи, но в одном из наших тестов на следующей странице мы увидим, как это ухудшило производительность 3700X.»
Ryzen | Латентность (нс) |
1000 | 65-75 |
2000 | 60-70 |
3000 | 65-75 (1:1 MCLK:FCLK) 75+ (2:1 MCLK:FCLK) |
Достаточно высокий FCLK у Ryzen 3000 может компенсировать потери от десинхронизации MCLK и FCLK, при условии, что вы можете назначить MCLK для UCLK.
Разгон
Дисклеймер: потенциал разгона сильно зависит от «кремниевой лотереи» (чип чипу рознь), поэтому могут быть некоторые отклонения от моих предложений.
Процесс разгона достаточно прост и выполняется в 3 шага:
Нахождение максимальной частот
На AMD начинать нужно с 1.10 В SoC. Напряжение SoC может называться по-разному в зависимости от производителя.
Обратите внимание, что это добавочное напряжение. Базовое напряжение изменяется автоматически при увеличении частоты DRAM. Напряжение 0,10 В на частоте 3000 МГц может привести к фактическому напряжению 1,10 В, а 0,10 В на частоте 3400 МГц приводит уже к фактическому напряжению 1,20 В. MSI: CPU NB/SOC.
2. Установите напряжение DRAM 1,4 В. Для планок на чипах Micron/SpecTek (за исключением Rev. E) следует установить 1,35 В.
3. Выставите основные тайминги следующим образом: 16-20-20-40 (tCL-tRCD-tRP-tRAS). Подробнее об этих таймингах читайте тут (на англ.)
4. Постепенно увеличивайте частоту DRAM до тех пор, пока Windows не откажет. Помните об ожидаемых максимальных частотах, упомянутых выше. На Intel, быстрый способ узнать, нестабильны ли вы, это следить за значениями RTL и IOL. Каждая группа RTL и IOL соответствует каналу. В каждой группе есть 2 значения, которые соответствуют каждому DIMM. Используйте Asrock Timing Configurator. Поскольку у меня обе планки стоят во вторых слотах каждого канала, мне нужно посмотреть на D1 в каждой группе RTL и IOL. Значения RTL у планок не должны разниться между собой более чем на 2, а значения IOL более чем на 1.
В моём случае, RTL разнятся ровно на 2 (53 и 55), а значения IOL не разнятся вовсе (7 у обоих планок). Все значения в пределах допустимых диапазонов, однако имейте в виду, что это ещё не значит, что всё действительно стабильно.
На Ryzen 3000 – убедитесь, что частота Infinity Fabric (FCLK) установлена равной половине вашей действующей частоты DRAM.
5. Запустите тест памяти на свой выбор.
6. При зависании/краше/BSOD, верните частоту DRAM на ступень ниже и повторите тестирование.
7. Сохраните ваш профиль разгона в UEFI.
8. Теперь вы можете либо попытаться перейти на ещё более высокую частоту, либо начать подтягивать тайминги. Ее забывайте об ожидаемых максимальных частотах, о которых мы говорили ранее. Если вы достигли пределов возможностей чипа и/или IMC, то самое время заняться оптимизацией таймингов.
Пробуем повысить частоты
2. Увеличьте основные тайминги до 18-22-22-42.
3. Повысьте вольтаж DRAM до 1,45 В.
4. Выполните шаги 4-7 из раздела «Нахождение максимальной частоты».
5. Выполните оптимизацию («подтягивание») таймингов.
Дополнительно: Тайминги и частота — разрушаем мифы
Оптимизация таймингов
Обязательно после каждого изменения запускайте тест памяти и бенчмарк-тест, чтобы убедиться в повышении производительности.
На процессорах Ryzen 3000 с одним CCD пропускная способность записи должна составлять 90-95% от половины теоретической максимальной пропускной способности. Можно достичь половины теоретической максимальной пропускной способности записи. См. здесь (англ.)
2. Я бы рекомендовал для начала подтянуть некоторые второстепенные тайминги в соответствии с таблицей ниже, поскольку они могут ускорить тестирование памяти.
Тайминги | Надёжно (Safe) | Оптимально (Tight) | Предельно (Extreme) |
tRRDS tRRDL tFAW | 6 6 24 | 4 6 16 | 4 4 16 |
tWR | 16 | 12 | 10 |
3. Далее идут основные тайминги (tCL, tRCD, tRP).
4. Далее идёт tRFC. По умолчанию для чипов 8 Гб установлено значение 350 нс (обратите внимание на единицу измерения).
Ниже приведена таблица типичных значений tRFC в нс для наиболее распространенных чипов:
Чип | tRFC (нс) |
8 Гб AFR | 260-280 |
8 Гб CJR | 260-280 |
8 Гб Rev. E | 300-350 |
8 Гб B-die | 160-180 |
5. Оставшиеся второстепенные тайминги я предлагаю выставить следующим образом:
Тайминг | Надёжно (Safe) | Оптимально (Tight) | Предельно (Extreme) |
tWTRS tWTRL | 4 12 | 4 8 | — |
tRTP | 12 | 10 | 8 |
tCWL | tCL | tCL-1 | tCL-2 |
На Intel значения таймингов tWTRS/L следует сначала оставить в “Auto”, изменяя вместо них значения tWRRD_dg/sg соответственно. Уменьшение tWRRD_dg на 1 приведет к уменьшению tWTRS на 1. Аналогично с tWRRD_sg. Как только они достигнут минимума, вручную установите tWTRS/L.
6. Третьестепенные тайминги:
Пользователям AMD будет полезен этот текст (англ.)
Тайминг | Надёжно (Safe) | Оптимально (Tight) | Предельно (Extreme) |
tRDRDSCL tWRWRSCL | 4 4 | 3 3 | 2 2 |
Пользователям Intel следует настраивать третьестепенные тайминги группой за раз, как видно из таблицы предлагаемых мной значений.
А тут тайминги на B-die, к сведению.
tREFI – это тоже тайминг, позволяющий повысит ьпроизводительность. В отличие от всех других таймингов, чем выше его значение – тем лучше.
Не стоит слишком увлекаться им, поскольку перепады температур окружающей среды (например, зима-лето) могут быть достаточными для возникновения нестабильности.
7. Также можно увеличить напряжение DRAM, чтобы ещё больше снизить тайминги. Вспомните про масштабирование напряжения чипов и максимальное рекомендованное повседневное напряжение, о чём мы говорили выше.
Дополнительно: Настройка таймингов DRAM на ASUS ROG MAXIMUS XI APEX
Дополнительные советы
Увеличение CLDO_VDDP похоже влияет положительно на частотах выше 3600 МГц, так как, по-видимому, улучшается гибкость и, следовательно, становится меньше ошибок.
Также будет интересно:
DDR4 и Ryzen. Нюансы настройки и разгона памяти на платформе AMD AM4
Терминология
Ниже приведен список технических терминов, относящихся к разгону памяти с процессором Ryzen. Последний использует стандартную архитектуру памяти DDR4, поэтому вы можете быть знакомы с некоторыми из этих терминов. Некоторые другие термины являются новыми и характерными для UEFI материнских плат платформы AM4.
SOC Voltage — напряжение контроллера памяти. Предел 1,2 В.
DRAM Boot Voltage — напряжение, на котором происходит тренировка памяти при запуске системы. Лимит: до 1,45–1,50 В.
VDDP Voltage — это напряжение для транзистора, который конфигурирует содержимое оперативной памяти. Лимит: до 1,1 В.
VPP (VPPM) Voltage — напряжение, которое определяет надежность доступа к строке DRAM.
CLDO_VDDP Voltage — напряжение для DDR4 PHY на SoC. DDR4 PHY, или интерфейс физического уровня DDR4, преобразует информацию, которая поступает из контроллера памяти в формат, понятный модулям памяти DDR4.
Несколько нелогично, что снижение CLDO_VDDP часто может быть более выгодным для стабильности, чем повышение. Опытные оверклокеры также должны знать, что изменение CLDO_VDDP может сдвинуть или устранить дыры в памяти. Небольшие изменения в CLDO_VDDP могут иметь большой эффект, и для CLDO_VDDP нельзя установить значение, превышающее VDIMM –0,1 В. Tсли вы измените это напряжение, то потребуется холодная перезагрузка. Лимит: 1,05 В.
Vref Voltage — источник опорного напряжения оперативной памяти. «Настройка» взаимосвязи контроллера памяти и модуля памяти в зависимости от уровня напряжения, которое рассматривается как «0» или «1»; то есть напряжения, найденные на шине памяти ниже MEMVREF, должны рассматриваться как «0», а напряжения выше этого уровня должны считаться «1». По умолчанию этот уровень напряжения составляет половину VDDIO (около 0,500x). Некоторые материнские платы позволяют пользователю изменять это соотношение, обычно двумя способами: (1) «DRAM Ctrl Ref Voltage» (для линий управления с шины памяти; официальное название JEDEC для этого напряжения — VREFCA) и (2) «DRAM Ctrl Data Ref Voltage» (для строк данных с шины памяти; официальное название JEDEC — VREFDQ). Эти параметры настроены как множитель.
VTT DDR Voltage — напряжение, используемое для управления сопротивлением шины, чтобы достигнуть высокой скорости и поддержать целостность сигнала. Это осуществляется с помощью резистора параллельного прерывания.
PLL Voltage — определяет напряжение питания системы Фазовой АвтоПодстройки Частоты (ФАПЧ или PLL — Phase Locked Loop) и является актуальной лишь для повышения стабильности во время разгона системы с помощью BCLK. Лимит: 1,9 В.
CAD_BUS — САПР командной и адресной шины. Для тех, кто может тренировать память на высоких частотах (>=3466 МГц), но не может стабилизировать ее из-за проблем с сигнализацией. Я предлагаю вам попробовать уменьшить токи привода, связанные с «Командой и адресом» (увеличив сопротивление).
CAD_BUS Timings — задержка трансивера. Значения являются битовой маской (грубой / точной задержки). Аналог RTL/IOL в исполнении AMD. Имеют огромное влияние на тренировку памяти.
procODT — значение сопротивления, в омах, который определяет, как завершенный сигнал памяти терминируется. Более высокие значения могут помочь стабилизировать более высокие скорости передачи данных. Ограничение: нет.
RTT (время приема-передачи) — это время, затраченное на отправку сигнала, плюс время, которое требуется для подтверждения, что сигнал был получен. Это время задержки, следовательно, состоит из времени передачи сигнала между двумя точками. Настройка, которая отвечает за оптимизацию целостности сигнала. DRAM предлагает диапазон значений сопротивления нагрузки. Конкретное сопротивление приемника выводов DQ, представленное интерфейсу, выбирается комбинацией начальной конфигурации микросхемы и рабочей команды DRAM, если включено динамическое завершение на кристалле.
Geardown Mode — позволяет памяти уменьшать эффективную скорость передачи данных на шинах команд и адресов.
Power Down Mode — может незначительно экономить энергию системы за счет более высокой задержки DRAM, переводя DRAM в состояние покоя после периода бездействия.
BankGroupSwap (BGS) — настройка, которая изменяет способ назначения приложениям физических адресов в модулях памяти. Цель этого регулятора — оптимизировать выполнение запросов к памяти, учитывая архитектуру DRAM и тайминги памяти. Теория гласит, что переключение этого параметра может сместить баланс производительности в пользу игр или синтетических приложений.
Игры получают ускорение при отключенной BGS, а пропускная способность памяти AIDA64 была выше при включенной BGS.
Алгоритм настройки системы
Инструмент, который будет нам помогать с рекомендациями — DRAM Calculator for Ryzen. Самый главный, фундаментальный шаг — это запуск системы на определенной частоте, которую мы хотим получить. Для этого нам потребуется вручную установить такие настройки в UEFI: профиль XMP памяти (он может называться по-разному, смысл от этого не меняется), частоту для оперативной памяти (которую мы хотим получить), установить частоту BCLK (если присутствует такая настройка в прошивке), тайминги (которые рекомендует калькулятор), напряжение для SOC и DRAM (рекомендации калькулятора) и procODT + RTT (NOM, WR и PARK). Не забывайте про важный нюанс, что материнская плата или оперативная память может не справиться с вашими амбициями, потому советую посетить страницу поддержки вашей материнской платы и посмотреть QVL-список, в котором будут указаны частоты, на которых плата в заводских условиях функционировала без ошибок. Эта частота и будет нашей отправной точкой. Зачастую это 3000–3200 МГц.
Параметры procODT + RTT (NOM, WR и PARK) мы будем подбирать так, чтоб система имела минимальное кол-во ошибок. Тестовый пакет TM5 0.12 (Basic Preset). Безусловно, от всех ошибок мы не сможем избавиться, и для этого нам нужен будет следующий шаг.
Цель следующего шага — поиск самого оптимального напряжения для DRAM и SOC, при которых система будет иметь минимальное кол-во ошибок. Сначала подбираем напряжение для SOC, а затем для DRAM (калькулятор вам подскажет диапазон). Для отлова ошибок используем тестовый пакет TM5 0.12 (Basic Preset).
В половине случаев вы можете на данном этапе получить полностью стабильную систему. Если тестовый пакет TM5 0.12 не находит ошибок, то вы должны увеличить спектр тестовых программ для проверки стабильности. Вы можете использовать LinX, HCI, Karhu, MEMbench и другие программы. В случае если вышеописанные утилиты нашли ошибку, то вам стоит перейти к следующему шагу, отладочному.
На отладочном шаге главная цель — это изменение определенных таймингов, указанные на иллюстрации ниже.
На данном этапе вы должны проверить по очереди влияние каждого тайминга на стабильность системы. Примечание: я не рекомендую изменять все задержки сразу, постарайтесь набраться терпения. Если тестируемый тайминг никак не улучшает ситуацию, мы его возвращаем на место и проверяем по списку следующую задержку.
На этом шаге основной инструктаж по отладке системы для простых пользователей заканчивается. Дальнейшие шаги я могу посоветовать более опытным оверклокерам, которые знакомы с разгоном достаточно давно.
Тонкая настройка CAD_BUS
и корректировка дополнительных напряжений.
На каждой иллюстрации присутствуют списки параметров, которые мы используем или изменяем. Эти списки я сформировал так, чтобы более приоритетные настройки, которые могут помочь улучшить стабильность, вы проверили первыми. Безусловно, вы можете пойти своей дорогой, четких правил и закономерностей нет.