Teamredminer gpu 1 detected dead have os что делать
TRM crash with 2 cards; GPU detected DEAD will execute restart script watchdog.bat #292
Comments
DoruSonic commented Apr 19, 2021
I have 2 cards. A 5700xt and a 570. I’ve had the 5700 for a few weeks and I got some stable settings, I then bought a 570 and its making the 5700 crash.
I’ve also found something weird is both can’t be mining unless I run the «windows_tdr_fix» again. If I start mining with the 570 and then start the 5700, the later crashes immediately. If I start the 5700 and then the 570, the 5700 also crashes immediately. The only way I managed to get both running is starting the 5700, launch the «windows_tdr_fix» and then the 570.
This would lead me to believe it’s the 570 fault, but its the 5700 that crashes so I’m not sure who is the culprit. I tried less aggressive OC on both cards to be on the safe side and still nothing.
I’m on Windows 10, both cards on risers, both with good thermals. PSU is 750W and they are using around 320W on the wall
The text was updated successfully, but these errors were encountered:
pdieppa commented Apr 22, 2021
I know it will sound like starting over, but you kind of have to.
What I would do is to set both cards to their default settings to see if they can mine successfully without making any changes to the memory or gpu. The only thing I would recommend at first is to limit the power on the cards so they don’t go crazy in the wattage.
Once you know they are both mining, then start making small changes to 1 of them until you get the power to hashrate ratio you are looking for. The 5700XT should be about 85 to 90 watts and about 55mh. Sorry I don’t know anything about the 570.
Once the 5700XT is all set, the do the same with the 570.
This is the content of the windows_tdr_fix.
Windows Registry Editor Version 5.00
[HKEY_LOCAL_MACHINE\SYSTEM\CurrentControlSet\Control\GraphicsDrivers]
«TdrDelay»=dword:00000014
«TdrDdiDelay»=dword:0000000a
Check the registry before and after running TRM to see if it is changing.
BTW, sometimes is a good idea to reboot the whole system after a crash.
Good luck
GuillermoGaete commented Apr 25, 2021
I have the exact same problem with my miner.
I get that error and the miner restarts. I already tried with other risers, in other pcie.
Motherboard B250-FinTech-CF Gigabyte
Celeron (R) CPU G3900 @ 2.80GHz
Disk: 240GB SSD
I have 5 RX580s and the rig is only stable with 2. It should be noted that the error is always on the same GPU.
Устранение ошибок при майнинге, связанных с неверной установкой или конфигурированием видеокарт
При настройке и эксплуатации оборудования для майнинга часто возникают различные ошибки.
В данной статье рассматриваются характерные ошибки, возникающие при майнинге при неверной сборке майнинг ферм или в связи с программными ошибками.
Аппаратные ошибки, приводящие к неверной работе или отсутствии видеокарт в диспетчере задач
На аппаратном уровне к ошибкам в определении видеокарт или к постоянному их вылету при работе приводят некоторые часто встречающиеся проблемы. К ним относятся:
Во всех случаях, связанных с поиском неисправностей в работе электро и радиоаппаратуры и вычислительной техники нужно помнить, что:
ОСНОВНЫМИ ПРИЧИНАМИ НЕИСПРАВНОСТЕЙ В ЛЮБЫХ ЭЛЕКТРИЧЕСКИХ УСТРОЙСТВАХ ЯВЛЯЮТСЯ НАЛИЧИЕ ЛИШНИХ ИЛИ ОТСУТСТВИЕ НУЖНЫХ КОНТАКТОВ.
Программные ошибки, связанные с видеокартами, приводящие к сбоям майнеров
При неверной настройке операционной системы, сбое в установке драйверов, неправильной конфигурации майнеров, избыточном разгоне возникают ошибки, в результате которых происходит сбой при запуске программы-майнера.
Ошибки, вызванные неправильной установкой драйверов
Как правило, в майнинг фермах с несколькими видеокартами возникают следующие ошибки, связанные с неправильной установкой драйверов:
Ошибка с кодом 43, как правило, возникает при установке новых драйверов в системе, что может сделать и сама система во время автоматической установки обновлений. Кроме того, драйвера могут слететь при сбоях в питании, появлении ошибок на носителе системы, воздействии вирусов и других проблемах.
После такого обновления может появиться ошибка 43, а также значительно упасть хешрейт видеокарт. Для видеокарт AMD после установки драйверов нужно применить AMD-Compute-Switcher, а для видеокарт Нвидиа включить P0 state согласно методике, описанной в статье «Оптимизация потребления видеокарт Nvidia при майнинге».
Если после применения патчера и мода (для Windows 7) и перезагрузки системы ошибка не исчезает, то возможно на видеокарте прошит неверный BIOS, произошел сбой при его записи, либо вышла из строя микросхема BIOS на видеокарте. Для устранения такой ошибки нужно:
При невозможности восстановить рабочее состояние видеокарты прошивкой верного Биоса или переключением переключателя BIOS на резерв нужно менять чип BIOS в сервис-центре, либо искать другую причину неполадок.
Ошибки в конфигурации майнера при указании видеокарт
Этот вид ошибок возникает в случае отсутствия или неправильного указания в пакетном файле для запуска майнинга видеокарт, которые должны осуществлять майнинг (как АМД, так и Nvidia).
Например, в программе claymore dual miner и других программах от этого программиста, иногда возникает ошибка NO AMD OPENCL found. Она появляется при запуске программы для майнинга и обозначает, что не найдено устройств, поддерживающих технологию OPENCL. В разных программах она может иметь различное написание, но ее суть сводится к невозможности найти подходящее для майнинга устройство. При отсутствии аппаратных ошибок и проблем, связанных с неверной установкой драйверов, неисправность нужно искать в конфигурации майнера.
Эта ошибка может возникать и в других программах, использующихся для майнинга. Например, в программе sgminer подобная ошибка называется clDevicesNum returned error, no GPUs usable. При запуске майнера появляется подобное сообщение:
[02:56:02] Started sgminer v0.1.1
[02:56:02] * using Jansson 2.11
[02:56:09] Specified platform that does not exist
[02:56:09] clDevicesNum returned error, no GPUs usable
[02:56:09] Command line options set a device that doesn’t exist
Еще раз повторимся, что если в диспетчере устройств нужные видеокарты отображены корректно и не имеют восклицательных знаков с кодами ошибки, то неправильно сконфигурирован BAT-файл. Это случается в системах с различными типами карт, установленными в системе (например, интегрированная видеокарта плюс видеокарты AMD или одновременное использование GPU от AMD и Nvidia и все три типа устройств вместе). Как правило, для устранения этой ошибки нужно либо правильно указать номера использующихся в майнере видеокарт, либо указать какую платформу (AMD или Nvidia) нужно использовать.
В sgminer (его различных версиях и подобных программах, например, cgminer) в смешанных системах может понадобиться указывать в командной строке параметр —gpu-platform 1 или 2.
Обычно, при отсутствии включенной внутренней видеокарты этот майнер работает без указания этого парметра, но в этом случае иногда может потребоваться использование команды —gpu-platform 0.
Другие ошибки, приводящие к сбоям в работе майнеров
Рассмотрим другие ошибки, которые иногда возникают при работе программ для майнинга:
ошибка WATCHDOG: GPU hangs in OpenCL call появляется при переразгоне видеокарт, некачественных райзерах, плохих (очень длинных) соединительных USB-кабелях. Не нужно выжимать из видеокарт все соки, увеличивая частоту памяти и видеоядра, так как простои, вызванные переразгоном, сведут на нет весь доход от такого майнинга. Понять то, где выставлены очень большие значения частоты поможет программа hwinfo, которая показывает ошибки по памяти для видеокарт AMD:
Как правило, при переразгоне по памяти вылетает одна из видеокарт, а при чрезмерном разгоне по ядру (или очень сильном даунвольтинге) компьютер полностью зависает;
Заключение
Майнинг требует наличия определенных знаний, связанных с эксплуатацией вычислительной техники и сетей связи. Это необходимо, потому что знание основ функционирования радиоаппаратуры и каналов связи дает возможность самостоятельно разобраться в причинах появления неполадок и понять, как их можно устранить наиболее рациональным способом.
Знание основ электротехнических цепей поможет избежать ошибок, связанных с навешиванием чрезмерной нагрузки на одну линию (например, более одной видеокарты на линию Molex), что часто приводит к подгоранию контактов или выходу из строя райзеров и видеокарт.
Понимание закона Ома поможет избежать проблем, связанных с использованием переходников с разъема питания SATA на райзера, которое гарантированно приведет к прогоранию контактов и связанным с этим проблемам.
Чем больше человек знает, тем больше он понимает, что знает очень мало или не знает ничего… Процесс поиска истины благотворно воздействует на человеческую карму и дает жизненный опыт, для обретения которого, возможно, мы и живем…
RX vega Vega 56 GPU detected DEAD
MikeX5
Друг форума
_AVL_
Свой человек
1% битых это нормально?
1400\[email protected]
+тайминги от Weaker Vega 56 (Hynix)
—cn_config=14*12:CAA
191W по ватметру
_AVL_
Свой человек
В общем проблему решил принудительно переведя PCI порты в GEN2, для ASUS H270-PLUS это выглядит вот так:
Advanced > PCH Configuration > PCI Express Configuration > PCIe Speed > [Gen2]
Advanced > System Agent (SA) Configuration > Above 4G Decoding > [Enabled]
Advanced > System Agent (SA) Configuration > DMI Max Link Speed > [Gen2]
Advanced > System Agent (SA) Configuration > PEG Port Configuration > PCIEX16_1 Link Speed > [Gen2]
Advanced > System Agent (SA) Configuration > PEG Port Configuration > PCIEX16_3 Link Speed > [Gen2]
по итогу получаем стабильную работу без ошибок:
[2019-09-26 10:32:36] Stats Uptime: 1 days, 13:32:08
[2019-09-26 10:32:36] GPU 0 [54C, fan 39%] cnr: 1.991kh/s, avg 1.992kh/s, pool 1.977kh/s a:1494 r:0 hw:0
[2019-09-26 10:32:36] GPU 1 [54C, fan 39%] cnr: 2.019kh/s, avg 2.022kh/s, pool 2.026kh/s a:1535 r:0 hw:0
[2019-09-26 10:32:36] GPU 2 [53C, fan 40%] cnr: 1.991kh/s, avg 1.986kh/s, pool 1.954kh/s a:1480 r:0 hw:0
[2019-09-26 10:32:36] Total cnr: 6.001kh/s, avg 6.000kh/s, pool 5.957kh/s a:4509 r:0 hw:0
GPU1 (hynix): 1400\[email protected]
GPU0\GPU2 (samsung): 1400\[email protected]
с разгоном надо будет еще позаниматься.
Спасибо всем, кто пытался помочь)
_AVL_
Свой человек
—cn_config=14*13:CAA,14*14:AAA,14*13:CAA
но при этом потребление 625W с рига.
при не шитых картах и разгоне 1407 MHz\930 [email protected] mV:
—cn_config=14+14:AAA,14*12:CAA,14*14:AAA
при этом потребление 545W с рига.
в общем не увидел смысла ради +500 хэшей (+9%), увеличивать потребление на 15%.