An illegal memory access was encountered ошибка

Приветствую, выдаёт ошибку как в заголовке, 4 Карты 1060 гигабайт, память хьюникс. Уже. По одной втыкал проверял(каждая карта с той же ошибкой выдавалась по отдельности), разгон не стоит, перелазил форум, нашёл похожее но не помогают способы решения, помогите плиз, заранее спасибо

у меня такое было и на 1070 и на 1080 ти, читал форум,спрашивал у людей все отвечали разное (винда, переразгон, хана карте, файл подкачки) но я тупо решение нашел скачал зеалот энеми майнер и на нем все работает без проблем

Просто у меня несколько ферм все абсолютно одинаковые на клэйморе, но вот одна пару дней назад вырубилась и не хочет включаться

у меня такое было и на 1070 и на 1080 ти, читал форум,спрашивал у людей все отвечали разное (винда, переразгон, хана карте, файл подкачки) но я тупо решение нашел скачал зеалот энеми майнер и на нем все работает без проблем

Попробуй выключить ферму, а затем включить , не перезагрузка а именно повер офф на несколько минут, если не помогло переустановка дров через дди, увеличение подкачки.

А поиском пройтись хотя бы по форуму? https://miningclub.info/threads/gpu…al-memory-access-was-encountered.11813/page-2
Конкретно для твоей ситуации вот решение и там ниже в ветке есть ответ, что помогло:

Две страницей бредней.
И так, у вас вылетает ошибка illegal memory access was encountered — это значит что вам не хватает памяти, т.е.у вас больше карт, чем указан для них размер swap. Увеличьте его, например если у вас 6-8 карт 1080 до 64 гигов, перегружаете комп и всё работает.
Проблема не в ваших картах, проблема в некоторых майнерах требующий большой своп. Чем больше карт, тем больше требуется своп.

Во первых ты не указал объем памяти 3 или 6Г? На 6Г — все ок, на 3 и даже 4-хГ АМД, а поскольку вчера тут вой стоял по поводу внезапной нехватки памяти на 1063 возможно у тебя сработало и из-за этого — а это проблема уже со старым клеймором.
У меня, во всяком случае, вчера 2 1063 отказались работать. Решилось установкой последней вервии клеймора — 11.8. Все запустилось и работает как часы (на вин 7)

Приветствую, выдаёт ошибку как в заголовке, 4 Карты 1060 гигабайт, память хьюникс. Уже. По одной втыкал проверял(каждая карта с той же ошибкой выдавалась по отдельности), разгон не стоит, перелазил форум, нашёл похожее но не помогают способы решения, помогите плиз, заранее спасибо

Если копаете Эфир, то можно дописать ключ eres в батник или обновиться: https://bytwork.com/soft/claymores-dual-ethereum-amdnvidia-gpu-miner#sect3.1

Спасибо помогло, но думаю это временно, придется обновляться. я на клее 9.7 до сих пор сижу)))

Спасибо помогло, но думаю это временно, придется обновляться. я на клее 9.7 до сих пор сижу)))

Обновил клэймор все заработало как надо,спасибо

Приветствую, выдаёт ошибку как в заголовке, 4 Карты 1060 гигабайт, память хьюникс. Уже. По одной втыкал проверял(каждая карта с той же ошибкой выдавалась по отдельности), разгон не стоит, перелазил форум, нашёл похожее но не помогают способы решения, помогите плиз, заранее спасибо

Происходила аналогичное исключительно на майнерах Zec. Zec не добываю и ошибка не появляется. Я думаю переразгон. Попробуй автобернер переустоновить.

А поиском пройтись хотя бы по форуму? https://miningclub.info/threads/gpu…al-memory-access-was-encountered.11813/page-2
Конкретно для твоей ситуации вот решение и там ниже в ветке есть ответ, что помогло:

Во первых ты не указал объем памяти 3 или 6Г? На 6Г — все ок, на 3 и даже 4-хГ АМД, а поскольку вчера тут вой стоял по поводу внезапной нехватки памяти на 1063 возможно у тебя сработало и из-за этого — а это проблема уже со старым клеймором.
У меня, во всяком случае, вчера 2 1063 отказались работать. Решилось установкой последней вервии клеймора — 11.8. Все запустилось и работает как часы (на вин 7)

Виртуалка не причем. У меня установлено 100 000 на 5х1066

Виртуалка не причем. У меня установлено 100 000 на 5х1066

Или-или — я ж написал- виртуалка или клеймор.
У меня напр. оказался клеймор — обновил — все заработало.

Или-или — я ж написал- виртуалка или клеймор.
У меня напр. оказался клеймор — обновил — все заработало.

Хорошо)))

Хорошо)))

Блин дружище у меня эта ферма нормально заработала вроде, но потом выключилась и теперь постоянно вырубается, словить момент не могу чтоб ошибку посмотреь

Блин дружище у меня эта ферма нормально заработала вроде, но потом выключилась и теперь постоянно вырубается, словить момент не могу чтоб ошибку посмотреь

О! Это не ко мне. Советы комментаторы выше давали. Я клеймор не использую.)))) Если эфир то фениксом копаю)))

О! Это не ко мне. Советы комментаторы выше давали. Я клеймор не использую.)))) Если эфир то фениксом копаю)))

Тогда впишите в конец батника слово pause (Цитирую иного автора). То есть пишешь пауза и сможешь увидеть что за ошибка. Но это не точно

у меня на 1070 Palit jetStream было такое, причина была в даунвольте, сделал вместо 750mV — 825mV стало стабильно, при 800mV вылетало иногда
P.S. все 1070 у меня работают без проблем на 750 mV

всем доброго дня !
gminer 1.86
an illegal memory access was encountered
что может быть
win 7, пытаюсь копнуть бим
на 4-ой карте вылетает такое сообщение
подкачки 37 гиг
риг всего лишь на 4 карточки

всем доброго дня !
gminer 1.86
an illegal memory access was encountered
что может быть
win 7, пытаюсь копнуть бим
на 4-ой карте вылетает такое сообщение
подкачки 37 гиг
риг всего лишь на 4 карточки

тоже на 4 появилась что делал

у меня такая проблема с 1070 была, решил повышением напряжения с 750mV до 850mV

Источник

Hi,everyone!
I met a strange illegal memory access error. It happens randomly without any regular pattern.
The code is really simple. It is PointNet for point cloud segmentation. I don’t think there is anything wrong in the code.

import torch
import torch.nn as nn
import torch.nn.functional as F
import os
class InstanceSeg(nn.Module):
    def __init__(self, num_points=1024):
        super(InstanceSeg, self).__init__()

        self.num_points = num_points

        self.conv1 = nn.Conv1d(9, 64, 1)
        self.conv2 = nn.Conv1d(64, 64, 1)
        self.conv3 = nn.Conv1d(64, 64, 1)
        self.conv4 = nn.Conv1d(64, 128, 1)
        self.conv5 = nn.Conv1d(128, 1024, 1)
        self.conv6 = nn.Conv1d(1088, 512, 1)
        self.conv7 = nn.Conv1d(512, 256, 1)
        self.conv8 = nn.Conv1d(256, 128, 1)
        self.conv9 = nn.Conv1d(128, 128, 1)
        self.conv10 = nn.Conv1d(128, 2, 1)
        self.max_pool = nn.MaxPool1d(num_points)

    def forward(self, x):
        batch_size = x.size()[0] # (x has shape (batch_size, 9, num_points))

        out = F.relu(self.conv1(x)) # (shape: (batch_size, 64, num_points))
        out = F.relu(self.conv2(out)) # (shape: (batch_size, 64, num_points))
        point_features = out

        out = F.relu(self.conv3(out)) # (shape: (batch_size, 64, num_points))
        out = F.relu(self.conv4(out)) # (shape: (batch_size, 128, num_points))
        out = F.relu(self.conv5(out)) # (shape: (batch_size, 1024, num_points))
        global_feature = self.max_pool(out) # (shape: (batch_size, 1024, 1))

        global_feature_repeated = global_feature.repeat(1, 1, self.num_points) # (shape: (batch_size, 1024, num_points))
        out = torch.cat([global_feature_repeated, point_features], 1) # (shape: (batch_size, 1024+64=1088, num_points))

        out = F.relu(self.conv6(out)) # (shape: (batch_size, 512, num_points))
        out = F.relu(self.conv7(out)) # (shape: (batch_size, 256, num_points))
        out = F.relu(self.conv8(out)) # (shape: (batch_size, 128, num_points))
        out = F.relu(self.conv9(out)) # (shape: (batch_size, 128, num_points))

        out = self.conv10(out) # (shape: (batch_size, 2, num_points))

        out = out.transpose(2,1).contiguous() # (shape: (batch_size, num_points, 2))
        out = F.log_softmax(out.view(-1, 2), dim=1) # (shape: (batch_size*num_points, 2))
        out = out.view(batch_size, self.num_points, 2) # (shape: (batch_size, num_points, 2))

        return out

Num = 0
network = InstanceSeg()
network.cuda()
while(1):

    input0 = torch.randn(32, 3, 1024).cuda()
    input1 = torch.randn(32, 3, 1024).cuda()
    input2 = torch.randn(32, 3, 1024).cuda()
    input = torch.cat((input0, input1, input2), 1)

    out = network(input)
    Num = Num+1
    print(Num)

After random number of steps, error raises. The error report is

Traceback (most recent call last):
  File "/home/wangye/Frustum-PointNet_Test/frustum_pointnet.py", line 58, in <module>
    input0 = torch.randn(32, 3, 1024).cuda()
RuntimeError: CUDA error: an illegal memory access was encountered

When I added «os.environ[‘CUDA_LAUNCH_BLOCKING’] = ‘1’» at the top of this script, the error report was changed to this

Traceback (most recent call last):
  File "/home/wangye/Frustum-PointNet_Test/frustum_pointnet.py", line 64, in <module>
    out = network(input)
  File "/home/wangye/anaconda3/lib/python3.6/site-packages/torch/nn/modules/module.py", line 489, in __call__
    result = self.forward(*input, **kwargs)
  File "/home/wangye/Frustum-PointNet_Test/frustum_pointnet.py", line 35, in forward
    out = F.relu(self.conv5(out)) # (shape: (batch_size, 1024, num_points))
  File "/home/wangye/anaconda3/lib/python3.6/site-packages/torch/nn/modules/module.py", line 489, in __call__
    result = self.forward(*input, **kwargs)
  File "/home/wangye/anaconda3/lib/python3.6/site-packages/torch/nn/modules/conv.py", line 187, in forward
    self.padding, self.dilation, self.groups)
RuntimeError: cuDNN error: CUDNN_STATUS_EXECUTION_FAILED

I know some wrong indexing operations and some wrong usage method of loss function may lead to illegal memory access error. But in this script, there is no such kind of operation.
I am quite sure this error is not because of out of memory since only about 2G GPU memory is used, and I have totally 12G GPU memory.

This is my environment information:

OS: Ubuntu 16.04 LTS 64-bit
Command: conda install pytorch torchvision cudatoolkit=9.0 -c pytorch
GPU: Titan XP
Driver Version: 410.93
Python Version: 3.6
cuda Version: cuda_9.0.176_384.81_linux
cudnn Version: cudnn-9.0-linux-x64-v7.4.2.24
pytorch Version: pytorch-1.0.1-py3.6_cuda9.0.176_cudnn7.4.2_2

I have been stuck here for long time.
In fact, not only this project faces this error, many other projects face similar error in my computer.
I don’t think there is anything wrong in the code. It can run correctly for some steps. Maybe this error is because the environment. I am not sure.
Does anyone have any idea about this situation? If more detailed information is needed, please let me know.
Thanks for any suggestion.

Источник

Relatively new to using CUDA. I keep getting the following error after a seemingly random period of time:
RuntimeError: CUDA error: an illegal memory access was encountered

I have seen people suggest things such as using cuda.set_device() rather than cuda.device(), setting torch.backends.cudnn.benchmark = False

but I can’t seem to get the error to go away. Here are some pieces of my code:
torch.cuda.set_device(torch.device('cuda:0'))
torch.backends.cudnn.benchmark = False

class LSTM(nn.Module):
    def __init__(self, input_dim, hidden_dim, num_layers, output_dim):
        super(LSTM, self).__init__()
        self.hidden_dim = hidden_dim
        self.num_layers = num_layers

        self.lstm = nn.LSTM(input_dim, hidden_dim, num_layers, batch_first=True, dropout=0.2)

        self.fc = nn.Linear(hidden_dim, output_dim)

    def forward(self, x):
        h0 = torch.zeros(self.num_layers, x.size(0), self.hidden_dim).requires_grad_().cuda()
        c0 = torch.zeros(self.num_layers, x.size(0), self.hidden_dim).requires_grad_().cuda()

        out, (hn, cn) = self.lstm(x, (h0.detach(), c0.detach()))

        out = self.fc(out[:, -1, :]) 
        
        return out

    def pred(self, x):
        return self(x) > 0

def train(model, loss_fn, optimizer, num_epochs, x_train, y_train, x_val, y_val, loss_stop=60):
    cur_best_loss = 999
    loss_recur_count = 0
    best_model = None
    for t in range(num_epochs):
        model.train()

        y_train_pred = model(x_train)

        train_loss = loss_fn(y_train_pred, y_train)

        tr_l = train_loss.item()
        
        optimizer.zero_grad()

        train_loss.backward()
        optimizer.step()

        model.eval()
        with torch.no_grad():  
            y_val_pred = model(x_val)

            val_loss = loss_fn(y_val_pred, y_val)

            va_l = val_loss.item()
            
            if va_l < cur_best_loss:
                cur_best_loss = va_l
                best_model = model
                loss_recur_count = 0
            else:
                loss_recur_count += 1

        if loss_recur_count == loss_stop:
            break
    if best_model is None:
        print("model is None.")
    return best_model

def lstm_test(cols, df, test_percent, test_bal, initial_shares_test, max_price, last_sell_day):
    wdw = 20
    x_train, y_train, x_test, y_test, x_val, y_val = load_data(df, wdw, test_percent, cols)

    x_train = torch.from_numpy(x_train).type(torch.Tensor).cuda()
    x_test = torch.from_numpy(x_test).type(torch.Tensor).cuda()
    x_val = torch.from_numpy(x_val).type(torch.Tensor).cuda()
    y_train = torch.from_numpy(y_train).type(torch.Tensor).cuda()
    y_test = torch.from_numpy(y_test).type(torch.Tensor).cuda()
    y_val = torch.from_numpy(y_val).type(torch.Tensor).cuda()

    input_dim = x_train.shape[-1]
    hidden_dim = 32
    num_layers = 2
    output_dim = 1
    y_preds_dict = {}
    for i in range(11):
        model = LSTM(input_dim=input_dim, hidden_dim=hidden_dim, output_dim=output_dim, num_layers=num_layers).cuda()

        r = (y_train.cpu().shape[0] - np.count_nonzero(y_train.cpu()))/np.count_nonzero(y_train.cpu())/2
        pos_w = torch.tensor([r]).cuda()

        loss_fn = torch.nn.BCEWithLogitsLoss(pos_weight=pos_w).cuda()

        optimizer = torch.optim.AdamW(model.parameters(), lr=0.01)

        best_model = train(model, loss_fn, optimizer, 300, x_train, y_train, x_val, y_val)
        
        y_test_pred = get_predictions(best_model, x_test)
        y_preds_dict[i] = y_test_pred.cpu().detach().numpy().flatten()

and here is the error msg:

<ipython-input-5-c52edc2c0508> in train(model, loss_fn, optimizer, num_epochs, x_train, y_train, x_val, y_val, loss_stop)
     19         model.eval()
     20         with torch.no_grad():
---> 21             y_val_pred = model(x_val)
     22 
     23             val_loss = loss_fn(y_val_pred, y_val)

~anaconda3libsite-packagestorchnnmodulesmodule.py in _call_impl(self, *input, **kwargs)
   1049         if not (self._backward_hooks or self._forward_hooks or self._forward_pre_hooks or _global_backward_hooks
   1050                 or _global_forward_hooks or _global_forward_pre_hooks):
-> 1051             return forward_call(*input, **kwargs)
   1052         # Do not call functions when jit is used
   1053         full_backward_hooks, non_full_backward_hooks = [], []

<ipython-input-4-9da8c811c037> in forward(self, x)
     10 
     11     def forward(self, x):
---> 12         h0 = torch.zeros(self.num_layers, x.size(0), self.hidden_dim).requires_grad_().cuda()
     13         c0 = torch.zeros(self.num_layers, x.size(0), self.hidden_dim).requires_grad_().cuda()
     14 

RuntimeError: CUDA error: an illegal memory access was encountered
CUDA kernel errors might be asynchronously reported at some other API call,so the stacktrace below might be incorrect.
For debugging consider passing CUDA_LAUNCH_BLOCKING=1.

Источник

Андрей Хуторной

@aNdrE_ch

Школьник, интересуюсь IT, пытаюсь учить Frontend.

видеокарты

Видеокарты
Криптовалюта

В играх карта работает нормально.

Вопрос задан

более года назад
3237 просмотров

1
комментарий

Средний

1
комментарий

Loli E1ON

@E1ON

Отключить разгон, если включен.

Написано

более года назад

Решения вопроса 0

Пригласить эксперта

Ответы на вопрос 1

rassini

@rassini

Поднимите питание, его не достаточно.

Ответ написан

более года назад

Комментировать

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Войти через центр авторизации

Похожие вопросы

- Мониторы
- +1 ещё
Сложный
Поддерживается ли разрешение 5120:1440 и 165 гц на видеокарте gtx 1660 ti?
- 1 подписчик
- вчера
- 58 просмотров
1

ответ
- Видеокарты
Простой
Как мне выбрать видеокарату?
- нет подписчиков
- 24 янв.
- 82 просмотра
1

ответ
- Видеокарты
- +2 ещё
Простой
Планирую поменять процессор. Как заранее понять, какой будет прогресс в производительности?
- 1 подписчик
- 24 янв.
- 111 просмотров
2

ответа
- Видеокарты
- +1 ещё
Простой
Хватит ли процессора для видеокарты?
- 1 подписчик
- 22 янв.
- 115 просмотров
2

ответа
- Видеокарты
Простой
Встроенная AMD Ryzen 5 3400G Radeon Vega Graphics 2GB лучше,или Nvidia Geforce Gt 730? 4 GB?
- 1 подписчик
- 21 янв.
- 51 просмотр
1

ответ
- Видеокарты
Средний
Почему afterburner сам меняет частоты ГП?
- 1 подписчик
- 21 янв.
- 25 просмотров
0

ответов
- Видеокарты
Простой
Почему видеокарта потребляет разное кол-во ватт в играх, при максимальной нагрузке?
- 1 подписчик
- 21 янв.
- 67 просмотров
1

ответ
- Железо
- +1 ещё
Средний
Что лучше для видеокарты VRAM или GDDR?
- 1 подписчик
- 20 янв.
- 127 просмотров
3

ответа
- Видеокарты
- +2 ещё
Простой
Как обновить драйвер Intel HD Graphics 4000?
- 1 подписчик
- 19 янв.
- 49 просмотров
3

ответа
- macOS
- +4 ещё
Средний
Macbook pro 15 2014 года не видит дискретную видел карту, что делать?
- 1 подписчик
- 17 янв.
- 63 просмотра
0

ответов
Показать ещё
Загружается…

Вакансии с Хабр Карьеры

DevOps/Admin (команда Application Security)

Сбер
•
Москва

от 150 000 до 200 000 ₽

Инженер по информационной безопасности

АО «ГНИВЦ»
•
Москва

от 250 000 до 250 000 ₽

Junior+/Middle DBA

4People
•
Лимассол

от 2 500 до 3 500 €

Ещё вакансии

Заказы с Хабр Фриланса

Доработать бэкенд сайта / yii2

28 янв. 2023, в 16:38

2500 руб./за проект

Доделать дизайн сайта за прошлым дизайнером

28 янв. 2023, в 15:53

3000 руб./за проект

Нужна помощь с postgresql, конфигурация и запросы

28 янв. 2023, в 15:40

5000 руб./за проект

Ещё заказы

Минуточку внимания

Присоединяйтесь к сообществу, чтобы узнавать новое и делиться знаниями

Зарегистрироваться

Источник

Во время очередного прогона я получил вот это. Майнер каждый раз вылетает.

CUDA error in func 'search' at line 365 : an illegal memory access was encountered. CUDA error in func 'search' at line 365 : an illegal memory access was encountered. CUDA error in func 'search' at line 365 : an illegal memory access was encountered. ✘ 01:14:46|cudaminer1 Error CUDA mining: an illegal memory access was encountered ✘ 01:14:46|cudaminer2 Error CUDA mining: an illegal memory access was encountered ✘ 01:14:46|cudaminer4 Error CUDA mining: an illegal memory access was encountered CUDA error in func 'search' at line 365 : an illegal memory access was encountered. ✘ 01:14:46|cudaminer3 Error CUDA mining: an illegal memory access was encountered CUDA error in func 'search' at line 365 : an illegal memory access was encountered. ✘ 01:14:46|cudaminer0 Error CUDA mining: an illegal memory access was encountered

Это может быть связано с разгоном, вопреки моим предыдущим наблюдениям в №80. Я запускал его около 90 минут при стандартных настройках графического процессора без ошибок. Изменено на +165 ядер и +2000 памяти с помощью графического интерфейса настроек сервера nvidia x. Он работал стабильно около 2 минут и таким образом выдавал ошибку.

Я сбросил память до +1500 и начал снова. Он работал около 30 минут без проблем.

Увеличил память до +1900 только на одной карте, и ошибка возникла снова. Об этом сообщалось одновременно на обоих графических процессорах, как обычно, несмотря на изменение скорости только на одном из них.

Я могу перезапускать ethminer снова и снова с такой высокой скоростью передачи памяти, и каждый раз он дает сбой в короткие сроки.

У меня нет опыта работы с C или каким-либо аппаратным программированием низкого уровня. Поэтому я не собираюсь даже пытаться понять, что делает код.

Я надеюсь, что сообщение о том, как воспроизвести проблему, поможет кому-то найти решение или, по крайней мере, лучший способ отлова ошибок для этой воспроизводимой проблемы.

В идеале майнер обнаружил бы ошибку и перезапустился, увеличивая счетчик, показывающий количество перезапусков из-за ошибок. Есть момент, когда более высокая скорость передачи снижает производительность из-за сбоев. Но его сложно найти, когда сбои трудно обнаружить, не стоя и не наблюдая за прокручивающимся терминалом.

@shanemgrey, спасибо, что разместили это, я согласен, я подозреваю, что проблема

Согласитесь, Claymore очень хорошо справляется со сбоями, это очень удобно, особенно если вы не можете постоянно следить за майнером. Какой-то вариант перезапуска майнинга будет очень удобной функцией этого майнера.

Просто чтобы проверить, связано ли это с ОС. Мой майнер работает на Windows 7 Ultimate 64 bit и ведет себя точно так же (сбои в зависимости от уровня разгона). На моем компьютере с Windows 10 у меня есть одна карта, которая вообще не разбилась (работает 21 час). У вас такие же результаты или дело не в ОС?

@Skromniac Все еще не уверен, могу ли я воспроизвести сбои во всех ОС (Windows / Linux), когда частота слишком высока. На данный момент я заметил, что сбои становятся менее частыми (каждые 2–30 минут), когда я уменьшаю тактовую частоту. Я буду продолжать пробовать это, пока не увижу, что теперь вылетает несколько дней. Я все еще не уверен, что это полностью связано с тактовой частотой, OC усугубляет проблему, но я думаю, что это не основная причина проблемы.

Подробнее, каждый раз, когда происходит сбой, возникает ошибка драйвера ядра.

Jun 30 06:08:58 ubuntu kernel: [77905.021944] NVRM: Xid (PCI:0000:02:00): 31, Ch 0000001b, engmask 00000101, intr 10000000

Xid 31: согласно сайту драйверов Nvidia, эта ошибка возникает, когда это ошибка драйвера / приложения.

Так что это не проблема с оборудованием, что хорошо, потому что исключает проблему с оборудованием. Я пробовал другую версию драйвера и получаю такие же ошибки. Я думаю, нам нужен кто-то, кто знает, как работает майнер, чтобы взглянуть на это, может нам помочь.

Для справки: я использую Ubuntu 16.04, драйвер 64 бит, 381.22 и Cuda 8.0.

Покопавшись, я постепенно обновляюсь с версии драйвера 367.27 до 381.22. Сбои постоянны, вы их получаете независимо. Это действительно раздражает, потому что в майнере нет функции сторожевого таймера, которая могла бы перезапускаться в случае сбоя. И вы не можете присматривать за ним 24/7 или автоматически перезапускаться.

Дополнительная информация, в зависимости от версии вашего драйвера, вы получаете разные ошибки сбоя. Итак, у меня версия драйвера 381.22, у меня недопустимая ошибка памяти, но на 375.66 я получаю неопределенный сбой запуска. Все это относится к какому-то поисковому коду в библиотеке ethash для этого майнера.

@davilizh @chfast @Genoil, ребята, комментарии, пожалуйста. Очень трудно найти здесь первопричину.

@rizwansarwar
Извините, что ответил поздно.
Прочитав все ваши комментарии, проблема должна заключаться в том, что при разгоне графический процессор получает неправильные данные / инструкции. Если честно, опыта разгона gpu / mem у меня нет. Мои приблизительные мысли:

произойдет ли ошибка снова, если мы только перегрузим тактовую память? Поскольку Ethereum привязан к памяти, я думаю, что более важно увеличить тактовую частоту памяти.
можем ли мы разместить все структуры данных Ethereum в памяти хоста, а в видеопамять разместим только буфер dag?
можем ли мы добавить сторожевой таймер в код, чтобы перезапустить его при возникновении ошибки?
можем ли мы использовать cuda-gdb или cuda-memcheck, чтобы узнать, какая инструкция / данные неверны, чтобы мы могли добавить к ним защиту?

Надеюсь, это поможет для воспроизводимости — я перезапустил свою установку в пятницу и с тех пор не входил в систему через удаленный рабочий стол. Буровая установка работает нормально, без заминки. Кто-то упомянул, что проблема часто возникает, когда вы входите в систему, чтобы проверить, то есть когда основная видеокарта пытается отрендерить что-то еще (кроме майнинга).

@Skromniac
Спасибо, хорошие новости.
Если это так, мы можем добавить небольшую область разгона для основной карты и добавить большую область разгона для других. Мы даже не можем разогнать основную карту.

@davilizh
Спасибо, что вернулись. Пожалуйста, обратите внимание на мой комментарий ниже.

Сбой происходит только при разгоне памяти. Хуже того, когда разгон приближается к пределу. Но случается все равно. Я проверил это, пытаясь постепенно снижать тактовую частоту памяти. Становится лучше, когда вы приближаетесь к штатным часам, но вы все равно получаете сбои (иногда с разницей в 12 часов).
Наверное, хорошая идея, я не эксперт в программировании CUDA, но будет ли это снижение производительности?
На мой взгляд, абсолютно необходимо, чтобы весь код майнера был потоком, который инициируется потоком сторожевой собаки. По возможности следует попытаться восстановить майнер.
Извините, мои волшебные способности здесь заканчиваются, вы гуру, я просто новообращенный, пытающийся помочь и сообщить 🙂

@Skromniac Я попробую это сегодня, я постараюсь оставить видеокарту вне списка моих устройств. Надеюсь, это должно доказать, что проблема в этом.

@rizwansarwar
Спасибо за ваш ответ.

Для №2 должен быть какой-то штраф. Но пока код тщательно настроен, штраф должен быть небольшим. Но в последнее время не успеваю реализовать эту идею.

Надеюсь, что подход Skromniac может решить эту проблему.

Вот мой опыт, если это поможет.

У меня есть 2 установки: одна только с 1070 и одна с 50/50 1070 и 1060. Установка с 1060 использует —cuda-parallel-hash 4, а установка 1070 вообще не использует этот флаг. Оба работают под управлением Ubuntu 16.04.2 с версией драйвера Nvidia: 378.13.

Что касается комментария

Исходя из Claymore’s, мне пришлось сбросить тактовые частоты памяти (я не использую ядро OC), чтобы добиться некоторой стабильности. С более низкими частотами лучшее, что у меня было до сих пор, составляет около 24 часов без ошибок. Я не опустился ниже, как будто я вернусь к Claymore’s, так как он обеспечит лучший хешрейт.

У меня был аналогичный опыт с @rizwansarwar: стабильность увеличивалась, когда часы понижались, но никогда полностью не исчезали.

Не могли бы вы обновить драйвер до 384 и попробовать?
Я часами запускал код на своем GTX1060 с драйвером 384 и стандартными часами, но не могу воспроизвести проблему.

@braaad Если вы не указали cuda-parallel-hash в своей команде, то вы используете значение по умолчанию cuda-parallel-hash = 4.

@davilizh Я попробую , я могу надежно вызвать ошибку, если

@davilizh Я установил 381.22 (последнюю версию для Linux), но смог снова быстро получить ошибку, увеличив частоту на 50 МГц. Я снизил свои текущие часы немного ниже (больше, чем у меня уже было), чтобы увидеть, как это влияет на стабильность.

@braaad , не могли бы вы попробовать 384.47?

@azazhu, плохо, я дважды проверил версии после прочтения вашего комментария и понял, что 384.47 был бета-драйвером, поэтому я не видел его раньше. Взять его сейчас.

@davilizh небольшое обновление, я обновился до драйвера 384.47. Эта версия драйвера в целом более стабильна, чем все предыдущие версии. Сейчас заработала моя 6-я карта в риге, которая так и не заработала ни в одной из предыдущих версий драйвера. В журнале изменений драйвера Nvidia, похоже, исправлена ошибка с ним.

Я играл с настройками, пока то, что я наблюдал, ниже.

Если частота памяти графического процессора с основным дисплеем не разогнана, я не получаю сбой на 384,47.
Если частота памяти графического процессора с основным дисплеем такая же, как и у всех других карт (разогнанных), то в течение нескольких минут возникают сбои.

Поэтому я старался поддерживать частоту графического процессора с дисплеем немного ниже (от -100 до -150), чем у всех других карт. Это обеспечивает стабильность системы и ее работу на 384.47. Я скоро сообщу, если увижу сбои.

@rizwansarwar Спасибо, что поделились.

@davilizh пока 12+ часов без ошибок на одном риге — это разогнанный, а не сток. Еще слишком рано, чтобы быть уверенным на 100%, но пока выглядит хорошо.

Также следует отметить одну вещь, например, @rizwansarwar , у gpu0 должна быть более низкая частота, чем у других. Я думал, что это просто плохая карта, но, возможно, это из-за того, что это gpu0.

Надеюсь, сегодня у меня будет время обновить вторую.

@braaad Хорошие новости. Спасибо.

@rizwansarwar Привет, я не использую свою установку, но CUDA error in func 'search' at line 365 : unspecified launch failure. все равно появляется каждый раз. Водитель моей установки в настоящее время 378,78. Возможно, это проблема водителя?

@ ken8203, как ранее указывал

@davilizh Я думаю, нам следует немного следить за этим, а затем закрыть это, так как мне кажется, что проблема

Если вы не установили cuda-parallel-hash в своей команде, то вы используете значение по умолчанию cuda-parallel-hash = 4.

Не могли бы вы рассказать нам или указать на объяснение того, что именно делает этот флаг? Я немного озадачен тем, что пробовал.

На самом деле я думаю, что его следует включить в readme.md, поскольку по умолчанию используется _автоматически_ без установки флага.

Также следует отметить одну вещь, например, @rizwansarwar , у gpu0 должна быть более низкая частота, чем у других. Я думал, что это просто плохая карта, но, возможно, это из-за того, что это gpu0.

__Примечание__: _Первый_ графический процессор NVidia, подключенный к _основному_ слоту PCIe (x16).
Он не обязательно должен быть подключен к дисплею, у него все еще есть нижний предел времени памяти _ по сравнению с другими картами. При превышении определенной скорости произойдет сбой ethminer (та же ошибка).
Выиграйте 10 с бета-версией 384.47, как предлагается.

@oleng

Флаг --cuda-parallel-hash изменяет способ обработки хэшей майнером.

Это очень упрощено, но часть работы ядра cuda — это поисковая часть процесса майнинга. Он выполняет одну и ту же операцию параллельно на многих ядрах графического процессора. Когда @davilizh улучшил ядро, он добавил флаг --cuda-parallel-hash позволяющий изменять количество потоков, которые он обрабатывает одновременно.

Необходимо, чтобы какое-то значение применялось автоматически без установки флага, иначе майнер не будет работать!

Теоретически было бы лучше всего использовать как можно больше потоков, но оптимальное решение будет зависеть от оборудования. По умолчанию майнер использует 4, потому что это лучшее значение, которое

Я не думаю, что есть необходимость продвигать настройку расширенных настроек в прочтении, потому что для большинства людей их изменение, вероятно, снизит производительность. То же самое относится к флагам --cuda-block-size --cuda-grid-size и --cuda-streams . Для них установлены разумные значения по умолчанию, и я только уменьшил свои хэши, изменив их.

@jimmykl спасибо за объяснение, я чувствую, что это соответствует тому, что я подозревал.

Я не думаю, что есть необходимость продвигать настройку расширенных настроек в прочтении, потому что для большинства людей их изменение, вероятно, снизит производительность. То же самое относится к флагам --cuda-block-size --cuda-grid-size и --cuda-streams . Для них установлены разумные значения по умолчанию, и я только уменьшил свои хэши, изменив их.

На самом деле мне удалось увеличить хешрейт с помощью этих флагов. Так же, как футболка любого размера подходит всем, так и настройка размера в соответствии с вашими пропорциями работает лучше. Настройка флагов под ваше оборудование работает лучше. И я считаю, что это особенно актуально при разгоне майнинга с несколькими графическими процессорами, что составляет ~ 80-90% (?) Майнеров. Есть даже различия в количестве ядер CUDA в одной и той же модельной линейке.

Думайте об этом как о предупреждении, вместо того чтобы пытаться решить, что для них хорошо.

По крайней мере, включите объяснение в --help

Да, а также увеличение частоты ядра без установки —cuda-parallel-hash также приводит к сбою ethminer.
Я сделал это в дополнение к стабильным часам памяти OC’d.

Я должен есть свои слова, авария произошла через 29 часов. Ситуация лучше, но похоже, что мы все еще сталкиваемся с ошибкой. Я бы сказал, что нам нужно найти способ воспроизвести и исправить это.

@davilizh, можете ли вы воспроизвести это в своей среде? Может быть, с разгоном вы сможете это повторить быстрее?

@rizwansarwar Я могу воспроизвести в своей среде с OC.
Как вы сказали в другом потоке (https://github.com/ethereum-mining/ethminer/issues/94#issuecomment-313800302), это, вероятно, связано с проблемой драйвера.
Вероятно, лучший способ для нас: в случае исключения, такого как «неверная инструкция», поймать его, зарегистрировать и попытаться перезапустить майнинг CUDA (из комментария chfast). Но я не знаю, как это сделать.

Я могу воспроизвести это тоже на SLI EVGA GTX 1070, думаю, мы должны обработать это в коде.

Часто такое случается и при небольшом разгоне.

Обновление: это также происходит без разгона, снижения частоты ядра и целевой мощности до 65%.

для тех, у кого все еще есть ошибка, попробуйте изменить Physix в панели управления nvidia на CPU вместо одного из GPU. Это сработало для меня.

Изменить: забудьте, это не удалось через несколько раз

Есть ли у кого-нибудь запасной майнер, который они используют тем временем, пока этот исправляется?

@feracon А пока я использую двойной

@saidmasoud Спасибо за предложение! Я проверю это!

Я также получаю этот сбой, и, похоже, он возникает только при более высоких смещениях передачи памяти (обычно около +1350 или +1400 для меня). Любопытно, что из 4 моих установок это происходит в основном на установке с EVGA GTX 1070.

Традиционный симптом разгона памяти, с которым я столкнулся, — это отказ одной карты, что имеет смысл в контексте разгона. Тем не менее, в сценарии этого потока все карты (в моем случае 6) одновременно вылетают. Итак, я согласен с тем, что разгон усугубляется, но я также думаю, что в программном обеспечении есть что-то странное и заслуживающее изучения.

Для тех, кто работает с Linux и хочет продолжать использовать ethminer, но из-за этого не доверяет процессу: просто напишите скрипт, который отслеживает вывод мощности nvidia-slip. Когда он опускается ниже 70 Вт (это порог, который я использую), вы знаете, что процесс ethminer не удался, и вы можете просто убить / перезапустить. Для меня работает как оберег. Вот соответствующий sed / cut:

/usr/bin/nvidia-smi -q -d POWER | grep "Power Draw" | sed 's/[^0-9,.]*//g' | cut -d . -f 1

@rizwansarwar Не добавив error in func 'ethash_cuda_miner::search' at line 365 или подобное? Это потому, что многие люди создают дубликаты этой проблемы и ссылаются на эту ошибку, и это может помочь им увидеть, что о ней уже сообщалось. Благодаря!

Я нашел № 94 и № 80 еще до того, как приехал сюда. Предполагая, что это основной поток для этой проблемы.

Да, пожалуйста, добавьте сюда свой отчет. Эти обманщики должны быть закрыты.

Я сделал PHP-скрипт, чтобы убить ethminer, если он перестанет хэшировать (для Linux):

#!/usr/bin/php
<?php
$start=time();
putenv("PATH=/bin:/usr/bin:/usr/local/bin");
while($line=fgets(STDIN)){
    if(time()-$start<=30){ echo "[*] $line"; continue; } // ignore first 30s
    if(strpos($line," 0.00MH/s")!==false){
        echo "crash detected. line=$line killing ethminern";
        passthru("echo "".trim(shell_exec('date'))." crash detected. killing ethminer" >> ~/ethminer.log");
        passthru("killall -9 ethminer");
    } else echo $line;
}

запустите ethminer в цикле и передайте его так:

while [ 1 ]; do ethminer ... 2>&1 | mine-monitor; done

Я согласен, что проблема усугубляется при использовании видеовыхода и / или выполнении других действий во время майнинга. Я использую Ubuntu 16.04 с 6 gtx 1060 (3 разных производителя), ранее разогнанными до 200/1200, теперь немного ниже, @ 85 Вт с G3900 Celeron. Я установил CUDA через официальный .deb / repo по адресу https://developer.nvidia.com/cuda-downloads, который заменил драйверы nvidia на 375.x.

Следующее, что я могу попробовать, — это майнинг без запущенного X или без подключенного монитора с использованием виртуальных мониторов.

@dhjw

Я не могу поверить в это, я цитирую кое-что, что мне написали. Но я не могу вспомнить, кто это написал. 🙁 Во всяком случае, это должно решить вашу проблему:

вам не нужен подключенный монитор, чтобы X работал. Во время установки сохраните EDID монитора с помощью nvidia-settings, а затем используйте файл edid.bin в вашем xorg.conf, чтобы подделать X, что монитор подключен. У меня это работает на моей установке, и у X нет проблем. Вы можете добавить edid с помощью nvidia-xconfig —custom-edid =. Это сгенерирует ваш xconfig с использованием поддельного edid, после этого X должен запуститься нормально.

Я использую их, которые мне, вероятно, не понадобятся с учетом вышеизложенного: https://www.amazon.com/gp/product/B00JKFTYA8. Но они тоже могут работать.

Только что получил то, что мне кажется такой же ошибкой на Клейморе, только Клеймор восстановился.

X явно то, о чем я совершенно не знаю. Мне сложно его отследить, потому что он помечен как один символ. Я могу найти множество тем на тему «Действительно ли мне нужен X» и т. Д., Но не могу найти фактическое название этой программы или ее домашнюю страницу. Заранее спасибо!

@feracon Какую версию Claymore это то, что использует? Я предполагаю, что он добавил оптимизацию CUDA из ethminer в 9.7, но я получил эту ошибку и в 9.6, когда я слишком сильно разогнался.

@jimmykl Я использую новую 9.7 с нулевым разгоном, полностью сток.

У меня такое чувство, что, возможно, в предложенной строке командного файла, которую я получил из своего FAQ по пулу, отсутствуют аргументы, которых ожидает новая версия, возможно, для новой оптимизации. Читаю сейчас. Но, по крайней мере, моя установка работает!

РЕДАКТИРОВАТЬ: Claymore’s Dual Ethereum AMD + NVIDIA GPU Miner v9.7 (Windows / Linux)

@feracon Re: Мониторинг Windows Я использую http://www.tightvnc.com и никогда не испытывал никаких проблем. Если вам нужен удаленный мониторинг, вы можете либо настроить переадресацию портов для VNC на вашем маршрутизаторе, либо запустить VPN-сервер (возможно, лучше всего для безопасности).

Re: Ошибка Claymore 9.7, тогда возможно, что он напрямую скопировал какой-то код из этой вилки и внес ту же ошибку в свой майнер … Конечно, он исправил ее, он, вероятно, не будет фиксировать ее здесь: — /

@jimmykl А, может быть. Тем не менее, для всех, у кого есть эта проблема, у Claymore может быть то же самое, но он может автоматически восстанавливаться, сохраняя вас в бизнесе. Спасибо за внимание к VNC. Я проверю это, я думаю, что он, вероятно, намного легче, чем TeamViewer.

@dhjw Спасибо!

@feracon Новый флаг оптимизации — —cuda-parallel-hash, и если он не установлен, по умолчанию используется 4, что является наиболее оптимальным для большинства карт.

@jimmykl Ага , я вижу допустимые настройки: 1, 2, 4 и 8, но люди, сообщающие о 8, отстой для некоторых 1070-х. Собираюсь поэкспериментировать и снова разогнать. Спасибо за совет.

Вот мои результаты:

GTX 1070
Ubuntu 16.04
Смещение памяти +1500
Потолок мощности 115 Вт
./ethminer -U -M —cuda-parallel-hash X:
31.10 в 1
32,36 при 2
28,87 при 3
32,42 при 4
25,86 при 5
21.60 при 6
18.59 при 7
32,22 при 8

Привет всем здесь — я новый член и рад поделиться некоторой информацией для всех.

Я протестировал несколько версий 11.0 на моем RIG1:

6 x GTX 1060 (ASUS Turbo) 6 ГБ (OC Mem 10 ГГц).
Windows 10: последняя версия
Драйвер NVidia: последняя версия

И могу подтвердить:

Все версии 11.0 имеют похожие проблемы. Иногда сообщение об ошибке отличается, но в целом у всех одна и та же проблема. Похоже, что изменения в области поиска CUDA глючны.

Я сам разработчик программного обеспечения и работал также с CUDA, но, к сожалению, у меня нет MS DevStudio 12, поэтому я не могу внести исправления. Я попытался перенести проект на MS DevStudio 2017, но это не удалось по многим причинам.

Сейчас я тестирую старую версию: ethminer-0.9.41-genoil-1.1.7, если у нее есть аналогичные проблемы с разогнанными картами, и я сообщу.

отчет:

Также версия ethminer-0.9.41-genoil-1.1.7 сообщает об ошибке поиска CUDA.
Ошибка CUDA в функции ‘ethash_cuda_miner :: search’ в строке 346: неопределенная ошибка запуска.
X 01: 25: 13 | cudaminer1 Ошибка майнинга CUDA: неопределенная ошибка запуска

Мое предложение сейчас: время выполнения программы изменяется при разгоне памяти графического процессора, я считаю, что у программного обеспечения есть общая проблема синхронизации в этой области.

ОБНОВЛЕНИЕ 1:

Я не проводил никаких дальнейших тестов, особенно с меньшим разгоном, потому что: это не имеет смысла.

Вместо этого я написал пару скриптов, которые отслеживают вывод ethminer, и если они находят слово «Ошибка», они полностью перезапускают установку. Перезагрузка занимает 3 минуты, после чего устройство снова работает на полной разогнанной скорости. Ошибка возникает относительно редко (у меня 2 раза в день).

Я остаюсь при своем мнении: это не связано с разгоном, это связано с внутренним программным обеспечением ethminer для CUDA. Потому что: он явно находится в одной определенной позиции в коде. Разная скорость разгона меняет только программное обеспечение и поведение синхронизации кода CUDA ethminer и ничего больше. Я предполагаю, что дизайнер забыл объект синхронизации в определенной позиции в коде. И этот код случайно запускает сохранение с определенной скоростью.

К сожалению, у меня нет времени просматривать весь код — примите мое мнение и мой тест с этой очень старой версией программного обеспечения как подсказку для правильного поиска и исправления. И, пожалуйста, не слишком полагайтесь на мнение «разогнан = плохо».

ОБНОВЛЕНИЕ 2:

Возможно, я понял, что: если вы используете утилиту ASUS GPU Tweak II, вам следует закрыть ее после того, как вы применили настройку. Поскольку я делаю это при запуске своей установки с помощью сценария, который запускается через 2 минуты после запуска утилиты GPU Tweak, программное обеспечение ethminer больше не сообщает об ошибках. Может быть, программа настройки время от времени выполняет параллельный доступ к графическим картам, и это вызывает ошибку? Или: я заметил, что через некоторое время утилите настройки требуется одно полное ядро процессора, чтобы сделать что-то, чего я не знаю. У меня в установке только два. Возможно, для корректной работы ethminer всегда нужен большой запас ресурсов процессора. Тогда это также может быть проблемой синхронизации программного обеспечения в ethminer.

Возможно, вы можете время от времени проверять, сильно ли ваш процессор загружен, и в это время возникает ошибка, или, может быть, вы можете проверить, работает ли ваша утилита настройки во время майнинга.

ОБНОВЛЕНИЕ 3:

Я поигрался с некоторыми настройками приоритета для ethminer.exe и понял: если я поставлю его на высокий приоритет, ошибки CUDA появятся очень скоро. Таким образом, это подчеркивает мое предположение о том, что у ethminer.exe есть проблема с асинхронизацией в целом. Может быть, кто-то использовал сообщения Boost и считает их потокобезопасными. Но они не нити экономии. Во время программирования с потоками нужно заботиться о каждой разделяемой памяти или дескрипторе. Я бы начал анализ многопоточности программного обеспечения и проверить, правильно ли спроектировано все, что связано с общей памятью.

Это конец моей статьи по этой теме 🙂

С наилучшими пожеланиями, Матиас

имеют те же проблемы, несколько моделей 1060 после 10/20 минут сбоя, забавная часть — 3 установки 8 карт каждая клонированные диски, 1 работает без проблем, другие 2 сбоя

Я могу подтвердить, что это происходит в Ubuntu 17.10, cuda 8 с драйверами по умолчанию (я полагаю, 375,66) с 1060 и 1050Ti, оба OC +1600.
Обе карты выходят из строя одновременно, и ethminer останавливается, но остановить и запустить снова тривиально, поэтому я думаю, что сторожевой таймер — лучшее решение (кроме непосредственного обнаружения и устранения проблемы).
Раньше клеймор 9.5, казалось, работал нормально более 24 часов, но, возможно, он выходил из строя и тихо восстанавливался.

Изменить: я имел в виду Ubuntu 17.04

Согласитесь с дает сбой при запуске Claymore 9.5 и 9.7 с довольно высокими разгонами, но сторожевой таймер перезапускает майнер автоматически и не дает никаких подробностей о том, почему он разбился.

@MatthiasThoemel, не могли бы вы опубликовать свой скрипт Windows 10 для автоматической перезагрузки при ошибке?

@dhjw Спасибо за сценарий. Я использую его для автоматического перезапуска ethminer в случае сбоя. Но пока это не провалилось! (Я пытаюсь уменьшить ограничения мощности, чтобы увидеть, влияет ли это на время отказа).

@dhjw Я ловлю ложные срабатывания вашего скрипта. Не уверен, почему, но иногда после получения новой работы я получаю отчет о 0,00Mh / s без каких-либо ошибок, и, если оставить его наедине, майнер мог продолжить. Однако ваш скрипт убивает его и перезапускает. Так как я получаю это примерно раз в час или около того, я изменил скрипт, чтобы искать строку «Ошибка CUDA» вместо «0.00Mh / s», которая, надеюсь, улавливает только истинные ошибки, по-прежнему лидируя с этой проблемой.

ℹ 18:33:06|stratum Received new job #0b7eeb3f ℹ 18:33:06|cudaminer0 set work; seed: #9e972470, target: #00000000dbe6 ℹ 18:33:06|cudaminer1 set work; seed: #9e972470, target: #00000000dbe6 m 18:33:06|ethminer Mining on PoWhash #0b7eeb3f : 0.00MH/s [A4+0:R0+0:F0] m 18:33:10|ethminer Mining on PoWhash #0b7eeb3f : 39.06MH/s [A4+0:R0+0:F0] m 18:33:14|ethminer Mining on PoWhash #0b7eeb3f : 39.32MH/s [A4+0:R0+0:F0] m 18:33:18|ethminer Mining on PoWhash #0b7eeb3f : 39.58MH/s [A4+0:R0+0:F0]
Изменить: добавлен образец вывода из майнера.

Из моих 4 горнодобывающих установок только одна постоянно дает сбой. Ниже приведены журналы сбоев с этой установки на сегодняшний день, всего 8 (пока). Если порядок имеет значение, 7 из 8 сбоев начались с cudaminer3. Это интересно, потому что это говорит мне, что это определенно связано с разгоном. В то время как в прошлом я видел сбой карты и в конечном итоге требовал перезапуска ethminer, эта ошибка приводит к сбою всех карт сразу. Но основная причина все еще кажется одной плохой картой, если этот порядок действительно говорит.

В конце концов, я бы расставил приоритеты в работе с перезапуском ethminer (хотя мой сценарий Pulse отлично работает) вместо того, чтобы пытаться выяснить, почему разгон делает это.

Я уменьшил разгон на gpu3 и дам вам знать, что происходит.

miner.201707110950:  ✘  09:49:39|cudaminer3  Error CUDA mining: an illegal memory access was encountered
miner.201707110950:  ✘  09:49:39|cudaminer5  Error CUDA mining: an illegal memory access was encountered
miner.201707110950:  ✘  09:49:39|cudaminer2  Error CUDA mining: an illegal memory access was encountered
miner.201707110950:  ✘  09:49:39|cudaminer4  Error CUDA mining: an illegal memory access was encountered
miner.201707110950:  ✘  09:49:39|cudaminer0  Error CUDA mining: an illegal memory access was encountered
miner.201707110950:  ✘  09:49:39|cudaminer1  Error CUDA mining: an illegal memory access was encountered

miner.201707111324:  ✘  13:23:55|cudaminer2  Error CUDA mining: an illegal memory access was encountered
miner.201707111324:  ✘  13:23:55|cudaminer3  Error CUDA mining: an illegal memory access was encountered
miner.201707111324:  ✘  13:23:55|cudaminer0  Error CUDA mining: an illegal memory access was encountered
miner.201707111324:  ✘  13:23:55|cudaminer4  Error CUDA mining: an illegal memory access was encountered
miner.201707111324:  ✘  13:23:55|cudaminer1  Error CUDA mining: an illegal memory access was encountered
miner.201707111324:  ✘  13:23:55|cudaminer5  Error CUDA mining: an illegal memory access was encountered

miner.201707111336:  ✘  13:36:11|cudaminer3  Error CUDA mining: an illegal memory access was encountered
miner.201707111336:  ✘  13:36:11|cudaminer0  Error CUDA mining: an illegal memory access was encountered
miner.201707111336:  ✘  13:36:11|cudaminer2  Error CUDA mining: an illegal memory access was encountered
miner.201707111336:  ✘  13:36:11|cudaminer4  Error CUDA mining: an illegal memory access was encountered
miner.201707111336:  ✘  13:36:11|cudaminer5  Error CUDA mining: an illegal memory access was encountered
miner.201707111336:  ✘  13:36:11|cudaminer1  Error CUDA mining: an illegal memory access was encountered

miner.201707111448:  ✘  14:48:25|cudaminer3  Error CUDA mining: an illegal memory access was encountered
miner.201707111448:  ✘  14:48:25|cudaminer4  Error CUDA mining: an illegal memory access was encountered
miner.201707111448:  ✘  14:48:25|cudaminer5  Error CUDA mining: an illegal memory access was encountered
miner.201707111448:  ✘  14:48:25|cudaminer2  Error CUDA mining: an illegal memory access was encountered
miner.201707111448:  ✘  14:48:25|cudaminer0  Error CUDA mining: an illegal memory access was encountered
miner.201707111448:  ✘  14:48:25|cudaminer1  Error CUDA mining: an illegal memory access was encountered

miner.201707111704:  ✘  17:03:37|cudaminer3  Error CUDA mining: an illegal memory access was encountered
miner.201707111704:  ✘  17:03:37|cudaminer4  Error CUDA mining: an illegal memory access was encountered
miner.201707111704:  ✘  17:03:37|cudaminer2  Error CUDA mining: an illegal memory access was encountered
miner.201707111704:  ✘  17:03:37|cudaminer1  Error CUDA mining: an illegal memory access was encountered
miner.201707111704:  ✘  17:03:37|cudaminer0  Error CUDA mining: an illegal memory access was encountered
miner.201707111704:  ✘  17:03:37|cudaminer5  Error CUDA mining: an illegal memory access was encountered

miner.201707111814:  ✘  18:13:30|cudaminer3  Error CUDA mining: an illegal memory access was encountered
miner.201707111814:  ✘  18:13:30|cudaminer1  Error CUDA mining: an illegal memory access was encountered
miner.201707111814:  ✘  18:13:30|cudaminer2  Error CUDA mining: an illegal memory access was encountered
miner.201707111814:  ✘  18:13:30|cudaminer5  Error CUDA mining: an illegal memory access was encountered
miner.201707111814:  ✘  18:13:30|cudaminer4  Error CUDA mining: an illegal memory access was encountered
miner.201707111814:  ✘  18:13:30|cudaminer0  Error CUDA mining: an illegal memory access was encountered

miner.201707111818:  ✘  18:17:44|cudaminer3  Error CUDA mining: an illegal memory access was encountered
miner.201707111818:  ✘  18:17:44|cudaminer0  Error CUDA mining: an illegal memory access was encountered
miner.201707111818:  ✘  18:17:44|cudaminer5  Error CUDA mining: an illegal memory access was encountered
miner.201707111818:  ✘  18:17:44|cudaminer2  Error CUDA mining: an illegal memory access was encountered
miner.201707111818:  ✘  18:17:44|cudaminer1  Error CUDA mining: an illegal memory access was encountered
miner.201707111818:  ✘  18:17:44|cudaminer4  Error CUDA mining: an illegal memory access was encountered

miner.201707111919:  ✘  19:19:04|cudaminer3  Error CUDA mining: an illegal memory access was encountered
miner.201707111919:  ✘  19:19:04|cudaminer4  Error CUDA mining: an illegal memory access was encountered
miner.201707111919:  ✘  19:19:04|cudaminer5  Error CUDA mining: an illegal memory access was encountered
miner.201707111919:  ✘  19:19:04|cudaminer2  Error CUDA mining: an illegal memory access was encountered
miner.201707111919:  ✘  19:19:04|cudaminer1  Error CUDA mining: an illegal memory access was encountered
miner.201707111919:  ✘  19:19:04|cudaminer0  Error CUDA mining: an illegal memory access was encountered

Как я упоминал в другом сообщении о проблеме (№ 94), сначала он работал около 48 часов, затем у меня были эти ошибки 2 раза, каждая примерно через 1,5 часа.
Затем просто из любопытства я снизил OC на тактовой частоте памяти с +700 до +650 МГц (частота ядра +0, целевое значение мощности — 90%). Эти настройки применяются ко всем картам. Включил майнинг, и с тех пор он работает. (9 июля)
Может, это что-то значит, а может и нет, потому что я видел комментарии о сбоях на стандартных часах.
Может быть, он снова вылетит сегодня, но интересно, что это произошло 2 раза за 3 часа, а затем работает более 4 дней без каких-либо проблем.

Я второй @ aiden1408 . Вчера я увеличил OC с 1600 до 1700 (mem) и смог получить 4 ошибки за 5 минут. Раньше вылетало 2-3 раза в день.

кто-нибудь еще знает, что вызвало проблему? OC _не должно_ быть проблемой, в конце концов, это майнер.

@saidmasoud

(…) сторожевой таймер автоматически перезапускает майнер (…)

Не могли бы вы предоставить дополнительную информацию о том, как вы реализуете сторожевой таймер в этом случае?

@ piotr-dobrogost Я сам не реализовывал его, он входит в состав программного обеспечения для майнинга Claymore и включен по умолчанию. В настоящее время я использую Claymore, пока не будет исправлено решение этой проблемы.

У меня та же проблема. У меня есть 3 рига с использованием gtx 1060s pny / evga. У меня 9 PNY gtx 1060 xlr8, 6 из них работают нормально, но три из них не принимают такой же разгон, и даже когда я понижаю их OC, они вылетают сразу или через некоторое время. когда я запускаю графические процессоры без OC, они показывают «обнаружена недопустимая память», поэтому мне нужно использовать ядро -400, чтобы запустить их, но все равно происходит сбой !!!

РЕДАКТИРОВАТЬ: Между тем я решительно поддерживаю решение Orkblutts https://github.com/orkblutt/MinerLamp .
Он требует меньше системных ресурсов, работает стабильно и отлично выглядит.

Решение Powershell для сбоев CUDA

Итак, это решение PowerShell, которое уже несколько дней работает без проблем. Вы можете настроить свои карты, не беспокоясь о том, что ethminer столкнется с обсуждаемой ошибкой. Нет необходимости устанавливать дополнительное программное обеспечение или сторонние инструменты …

Не стесняйтесь совершенствоваться. Из-за тестирования скрипта у меня было несколько простоев моей установки, поэтому пожертвования очень приветствуются 🙂 [0x76DC203d1cd70262459cEf56AdE865613c4b9693]

Это экран вывода:
output

Инструкции:

=> Создайте run.bat, но используйте вызов PowerShell для вывода файла журнала Tee — tee создает файл журнала, который в дальнейшем обрабатывается Powershell
Сохраните текст в run.bat в том же каталоге, что и ethminer. Исключите файл ps1 — и надеюсь, наслаждайтесь

« »
setx GPU_FORCE_64BIT_PTR 0
setx GPU_MAX_HEAP_SIZE 100
setx GPU_USE_SYNC_OBJECTS 1
setx GPU_MAX_ALLOC_PERCENT 100
setx GPU_SINGLE_ALLOC_PERCENT 100
powershell «./ethminer.exe —cuda-parallel-hash 4 —farm-recheck 150 -U -S eth-eu1.nanopool.org:9999 -FS eth-eu2.nanopool.org:9999 -O 0xYOURADRESS 2> & 1 | тройник log.txt «
Выход
« «

=> Это основной скрипт Powershell (не забудьте включить выполнение скрипта PowerShell в Windows). Чтобы уменьшить проблемы с памятью, скрипт открывается и через некоторое время закрывает задания (но майнинг продолжается). Вставьте текст в файл * .ps1 и сохраните его в каталоге ethminer.

« »
function JobOpen {
$ Host.UI.RawUI.CursorPosition = New-Object System.Management.Automation.Host.Coordinates 0,13

gci log.txt | % { $sb = [scriptblock]::create("get-content -wait $_") ; start-job -Name LOGSEARCH -ScriptBlock $sb }

$ null = $ (получить задание | получить задание)
# сон 1

}

function JobClose {
Stop-Job -Name LOGSEARCH
устроиться на работу | Удалить работу
[System.GC] :: Collect ()
# сон 1
}

function EthRestart {

#cls
#Write-Host "#######################################################################################################"
#$Host.UI.WriteLine($(get-job | receive-job))
 stop-process -Name ethminer
 sleep 2
 RemoveLog
 sleep 2
 Start-Process .run.bat
 sleep 2

}

function RemoveLog {
$ strFileName = «. log.txt»
Если (Test-Path $ strFileName) {
Удалить элемент $ strFileName -Force
} Else {
# // Файл не существует
}
}

function statOutput {

$Host.UI.RawUI.CursorPosition = New-Object System.Management.Automation.Host.Coordinates 0,0
        Write-Host "Start:    $orgstartdate"
$Host.UI.RawUI.CursorPosition = New-Object System.Management.Automation.Host.Coordinates 50,0
        Write-Host "Nowdate:   $nowdate"
$Host.UI.RawUI.CursorPosition = New-Object System.Management.Automation.Host.Coordinates 0,1
        write-host "Restart:  $ethstartdate"
$Host.UI.RawUI.CursorPosition = New-Object System.Management.Automation.Host.Coordinates 50,1
        write-host "#Restarts: $i"
$Host.UI.RawUI.CursorPosition = New-Object System.Management.Automation.Host.Coordinates 0,2
        write-host "Jobstart: $jobstartdate"

}

$ i = 0
$ s = 0
$ orgstartdate = дата получения
$ ethstartdate = дата получения
$ jobstartdate = Get-Date
$ nowdate = Дата получения

$ d = Get-Date

RemoveLog
спать 2
Пуск-процесс. Run.bat
спать 7

$ Host.UI.RawUI.CursorPosition = New-Object System.Management.Automation.Host.Coordinates 0,10
gci log.txt | % {$ sb = [блок сценария] :: create («get-content -wait $ _»); start-job -Name LOGSEARCH -ScriptBlock $ sb}

спать 1

в то время как (1) {
statOutput
if (($ nowdate — $ ethstartdate) .totalseconds -ge 15) {
$ Host.UI.RawUI.CursorPosition = New-Object System.Management.Automation.Host.Coordinates 0,20
$ Host.UI.WriteLine ($ (get-job | receive-job -Keep | select -last 1))
$ m = $ (get-job | receive-job | select -last 50 | Select-String «Ошибка майнинга CUDA»)

if($m -ne $null) { 
    $i++
    JobClose
    ethrestart
    $ethstartdate= Get-Date
            JobOpen
    $jobstartdate=$nowdate        

       }

}
$ null = $ (получить задание | получить задание)

спать -м 50
$ nowdate = Дата получения
$ s ++

if ($ s -ge 6000) {
$ Host.UI.RawUI.CursorPosition = New-Object System.Management.Automation.Host.Coordinates 0,5
$ nowdate = Дата получения
Write-Host «НАЧАТЬ СБОР МУСОРА $ nowdate»
спать 1
$ nowdate = Дата получения
$ Host.UI.RawUI.CursorPosition = New-Object System.Management.Automation.Host.Coordinates 0,5
Write-Host «СБОР МУСОРА завершен $ nowdate»
$ s = 0
}

if (($ nowdate — $ jobstartdate) .totalseconds -ge 60000) {
РаботаЗакрыть
JobOpen
$ jobstartdate = $ nowdate
}

if (($ nowdate — $ ethstartdate) .totalseconds -ge 7200) {
$ i ++
РаботаЗакрыть
ethrestart
$ ethstartdate = Get-Date
JobOpen
$ jobstartdate = $ nowdate

}
}
Выход

« »

У меня такая же проблема с разогнанной GTX 1070. Я поставил +100 GPU и +1300 памяти. После этого майнер Claymore и ethminer сообщают о сбоях.
Когда я выставляю 900-1000 для памяти, сбои происходят каждые 10-15 минут, это приемлемо, но я этого не хочу; /

У меня Ubuntu 17.04, драйвер NVIDIA: 375.66 и CUDA из репозитория apt.
В настоящее время у меня +100 GPU и +1000 памяти, и у меня 185 MH / s на 6 картах.

У меня 6 x Asus ROG STRIX GTX 1070 O8G-GAMING

miner_lamp

Моя установка не работает на Ubuntu, но у меня была та же проблема. Проблема впервые возникла после того, как я добавил 5-ю карту (Evga GTX 1060 6 ГБ) к уже работающему компьютеру 4 x Evga GTX 1060 6 ГБ. После некоторого теста я заметил, что пятый графический процессор имел микронную память ddr5 и использовал другую версию vbios по сравнению с другими 4 графическими процессорами. Сегодня я прошил биос графического процессора и обновил его до той же версии, что и другие. Графический процессор по-прежнему не может обрабатывать OC-ing, который я использую на устройствах с Samsung gddr, но он стабилен на уровне 50% от их значений разгона. Например, gtx 1060 с Samsung, работающим с памятью +625, с Micron, работающим с +300, оба на 80% мощности. Пока 3 часа без проблем.
До прошивки BIOS вылетал весь майнер даже при стоковом или небольшом разгоне.
Я буду отслеживать и обновлять здесь.
Надеюсь, мои выводы помогут вам в дальнейшем.

Последняя версия -dev (ethminer-0.12.0.dev1), похоже, помогает!

Обновление: к сожалению, это все еще происходит.

Мне кажется, что это слишком явно связано с разгоном. Уменьшите разгон графического процессора, который выходит из строя первым, а оставшееся можно оставить выше. У меня одна карта из 6 более чувствительна и нагревается намного быстрее, чем все остальные, даже от того же производителя. Интересно, можно ли разработать сценарий для автоматического поиска настройки, которая не дает сбоев на каждом графическом процессоре.

Изменить: я отказался от настройки «карты, которая вылетает первой», так как считаю ее неточной. Я убиваю ethminer и перезапускаю его, когда это происходит, но теперь я уменьшаю разгон только тогда, когда карта отключается.

@dhjw, так почему старая версия у меня работает без сбоев при точно таком же разгоне?

Не уверен, что @ spyrek10, но я

В моем случае проблема была (или, по крайней мере, я на это надеюсь, 48 часов без проблем) вызвана уменьшением SATA-> MOLEX в USB-переходнике с питанием, он становился очень ГОРЯЧИМ (около 70 ° C), и, например, майнер EWBF выходил через несколько секунд после запуска. Замена прямого включения SATA-> MOLEX и питания с MOLEX на блок питания решила мои проблемы (в Windows и Linux).

@dafyk У меня была такая же проблема с высокой температурой кабеля в MOLEX-SATA POWER. Я заменил провод только на sata power, работает нормально.

@orkblutt — мне очень нравится ваше решение, но по какой-то причине в моей системе происходит сбой minerlamp. Сама программа работает, но вскоре после запуска майнинга Windows сообщает, что программа перестала работать. При дальнейших попытках ethminer вообще не запустится. В вашей программе или вне ее. Мне нужно перезагрузиться.

Если разработчики читают это, я надеюсь, что функция сторожевого пса занимает первое место в списке приоритетов. Я до сих пор отказывался использовать Клеймор, потому что мне не нравится то, что он означает. Не так много гонораров, но для меня нет никаких сомнений в том, что он разорвал оптимизацию CUDA genoils. Это неверно. Затем есть влияние, которое его переключение на сервер с оплатой за разработку оказывает на серверы пула, но это дискуссия для другого места.

Ethminer — лучший майнер ETH, и не требует ничего, кроме пожертвования (которое я с радостью делаю). Только для майнинга ETH у Claymore нет никакой выгоды, кроме сторожевого пса. Я надеюсь, что у ethminer есть такой, так что мне даже не придется думать о том, чтобы заплатить ему ни цента. Спасибо за ваш тяжелый труд.

Просто последнее замечание. Я определенно смог увеличить разгон памяти на приличную величину (+100, 4×1060) с гораздо меньшим количеством сбоев, используя последние версии ethminer 0.12 dev. Мне довольно удобно оставлять майнер перезапусками с интервалом в час. Сбой происходит один или два раза в день. Я никак не мог сделать это раньше с этими часами. Может быть, эти новые карты просто мне теперь приятнее (что маловероятно), или разработчики уже занимаются этой проблемой. Я надеюсь, что это так. Сторожевой пес все равно даст необходимое спокойствие.

Спасибо @derubm. Кажется, теперь Minerlamp работает нормально. Я не возвращался к 0.11, чтобы узнать, есть ли какие-то проблемы с этой версией в моей системе. Просто забираю победу :). Отличная работа @orkblutt. Спасибо.

Привет, ребята!

Только что начал майнинг, после ответа @ michael-pesce я сделал «простой» сторожевой таймер с помощью сценария bash, и я запускаю все с супервизором (я использую его, потому что я вспомнил, что контейнеры Docker использовали его в первые дни)

Это доступно здесь:

https://github.com/joantune/ethminerWatchdog

Это сторожевой таймер Linux для Nvidia, но он может быть адаптирован для других карт.

Я запускаю его на screen пока все хорошо, прочтите Readme об этом

Привет, я тоже в той же лодке, что и все остальные.

Думаю, я попробую MinerLamp (в Windows).

Для Linux я, вероятно, попробую ethminerWatchdog от joantune, решение кажется изящным, если супервизор хорош.
Но я хотел спросить, пробовал ли кто-нибудь этот монитор на базе Python https://github.com/philon123/MinerMon ?

Также, чтобы добавить к обсуждению проблемы, может ли это быть проблема, связанная с используемой версией CUDA?
Интересно после того, как обнаружил этот выпуск №53, который репортер закрыл самостоятельно.

В Windows я заплатил относительно небольшую сумму за Awesome Miner и остался доволен.

В Ubuntu я до сих пор использую собственные сценарии, и это меня не подвело. Рад поделиться более подробной информацией, если люди заинтересованы.

поскольку этот еще не закрыт: как уже упоминали многие майнеры:
Недопустимая ошибка доступа к памяти возникает в случае карт Nvidia из-за того, что карта работает с максимальной разогнанной памятью в состоянии питания 2. Когда ваш майнер по какой-либо причине переключается в состояние P0, память получает дополнительные 200 МГц и может (или будет) стать нестабильным, что вызывает эту ошибку.

Решение без Watchdog: установите майнинг-ферму в состояние P0 (старая версия Windows Nvidiainspector, раздел 5, установите принудительное состояние P2 в «выключено») в Linux, вы должны иметь возможность сделать это уже с помощью nvidia-smi.)

.Пояснение:
Когда вы запускаете свой майнер в состоянии P0, превышение тактовой частоты памяти больше не будет появляться на максимальном уровне (зависит от марки памяти) GDDR5 (например, память Samsung: +710 в состоянии P0, +910 в состоянии P2, скорость памяти в обоих случаях: 4714 МГц в Windows (x2 в Linux для отображения)), поэтому в состоянии p2 вы будете запускать +910, затем состояние p0 будет зафиксировано, и у вас будет не +910, а +1110 — что вызывает сбой.
Если вы запускаете свою карту с самого начала с состоянием P0, она не может работать выше, чем предполагалось (+710 в моем случае, например, в состоянии P0), поэтому сбой больше не будет.

Пример инспектора Nvidia с номером версии и разделом, который необходимо изменить:

Примечание: после обновления драйвера вам необходимо снова установить состояние P0!
также: обратите внимание, что вы должны установить на 200 МГц меньше разгона, так как состояние P0 уже добавляет эти 200!
возможно, такие вещи можно будет включить в readme на правильном английском языке.

@derubm спасибо за четкий ввод!
У меня не было проблем с незаконным доступом к памяти с момента переключения в состояние P0 с помощью NVIDIA Profile Inspector 2.1.3.10 (Force P2 State -> Off). То есть в Windows 10 с одной GTX 1070.
По какой-то причине он долгое время работал стабильно с P2 на моей другой машине Windows 10 с четырьмя GTX1060. Но я думаю, что перейду на P0 и там, на всякий случай.

В Linux мне не удалось переключиться на P0, сейчас карты переходят в состояние P0, когда они простаивают, но когда я запускаю ethminer, они переходят на P2.
@ michael-pesce Мне очень интересны любые предложения по хорошим решениям, не стесняйтесь делиться своими знаниями о сценариях 🙂

В Linux он остается на уровне P2, но вы все равно можете разогнать карты до такой степени, насколько это возможно. Это зависит от каждой карты, но я получаю от 22,52 до 25,10 на GTX 1060. Обычно я устанавливаю карту немного выше, затем наблюдаю, какой хешрейт выходит из нее, чтобы определить тип памяти (~ 22-23 микрона, ~ 25 samsung), а затем уменьшать его до стабильного состояния и не отключаться.

[rig1] ethminer Speed 144,06 Mh / s gpu / 0 23,00 gpu / 1 24,94 gpu / 2 22,52 gpu / 3 24,86 gpu / 4 25,10 gpu / 5 23,65
[rig2] ethminer Speed 163,83 Mh / s gpu / 0 23,40 gpu / 1 22,76 gpu / 2 23,48 gpu / 3 23,40 gpu / 4 25,02 gpu / 5 22,92 gpu / 6 22,84

Я делаю свою конфигурацию по UUID устройства, чтобы не перепутать. Вот мой сценарий установки и файл настроек . Отправьте мне ETH на 0x5f8f7166c9920ea2d786e0810defdc611544fbfe 🙂

кто-нибудь знает, как заставить P0 State работать в Linux на GTX 1070s? большая часть / вся информация там не работает, поэтому любая ссылка будет принята с благодарностью.

По моему опыту, в Linux нормально оставаться на P2. Это не влияет на то, сколько вы можете разогнать или на скорость, которую вы получите.

У меня тоже есть в Ubuntu 16.04. Проблема с этой ошибкой (обнаружен незаконный доступ к памяти) заключается в том, что она входит в бесконечный цикл и требует завершения вручную. После перезапуска майнер нормально работает еще, скажем, 30 минут.

Почему бы не сделать счетчик для этого сообщения и, скажем, после 50 последовательных сообщений просто перезапустить майнер или выйти, чтобы мы могли перезапустить его с помощью сценария оболочки?

Чтобы перезапустить ethminer автоматически, запустите его так:

while [ 1 ]; do ethminer --farm-recheck 200 -U -F http://127.0.0.1:8080/ имя хоста 2>&1 | mine-monitor; done

Вот мой сценарий мониторинга шахты . Для этого требуется PHP и рабочая система электронной почты, такая как postfix, настроенная с помощью Gmail.

Если вы все еще получаете эти ошибки, это означает, что одна из ваших карт слишком разогнана. Когда карта в конечном итоге выходит из строя, немного уменьшите разгон и перезагрузитесь. В конце концов вы больше не должны получать ошибок.

Это мой опыт работы с 7 x ASUS GeForce DUAL-GTX1060 — O6G (редактировать: в настоящее время 9) на установке Win10 на ASRock H110 Pro BTC + с ethminer 0.12 (и Claymore в качестве короткого теста)
Сначала я тестировал только 2 карты, но это соответствует 7 (скоро я добавлю еще как минимум 2, возможно, до 5).
Я тестировал один процесс ethminer для всех графических процессоров и отдельный процесс для каждого графического процессора, а также с комбинациями типа 1 + 6 и т. Д. Лучший результат был при запуске отдельных процессов для каждого графического процессора — в случае сбоя выпадает только одна карта. . Когда какой-то графический процессор начинает выходить из строя, обычно он снова выходит из строя в течение минуты, поэтому нет смысла снова перезапускать процесс (я не проверял, даст ли перезагрузка лучший результат … Я только начал тестирование, поэтому я не зашел так далеко — мне нужно чтобы настроить несколько вещей с отложенным запуском Asus GPU Tweak II и его последующим выключением, подробнее о причине читайте ниже).

Всегда есть одна карта (обычно одна и та же), на которой ethminer выдает сообщение об ошибке.
«Ошибка CUDA в функции ‘ethash_cuda_miner :: search’ в строке 346: неопределенная ошибка запуска»
С двумя графическими процессорами он был на card0, с 7 теперь (обычно) на card1.

Монитор теперь подключен к встроенному графическому процессору Intel, поэтому теоретически RDP не должен влиять на результат, хотя мне нужно исследовать это еще немного (я использовал RDP раньше, когда проверял / тестировал вещи, поэтому я не совсем уверен, влияет ли это на исход).
Я считаю, что я довольно консервативен с OC, и я снизил скорость памяти на 200 (до 9,300) по сравнению с рекомендованными для оптимальной скорости хеширования / энергопотребления (65% — 65 градусов) на всякий случай (сообщается 22, 9MH / s / карта). Карты относятся к модели «OC», поэтому я не могу снизить скорость графического процессора ниже значения «min», указанного в интерфейсе настройки графического процессора (1.607).
К вашему сведению, я использую Asus GPU Tweak II — боль в заднице из-за некоторых сбоев, таких как сброс моих настроек каждый раз, когда что-то идет не так с графическим процессором, и настройка графического процессора работает в фоновом режиме, что означает, что я запускаю его один раз в начале и закрою это впоследствии, чтобы предотвратить это (редактировать: добавление новой карты сбрасывает значения до значений по умолчанию, поэтому необходимо устанавливать значения каждый раз, когда конфигурация графического процессора изменяется + когда что-то ломается, например, зависает ОС).

Если одна карта выходит из строя, все остальные работают стабильно (по крайней мере, в течение 8 часов, мой самый продолжительный тест).
Попытка использовать Claymore на неисправной карте приводит к тому, что ошибка переносится на карту2, а скорость хеширования для Claymore составляет около 19 MH / s. Другими словами, альтернатива 6 ethminers + 1 Claymore тоже не сработает.

Я опубликую некоторые обновления после того, как протестирую еще несколько вещей, например, что произойдет без использования RDP или Teamviewer, которые я использовал в другой системе для перезагрузки, где у меня есть 1 x AMD Vega 64 + 1 x Asus GTX 1060 6G (не OC ) и где 1060 обычно выпадает каждые 24-48 часов, поэтому я использовал Teamviewer для доступа к компьютеру из-за границы. Я не уверен, может ли сам Teamviewer быть источником каких-либо проблем (я тоже запускаю его на своей установке 7xGPU).

После последней перезагрузки я не использовал RDP, и до сих пор он работал без проблем в течение 45 минут, что многообещающе.

Я также использовал одну «установку» с двумя ASUS GeForce DUAL-GTX1060 — O6G на MacPro (2011) с Ubuntu 16.04 + ethminer Rock стабильной (это правильный английский?;)) В течение нескольких недель, хотя мне не удалось настроить память / Скорость графического процессора (только заданная мощность), поэтому она имеет в среднем 35,4 MH / s. Я планирую в конечном итоге переместить эти 2 GPU на установку ASRock.
Если я выясню, как настроить скорость памяти / графического процессора в Linux, я планирую / надеюсь выбросить Windows, поэтому любые советы приветствуются. Я погуглил несколько, с которыми не смог заставить работать (честно говоря, я пока не тратил на это так много времени — было еще несколько дел).

Редактировать 1. 2 часа спустя: нет RDP => нет ошибки (похоже).

Я только что подключил 8-й графический процессор и вернусь с обновлением. К сожалению, у меня больше нет доступных разъемов питания PCIe, и похоже, что вторичный блок питания пытается быть умным и не будет обеспечивать ток для GPU / SATA без пороговой нагрузки на разъем питания ATA … или мой новый блок питания не работает (маловероятно, но я еще не совсем уверен).

Пока есть явные признаки того, что указанная ошибка (напрямую) связана с ошибкой RDP с / для ethminer.

Редактировать 2.
После подключения 8-го графического процессора система снова стала нестабильной (без подключения RDP), поэтому несколько настроек позже (скорость памяти до 9,100) + пара перезагрузок снова стала стабильной (на один час).
Затем я нашел способ подключения скремблирования 9-го графического процессора со всех имеющихся у меня кабелей: type4 на 4 x AMP MATE-N-LOK + Molex на питание PCIe / Molex на питание sata. В то же время я заказал 20 кабелей разветвителя питания PCIe на AliExpress по 1,29 доллара за штуку, так что через 3-4 недели я смогу собрать еще 12-13 GPU с одним блоком питания для каждого (1.200 Вт).

В любом случае, вернемся к установке: первая Windows застряла, потому что я слишком рано запустил первый майнер (до того, как GPU Tweak смог полностью выключиться — я знаю нетерпение :)). Кнопка сброса и после входа в систему и запуска майнеров 9-я стала жаловаться на ошибку «нехватка памяти». Несколько позже настроек со значениями подкачки закончились на 35,000 / 45,000 МБ — мин / макс, и я смог запустить даже 9-й майнер.
Спустя 20 минут по-прежнему нет ошибок, сообщается о среднем хешрейте 22,6MH / s.
Если так и останется, я был бы более чем доволен 🙂

Изменить 3. 50 минут спустя — все еще без ошибок
Вопрос: Есть предложения по выбору между GTX1060 «normal» или «OC». Я заказал 10 OC, потому что «нормальных» не было в наличии, а предполагаемый срок доставки — несколько недель. Цена была на несколько долларов дешевле, хотя я бы остановился на «нормальных», если бы они были доступны одновременно. Теперь я больше не уверен, что предпочесть майнингу ETH.

Eit 4. Через 15,5 часов ошибок нет, счет продолжается. Текущая заявленная хешрейт: 22,4-22,5, в среднем 20,3 — 24,2 MH / s (в среднем 9: 22,4 MH / s)
Я даже снизил скорость памяти для карты без OC, и ее процесс ethminer еще не дал сбоев (в результате небольшое изменение в хассрейте, хотя, возможно, оно было выше в среднем с тех пор, в настоящее время: 23,8 MH / s)
Так что дело с моей стороны закрыто.

Редактировать 5.
ethminer на card9 выдает ошибку после 23:27 в первый раз и во второй раз примерно через 22 часа.
После второго раза я решил использовать RDP для перезапуска майнера и посмотреть, вызовет ли это более раннюю ошибку (для сравнения с ситуацией без запуска RDP). Я вернусь к вам с обновлением.
Обновление редактировать 5. Та же самая карта выпала в следующий раз через 60: 56ч (RDP использовался 2-3 раза).

Edit 6. 7 дней спустя и все еще работает …

Возьми и мои 5 копеек. На GPU начал майнить неделю назад. На данный момент у меня 14 1070ti — + OC, 2 фермы и майнинг eth с автоматическим перезапуском ethminer, если он останавливается при ошибках. Эти два сценария — не лучшее решение, они написаны с нуля, но работают нормально. Писал только для nvidia но думаю может быть переписан и для ati))
Все это протестировано на Ubuntu 16.04

                                          Ok, Lets go!

!!! Необходимо включить nvidia coolbits, если вы хотите, чтобы настройки OC работали. Мой 13 тестировался на драйверах 381 и 387, эмулированный монитор для каждой карты требовал моей конфигурации nvidia-xconfig для 7 графических процессоров, edid.bin нашел в Google, я сделал свой из AOC 23 мес

nvidia-xconfig: файл конфигурации X, созданный nvidia-xconfig

nvidia-xconfig: версия 387.34 (buildmeister @ swio-display-x64-rhel04-15) Вт, 21 ноября, 03:31:45 PST 2017

Раздел «ServerLayout»
Идентификатор «Layout0»
Экран 0 «Экран0»
Экран 1 «Экран1» Справа от «Экран0»
Экран 2 «Экран2» Справа от «Экран1»
Экран 3 «Экран3» Справа от «Экран2»
Экран 4 «Экран4» Справа от «Экран3»
Экран 5 «Экран5» Справа от «Экран4»
Экран 6 «Экран6» Справа от «Экран5»
InputDevice «Keyboard0» «CoreKeyboard»
InputDevice «Mouse0» «CorePointer»
EndSection

Раздел «Файлы»
EndSection

Раздел «InputDevice»
# генерируется по умолчанию
Идентификатор «Mouse0»
Драйвер «мышь»
Вариант «Протокол» «авто»
Вариант «Устройство» «/ dev / psaux»
Вариант «Emulate3Buttons» «нет»
Вариант «ZAxisMapping» «4 5»
EndSection

Раздел «InputDevice»
# генерируется по умолчанию
Идентификатор «Keyboard0»
Драйвер «kbd»
EndSection

Раздел «Монитор»
Идентификатор «Monitor0»
VendorName «Unknown»
Название модели «Неизвестно»
HorizSync 28,0 — 33,0
VertRefresh 43,0 — 72,0
Вариант «ДПМС»
EndSection

Раздел «Монитор»
Идентификатор «Монитор1»
VendorName «Unknown»
Название модели «Неизвестно»
HorizSync 28,0 — 33,0
VertRefresh 43,0 — 72,0
Вариант «ДПМС»
EndSection

Раздел «Монитор»
Идентификатор «Монитор2»
VendorName «Unknown»
Название модели «Неизвестно»
HorizSync 28,0 — 33,0
VertRefresh 43,0 — 72,0
Вариант «ДПМС»
EndSection

Раздел «Монитор»
Идентификатор «Монитор3»
VendorName «Unknown»
Название модели «Неизвестно»
HorizSync 28,0 — 33,0
VertRefresh 43,0 — 72,0
Вариант «ДПМС»
EndSection

Раздел «Монитор»
Идентификатор «Монитор4»
VendorName «Unknown»
Название модели «Неизвестно»
HorizSync 28,0 — 33,0
VertRefresh 43,0 — 72,0
Вариант «ДПМС»
EndSection

Раздел «Монитор»
Идентификатор «Монитор5»
VendorName «Unknown»
Название модели «Неизвестно»
HorizSync 28,0 — 33,0
VertRefresh 43,0 — 72,0
Вариант «ДПМС»
EndSection

Раздел «Монитор»
Идентификатор «Монитор6»
VendorName «Unknown»
Название модели «Неизвестно»
HorizSync 28,0 — 33,0
VertRefresh 43,0 — 72,0
Вариант «ДПМС»
EndSection

Раздел «Устройство»
Идентификатор «Device0»
Драйвер «nvidia»
VendorName «NVIDIA Corporation»
BoardName «GeForce GTX 1070 Ti»
BusID » PCI: 1 : 0: 0″
EndSection

Раздел «Устройство»
Идентификатор «Устройство1»
Драйвер «nvidia»
VendorName «NVIDIA Corporation»
BoardName «GeForce GTX 1070»
BusID » PCI: 2 : 0: 0″
Вариант «ConnectedMonitor» «DFP-0»
Вариант «CustomEDID» «DFP-0: /etc/X11/edid.bin»
EndSection

Раздел «Устройство»
Идентификатор «Устройство2»
Драйвер «nvidia»
VendorName «NVIDIA Corporation»
BoardName «GeForce GTX 1070»
BusID » PCI: 3 : 0: 0″
Вариант «ConnectedMonitor» «DFP-0»
Вариант «CustomEDID» «DFP-0: /etc/X11/edid.bin»
EndSection

Раздел «Устройство»
Идентификатор «Устройство3»
Драйвер «nvidia»
VendorName «NVIDIA Corporation»
BoardName «GeForce GTX 1070 Ti»
BusID » PCI: 5 : 0: 0″
Вариант «ConnectedMonitor» «DFP-0»
Вариант «CustomEDID» «DFP-0: /etc/X11/edid.bin»
EndSection

Раздел «Устройство»
Идентификатор «Device4»
Драйвер «nvidia»
VendorName «NVIDIA Corporation»
BoardName «GeForce GTX 1070 Ti»
BusID » PCI: 6 : 0: 0″
Вариант «ConnectedMonitor» «DFP-0»
Вариант «CustomEDID» «DFP-0: /etc/X11/edid.bin»
EndSection

Раздел «Устройство»
Идентификатор «Device5»
Драйвер «nvidia»
VendorName «NVIDIA Corporation»
BoardName «GeForce GTX 1070 Ti»
BusID » PCI: 7 : 0: 0″
Вариант «ConnectedMonitor» «DFP-0»
Вариант «CustomEDID» «DFP-0: /etc/X11/edid.bin»
EndSection

Раздел «Устройство»
Идентификатор «Устройство6»
Драйвер «nvidia»
VendorName «NVIDIA Corporation»
BoardName «GeForce GTX 1070»
BusID » PCI: 8 : 0: 0″
Вариант «ConnectedMonitor» «DFP-0»
Вариант «CustomEDID» «DFP-0: /etc/X11/edid.bin»
EndSection

Раздел «Экран»
Идентификатор «Screen0»
Устройство «Device0»
Монитор «Монитор0»
DefaultDepth 24
Вариант «AllowEmptyInitialConfiguration» «True»
Вариант «Coolbits» «13»
Подраздел «Дисплей»
Глубина 24
EndSubSection
EndSection

Раздел «Экран»
Идентификатор «Экран1»
Устройство «Device1»
Монитор «Монитор1»
DefaultDepth 24
Вариант «AllowEmptyInitialConfiguration» «True»
Вариант «Coolbits» «13»
Подраздел «Дисплей»
Глубина 24
EndSubSection
EndSection

Раздел «Экран»
Идентификатор «Экран2»
Устройство «Устройство2»
Монитор «Монитор2»
DefaultDepth 24
Вариант «AllowEmptyInitialConfiguration» «True»
Вариант «Coolbits» «13»
Подраздел «Дисплей»
Глубина 24
EndSubSection
EndSection

Раздел «Экран»
Идентификатор «Экран3»
Устройство «Device3»
Монитор «Монитор3»
DefaultDepth 24
Вариант «AllowEmptyInitialConfiguration» «True»
Вариант «Coolbits» «13»
Подраздел «Дисплей»
Глубина 24
EndSubSection
EndSection

Раздел «Экран»
Идентификатор «Экран4»
Устройство «Device4»
Монитор «Монитор4»
DefaultDepth 24
Вариант «AllowEmptyInitialConfiguration» «True»
Вариант «Coolbits» «13»
Подраздел «Дисплей»
Глубина 24
EndSubSection
EndSection

Раздел «Экран»
Идентификатор «Экран5»
Устройство «Device5»
Монитор «Монитор5»
DefaultDepth 24
Вариант «AllowEmptyInitialConfiguration» «True»
Вариант «Coolbits» «13»
Подраздел «Дисплей»
Глубина 24
EndSubSection
EndSection

Раздел «Экран»
Идентификатор «Экран6»
Устройство «Device6»
Монитор «Монитор6»
DefaultDepth 24
Вариант «AllowEmptyInitialConfiguration» «True»
Вариант «Coolbits» «13»
Подраздел «Дисплей»
Глубина 24
EndSubSection
EndSection

                     Script is for miner loop with OC settings for each GPU. 
                            Settings apply only ones at start if they enabled
                 Just edit it for your needs and run thats all, main part after it

! / bin / sh

nvidia-settings -a GPUFanControlState = 0

nvidia-settings -a GPUGraphicsClockOffset [3] = — 100

nvidia-settings -a GPUMemoryTransferRateOffset [3] = 1200

nvidia-smi -pm 1

nvidia-smi -pl 155

nvidia-settings -a [gpu: 0] / GPUGraphicsClockOffset [3] = — 150

nvidia-settings -a [графический процессор: 0] / GPUMemoryTransferRateOffset [3] = 1200

nvidia-settings -a [графический процессор: 0] / GPUFanControlState = 1

nvidia-settings -a [вентилятор: 0] / GPUTargetFanSpeed = 80

nvidia-settings -a [gpu: 1] / GPUGraphicsClockOffset [3] = — 150

nvidia-settings -a [графический процессор: 1] / GPUMemoryTransferRateOffset [3] = 1450

nvidia-settings -a [графический процессор: 1] / GPUFanControlState = 1

nvidia-settings -a [вентилятор: 1] / GPUTargetFanSpeed = 80

nvidia-settings -a [gpu: 2] / GPUGraphicsClockOffset [3] = — 150

nvidia-settings -a [графический процессор: 2] / GPUMemoryTransferRateOffset [3] = 1150

nvidia-settings -a [графический процессор: 2] / GPUFanControlState = 1

nvidia-settings -a [вентилятор: 2] / GPUTargetFanSpeed = 80

nvidia-settings -a [графический процессор: 3] / GPUGraphicsClockOffset [3] = — 100

nvidia-settings -a [графический процессор: 3] / GPUMemoryTransferRateOffset [3] = 1050

nvidia-settings -a [графический процессор: 3] / GPUFanControlState = 1

nvidia-settings -a [вентилятор: 3] / GPUTargetFanSpeed = 80

nvidia-settings -a [gpu: 4] / GPUGraphicsClockOffset [3] = — 150

nvidia-settings -a [графический процессор: 4] / GPUMemoryTransferRateOffset [3] = 1050

nvidia-settings -a [графический процессор: 4] / GPUFanControlState = 1

nvidia-settings -a [вентилятор: 4] / GPUTargetFanSpeed = 80

nvidia-settings -a [графический процессор: 5] / GPUGraphicsClockOffset [3] = — 100

nvidia-settings -a [графический процессор: 5] / GPUMemoryTransferRateOffset [3] = 800

nvidia-settings -a [графический процессор: 5] / GPUFanControlState = 1

nvidia-settings -a [вентилятор: 5] / GPUTargetFanSpeed = 80

nvidia-settings -a [графический процессор: 6] / GPUGraphicsClockOffset [3] = — 100

nvidia-settings -a [графический процессор: 6] / GPUMemoryTransferRateOffset [3] = 900

nvidia-settings -a [графический процессор: 6] / GPUFanControlState = 1

nvidia-settings -a [вентилятор: 6] / GPUTargetFanSpeed = 80

пока правда; # Это зациклит ваш майнер, даже если вы убьете -9 ethminer, он запустится снова после do
# Чтобы остановить, просто CTRL + C или что угодно =)
делать
/ главная / m1 / Майнер / ethminer -U -S eth-eu2.nanopool. org: 9999 -O 0xb4983146f0047d87c63b5fdb3ef9e2bee4557ea3.M1 / [email protected]
сделанный

                       Thats was not so hard, the main deal is up to go !!! 
                      While our miner script is working  we will run another one 
                                             Script for monitoring

! / bin / sh

-i 5 номер GPU для мониторинга

gpu = nvidia-smi -i 5 --query-gpu=utilization.gpu --format=csv,noheader,nounits

пока правда; # Петли: =))
делать
а [$ gpu -gt 50]
делать
gpu = nvidia-smi -i 5 --query-gpu=utilization.gpu --format=csv,noheader,nounits
echo «Загрузка графического процессора $ gpu»
echo «Все хорошо $ (дата) Загрузка графического процессора $ gpu Без ошибок»
спать 10
сделанный
если [$ gpu -lt 40]
тогда
killall -9 ethminer
echo «Restart Miner GPU load $ gpu $ (date) error»
echo «Ошибка перезапуска майнера $ (дата)» >> /home/m1/Miner/ethminer.log
спать 60
gpu = nvidia-smi -i 5 --query-gpu=utilization.gpu --format=csv,noheader,nounits
fi;
сделанный

Это оно. Доделал вчера. Думаю, может быть меньше. Но ничего не нужно устанавливать, компилировать и т. Д. Всю ночь я тестировал свои графические процессоры с разгоном и мощностью — + очень быстро для проверки тактовых импульсов и + tail -f /var/log/kern.log | grep nvrm, чтобы узнать, какой графический процессор выдает ошибку без длительной остановки фермы.
Если это вам поможет. Я люблю хороший кофе)) b4983146f0047d87c63b5fdb3ef9e2bee4557ea3
Размещено

Привет, хозяин!
У меня есть небольшая установка, но в ней есть похожий xconfig (этот трюк для имитации
Монитор потребовалось время, чтобы изучить), но, возможно, значение coolbits другое,
а также значения oc. Мне нужно попробовать некоторые из ваших значений oc в gtx
1060 Я помню, например, я не мог управлять вентилятором. Я либо имел
неверное значение coolbits или просто не работает с 1060s, но есть
нет ничего лучше, чем пытаться.

Опять же, ваше решение является очень полным, поэтому спасибо, что разместили его здесь.
Как я уже сказал, у меня есть крошечная установка с одним 1060, из которого я выжимаю максимум
23,6 MH / s. Мне было интересно, сколько MH / s вы получаете с одной доски с
те конфиги oc?

В четверг, 21 декабря 2017 г., 08:29 H05ted [email protected] написал:

Возьми и мои 5 копеек. На GPU начал майнить неделю назад. На данный момент у меня 14
1070ti — + OC, 2 фермы и майнинг eth с автоматическим перезапуском ethminer, если он останавливается
об ошибках. Эти два скрипта — не лучшее решение, написанные с нуля, но
работает отлично. Написано только для nvidia, но думаю может быть переписано для ati
тоже ))
                                      Ok, Lets go!
!!! Необходимо включить nvidia coolbits, если вы хотите, чтобы настройки OC работали. Шахта
13 протестировано на драйверах 381 и 387, эмулирован монитор для каждой карты
мой nvidia-xconfig conf для 7 GPU, edid.bin найти в google, я сделал свой из

AOC 23 мес

nvidia-xconfig: файл конфигурации X, созданный nvidia-xconfig nvidia-xconfig:
версия 387.34 (buildmeister @ swio-display-x64-rhel04-15) Вт, 21 ноября
03:31:45 PST 2017

Раздел «ServerLayout»
Идентификатор «Layout0»
Экран 0 «Экран0»
Экран 1 «Экран1» Справа от «Экран0»
Экран 2 «Экран2» Справа от «Экран1»
Экран 3 «Экран3» Справа от «Экран2»
Экран 4 «Экран4» Справа от «Экран3»
Экран 5 «Экран5» Справа от «Экран4»
Экран 6 «Экран6» Справа от «Экран5»
InputDevice «Keyboard0» «CoreKeyboard»
InputDevice «Mouse0» «CorePointer»
EndSection

Раздел «Файлы»
EndSection

Раздел «InputDevice»

генерируется по умолчанию

Идентификатор «Mouse0»
Драйвер «мышь»
Вариант «Протокол» «авто»
Вариант «Устройство» «/ dev / psaux»
Вариант «Emulate3Buttons» «нет»
Вариант «ZAxisMapping» «4 5»
EndSection

Раздел «InputDevice»

генерируется по умолчанию

Идентификатор «Keyboard0»
Драйвер «kbd»
EndSection

Раздел «Монитор»
Идентификатор «Monitor0»
VendorName «Unknown»
Название модели «Неизвестно»
HorizSync 28,0 — 33,0
VertRefresh 43,0 — 72,0
Вариант «ДПМС»
EndSection

Раздел «Монитор»
Идентификатор «Монитор1»
VendorName «Unknown»
Название модели «Неизвестно»
HorizSync 28,0 — 33,0
VertRefresh 43,0 — 72,0
Вариант «ДПМС»
EndSection

Раздел «Монитор»
Идентификатор «Монитор2»
VendorName «Unknown»
Название модели «Неизвестно»
HorizSync 28,0 — 33,0
VertRefresh 43,0 — 72,0
Вариант «ДПМС»
EndSection

Раздел «Монитор»
Идентификатор «Монитор3»
VendorName «Unknown»
Название модели «Неизвестно»
HorizSync 28,0 — 33,0
VertRefresh 43,0 — 72,0
Вариант «ДПМС»
EndSection

Раздел «Монитор»
Идентификатор «Монитор4»
VendorName «Unknown»
Название модели «Неизвестно»
HorizSync 28,0 — 33,0
VertRefresh 43,0 — 72,0
Вариант «ДПМС»
EndSection

Раздел «Монитор»
Идентификатор «Монитор5»
VendorName «Unknown»
Название модели «Неизвестно»
HorizSync 28,0 — 33,0
VertRefresh 43,0 — 72,0
Вариант «ДПМС»
EndSection

Раздел «Монитор»
Идентификатор «Монитор6»
VendorName «Unknown»
Название модели «Неизвестно»
HorizSync 28,0 — 33,0
VertRefresh 43,0 — 72,0
Вариант «ДПМС»
EndSection

Раздел «Устройство»
Идентификатор «Device0»
Драйвер «nvidia»
VendorName «NVIDIA Corporation»
BoardName «GeForce GTX 1070 Ti»
BusID » PCI: 1 : 0: 0″
EndSection

Раздел «Устройство»
Идентификатор «Устройство1»
Драйвер «nvidia»
VendorName «NVIDIA Corporation»
BoardName «GeForce GTX 1070»
BusID » PCI: 2 : 0: 0″
Вариант «ConnectedMonitor» «DFP-0»
Вариант «CustomEDID» «DFP-0: /etc/X11/edid.bin»
EndSection

Раздел «Устройство»
Идентификатор «Устройство2»
Драйвер «nvidia»
VendorName «NVIDIA Corporation»
BoardName «GeForce GTX 1070»
BusID » PCI: 3 : 0: 0″
Вариант «ConnectedMonitor» «DFP-0»
Вариант «CustomEDID» «DFP-0: /etc/X11/edid.bin»
EndSection

Раздел «Устройство»
Идентификатор «Устройство3»
Драйвер «nvidia»
VendorName «NVIDIA Corporation»
BoardName «GeForce GTX 1070 Ti»
BusID » PCI: 5 : 0: 0″
Вариант «ConnectedMonitor» «DFP-0»
Вариант «CustomEDID» «DFP-0: /etc/X11/edid.bin»
EndSection

Раздел «Устройство»
Идентификатор «Device4»
Драйвер «nvidia»
VendorName «NVIDIA Corporation»
BoardName «GeForce GTX 1070 Ti»
BusID » PCI: 6 : 0: 0″
Вариант «ConnectedMonitor» «DFP-0»
Вариант «CustomEDID» «DFP-0: /etc/X11/edid.bin»
EndSection

Раздел «Устройство»
Идентификатор «Device5»
Драйвер «nvidia»
VendorName «NVIDIA Corporation»
BoardName «GeForce GTX 1070 Ti»
BusID » PCI: 7 : 0: 0″
Вариант «ConnectedMonitor» «DFP-0»
Вариант «CustomEDID» «DFP-0: /etc/X11/edid.bin»
EndSection

Раздел «Устройство»
Идентификатор «Устройство6»
Драйвер «nvidia»
VendorName «NVIDIA Corporation»
BoardName «GeForce GTX 1070»
BusID » PCI: 8 : 0: 0″
Вариант «ConnectedMonitor» «DFP-0»
Вариант «CustomEDID» «DFP-0: /etc/X11/edid.bin»
EndSection

Раздел «Экран»
Идентификатор «Screen0»
Устройство «Device0»
Монитор «Монитор0»
DefaultDepth 24
Вариант «AllowEmptyInitialConfiguration» «True»
Вариант «Coolbits» «13»
Подраздел «Дисплей»
Глубина 24
EndSubSection
EndSection

Раздел «Экран»
Идентификатор «Экран1»
Устройство «Device1»
Монитор «Монитор1»
DefaultDepth 24
Вариант «AllowEmptyInitialConfiguration» «True»
Вариант «Coolbits» «13»
Подраздел «Дисплей»
Глубина 24
EndSubSection
EndSection

Раздел «Экран»
Идентификатор «Экран2»
Устройство «Устройство2»
Монитор «Монитор2»
DefaultDepth 24
Вариант «AllowEmptyInitialConfiguration» «True»
Вариант «Coolbits» «13»
Подраздел «Дисплей»
Глубина 24
EndSubSection
EndSection

Раздел «Экран»
Идентификатор «Экран3»
Устройство «Device3»
Монитор «Монитор3»
DefaultDepth 24
Вариант «AllowEmptyInitialConfiguration» «True»
Вариант «Coolbits» «13»
Подраздел «Дисплей»
Глубина 24
EndSubSection
EndSection

Раздел «Экран»
Идентификатор «Экран4»
Устройство «Device4»
Монитор «Монитор4»
DefaultDepth 24
Вариант «AllowEmptyInitialConfiguration» «True»
Вариант «Coolbits» «13»
Подраздел «Дисплей»
Глубина 24
EndSubSection
EndSection

Раздел «Экран»
Идентификатор «Экран5»
Устройство «Device5»
Монитор «Монитор5»
DefaultDepth 24
Вариант «AllowEmptyInitialConfiguration» «True»
Вариант «Coolbits» «13»
Подраздел «Дисплей»
Глубина 24
EndSubSection
EndSection

Раздел «Экран»
Идентификатор «Экран6»
Устройство «Device6»
Монитор «Монитор6»
DefaultDepth 24
Вариант «AllowEmptyInitialConfiguration» «True»
Вариант «Coolbits» «13»
Подраздел «Дисплей»
Глубина 24
EndSubSection

EndSection
                 Script is for miner loop with OC settings for each GPU.
                        Settings apply only ones at start if they enabled
             Just edit it for your needs and run thats all, main part after it
! / bin / sh

nvidia-settings -a GPUFanControlState = 0

nvidia-settings -a GPUGraphicsClockOffset [3] = — 100

nvidia-settings -a GPUMemoryTransferRateOffset [3] = 1200

nvidia-smi -pm 1

nvidia-smi -pl 155

nvidia-settings -a [gpu: 0] / GPUGraphicsClockOffset [3] = — 150

nvidia-settings -a [графический процессор: 0] / GPUMemoryTransferRateOffset [3] = 1200

nvidia-settings -a [графический процессор: 0] / GPUFanControlState = 1

nvidia-settings -a [вентилятор: 0] / GPUTargetFanSpeed = 80

nvidia-settings -a [gpu: 1] / GPUGraphicsClockOffset [3] = — 150

nvidia-settings -a [графический процессор: 1] / GPUMemoryTransferRateOffset [3] = 1450

nvidia-settings -a [графический процессор: 1] / GPUFanControlState = 1

nvidia-settings -a [вентилятор: 1] / GPUTargetFanSpeed = 80

nvidia-settings -a [gpu: 2] / GPUGraphicsClockOffset [3] = — 150

nvidia-settings -a [графический процессор: 2] / GPUMemoryTransferRateOffset [3] = 1150

nvidia-settings -a [графический процессор: 2] / GPUFanControlState = 1

nvidia-settings -a [вентилятор: 2] / GPUTargetFanSpeed = 80

nvidia-settings -a [графический процессор: 3] / GPUGraphicsClockOffset [3] = — 100

nvidia-settings -a [графический процессор: 3] / GPUMemoryTransferRateOffset [3] = 1050

nvidia-settings -a [графический процессор: 3] / GPUFanControlState = 1

nvidia-settings -a [вентилятор: 3] / GPUTargetFanSpeed = 80

nvidia-settings -a [gpu: 4] / GPUGraphicsClockOffset [3] = — 150

nvidia-settings -a [графический процессор: 4] / GPUMemoryTransferRateOffset [3] = 1050

nvidia-settings -a [графический процессор: 4] / GPUFanControlState = 1

nvidia-settings -a [вентилятор: 4] / GPUTargetFanSpeed = 80

nvidia-settings -a [графический процессор: 5] / GPUGraphicsClockOffset [3] = — 100

nvidia-settings -a [графический процессор: 5] / GPUMemoryTransferRateOffset [3] = 800

nvidia-settings -a [графический процессор: 5] / GPUFanControlState = 1

nvidia-settings -a [вентилятор: 5] / GPUTargetFanSpeed = 80

nvidia-settings -a [графический процессор: 6] / GPUGraphicsClockOffset [3] = — 100

nvidia-settings -a [графический процессор: 6] / GPUMemoryTransferRateOffset [3] = 900

nvidia-settings -a [графический процессор: 6] / GPUFanControlState = 1

nvidia-settings -a [вентилятор: 6] / GPUTargetFanSpeed = 80

пока правда; # Это зациклит ваш майнер, даже если вы убьете -9 ethminer it
начнется снова после того, как сделать

Чтобы остановить просто CTRL + C или что угодно =)

делать
/ главная / m1 / Майнер / ethminer -U -S eth-eu2.nanopool. org: 9999 -O
0xb4983146f0047d87c63b5fdb3ef9e2bee4557ea3.M1 / [email protected]
сделанный
                   Thats was not so hard, the main deal is up to go !!!
                  While our miner script is working  we will run another one
                                         Script for monitoring
! / bin / sh

-i 5 номер GPU для мониторинга

gpu = nvidia-smi -i 5 —query-gpu = utilization.gpu
—format = csv, noheader, nounits

пока правда; # Петли: =))
делать
а [$ gpu -gt 50]
делать
gpu = nvidia-smi -i 5 —query-gpu = utilization.gpu
—format = csv, noheader, nounits
echo «Загрузка графического процессора $ gpu»
echo «Все хорошо $ (дата) Загрузка графического процессора $ gpu Без ошибок»
спать 10
сделанный
если [$ gpu -lt 40]
тогда
killall -9 ethminer
echo «Restart Miner GPU load $ gpu $ (date) error»
echo «Ошибка перезапуска майнера $ (дата)» >> /home/m1/Miner/ethminer.log
спать 60
gpu = nvidia-smi -i 5 —query-gpu = utilization.gpu
—format = csv, noheader, nounits
fi;

сделанный

Это оно. Доделал вчера. Думаю, может быть меньше. Но ничего
нужно установить, скомпилировать и т. д. Всю ночь я тестировал свои графические процессоры с разгоном и мощностью
— + очень быстро тестировать cloks и + tail -f /var/log/kern.log | grep nvrm для
посмотреть, какой графический процессор выдал ошибку без долгой остановки фермы.
Если это вам поможет. Люблю хороший кофе))
0xb4983146f0047d87c63b5fdb3ef9e2bee4557ea3
Размещено

—
Вы получили это, потому что оставили комментарий.
Ответьте на это письмо напрямую, просмотрите его на GitHub
https://github.com/ethereum-mining/ethminer/issues/72#issuecomment-353278352 ,
или отключить поток
https://github.com/notifications/unsubscribe-auth/AA-DBPLj3pjf2XpPInPCCcBT1yCJI40aks5tCgjFgaJpZM4OGt11
.

Привет джоантюн
Для управления вентилятором запустите nvidia-settings -a GPUFanControlState = 1
затем nvidia-settings -a [fan: 0] / GPUTargetFanSpeed = 80 вентиляторов GPU0 отключены
попробуйте coolbits 38, я тоже искал, чтобы он работал.
Мои карты не так хороши, как хотелось бы, но каждая ~ 31.7Mhs ~ 500Sol, тестирование еще не закончено.

Я только что закончил настройку второй установки (новый майнер Asus MB — максимум 19 графических процессоров) с 3 Asus GTX 1060 OC / 1 без OC (старая партия).
H05ted вдохновил меня снова погрузиться в Linux, и он работает (мне потребуются некоторые настройки, чтобы майнер автоматически запускался после перезагрузки, но все остальное работает отлично.
Я опубликую несколько скриптов позже, но я хотел бы сделать некоторые предложения для H05ted xorg.conf
Я часами пытался изменить настройки nvidia для карты> 0, и я только что наткнулся на эту команду: sudo nvidia-xconfig -a —cool-bits = 13 —allow-empty-initial-configuration
это делает xorg.conf идеальным без последующего редактирования … и бонус в том, что nvidia-settings теперь работает для всех карт.
Я не уверен, связано ли это с установкой (apt install) xserver-xorg-dev перед перезагрузкой (запуск nvidia-xconfig пожаловался на отсутствие xorg-server, поэтому я установил его). Во всяком случае, сейчас он работает.
Как я уже писал, в будущем опубликую некоторые обновления.

Выпущен Ethereum Miner Monitor — v1.0.2 — БЕСПЛАТНО!

Это приложение на Python для мониторинга майнеров Ethereum на базе Linux и поддержания активности майнера в режиме 24/7. Если у вас есть установка для майнинга на базе Linux, но нет системы мониторинга, вы можете использовать этот автономный скрипт, чтобы ваш майнер всегда работал без ручных проверок.

Приложение постоянно проверяет, запущен ли процесс ethminer и текущее среднее значение использования графических процессоров.

Скрипт может перезапустить ethminer или перезагрузить систему.

Скрипту не нужен дополнительный пакет / модуль python, только чистый python3. Вы также можете использовать virtualenv.

Текущая версия тестировалась на Ubuntu 16.04.3 LTS (xenial) с видеокартами GeForce GTX 1070 Ti и AMD Radeon R9 290X.

Добавлена поддержка запросов AMD Utilization!

Скачать: https://github.com/xstead/ethereum-miner-monitor

xstead, а кто сейчас использует ethminer? Ты из 2015 года, чувак? )))

@ Angel996 тот, кто знает, что делает …

Evilny0, что именно? ethminer — самый медленный майнер ethash на сегодняшний день, какой смысл его использовать?

@ Angel996, если вы так уверены в этом, просто не используйте его и не очерняйте тяжелую работу по его улучшению.

Андреа Ланфранки, вы уверены в обратном? Вы говорите, что ethminer быстрее и / или более энергоэффективен, чем Claymore?

Итак, я поверил вам, я потратил некоторое время на выпуск последнего выпуска ethminer.

Пробовал на установке Ubuntu 16.04 LTS с 5x Palit 1060 Stormx 3GB Samsung. Ядро -200, память +1200.

И вот результат:

Claymore’s: ~ 23,5 Mhs на карту, ~ 116 Mhs на установку. Потребление ~ 90 Вт / карту.
Ethminer: почти 19,5 Mhs на карту, ~ 96 Mhs на установку. Потребление ~ 90 Вт / карту.

ВЕРДИКТ: Быть «убежденным» в чем-то — это хорошо, но в действительности все обстоит иначе.

@ Angel996 Мы — проект с открытым исходным кодом. Нам не платят ни за что из этого. Я думаю, это действительно здорово, что так много разработчиков внесли свой вклад в этот проект и сделали это в свое свободное время. Без таких разработчиков не было бы никаких криптовалют, потому что никто бы (и не должен) доверять закрытому исходному коду!
В своем собственном тесте я обнаружил разницу примерно в 6% с клеймором, и это цена, которую я готов заплатить за знание того, какой код выполняется на моей машине.

Не для того, чтобы кормить тролля, но вот оно:
@ Angel996 Какой на самом деле хешрейт у пула? Claymores показывает примерно на 10% больше фактического хешрейта на пуле. Ethminer показывает в пуле то же самое, что и в майнере.
Моя установка 6x 580 8GB показала ~ 180 в клейморах и ~ 168 в бассейне. При правильной настройке ethminer я получаю ~ 175MH / s как в пуле, так и в майнере. Обожаю ethminer, продолжайте в том же духе!

MariusVanDerWijden — преимущества программного обеспечения с открытым исходным кодом? Конечно. Но когда дело доходит до майнинга, все дело в зарабатывании денег. Это делает более медленные майнеры совершенно бесполезными. И, пожалуйста, не говорите мне, что вы мои в образовательных целях.

tonyaik, не смотрите на сообщенный хешрейт, вы подсчитали фактическое количество отправленных акций? У меня есть два одинаковых рига, могу провести тест, скажем, час и посмотреть.
Что такое «правильная настройка ethminer»? Я просмотрел вывод —help, я не вижу там много вариантов. OC? Я использую те же настройки, что и у Claymore’s.

@ Angel996 Да, я смотрел реальное количество акций. Лучший хешрейт в пуле и отсутствие комиссии за разработку.

—cl-local-work и global-work — вот что я имею в виду. Для меня значения по умолчанию не были оптимальными.

Параметры cl предназначены для карт AMD, о которых не идет речь (хотя они у меня тоже есть). Что касается комиссии разработчика, то здесь:

https://github.com/JuicyPasta/Claymore-No-Fee-Proxy

Поскольку протокол stratum представляет собой простой текстовый TCP-сеанс, он работает как шарм, если SSL не используется майнером.

Увидел ту же разницу с моей установкой 7x 1060.

Использование прокси без комиссии — дерьмовая вещь. Не хочу играть по правилам разработчиков, имхо не пользуйся. Во всяком случае. Я не в этой ветке.

ВЕРДИКТ: Быть «убежденным» в чем-то — это хорошо, но в действительности все обстоит иначе.

Реальность субъективна.
Я проходил одни и те же тесты снова и снова.

Для сравнения у меня есть 6x EVGA 1060 3Gb на Micron (не Samsung), и я могу выжать из каждого примерно 18,67 Mh / s. используя -200 / + 850 при 72,50 Вт с использованием Claymore (более сильное нажатие делает всю систему нестабильной и / или не отвечает), в то время как на ethminer я получаю 18,52 Mh / s, используя -200 / + 750 при 72,50 Вт (система довольно стабильна, работает для пакетов по 12 часов каждый). И да … Я ограничиваю силу, насколько могу, когда занимаюсь математикой.

Падение заявленного хешрейта не имеет ничего общего с комиссией в 1%.
Вдобавок должен сказать, что клеймор использует в среднем на 26% больше ЦП, что приводит к тому, что мои установки с не очень мощными целеронами сильно тормозят. С ethminer мои машины работают без сбоев.

Плюс … мои измерения с использованием ethermine.org показывают, что заявленный хешрейт сильно перекрывает эффективный и средний хешрейт. Те пересекающиеся линии, которых никогда не было у Клеймора. (не обращая внимания на последние 3 часа, когда у меня были проблемы с подключением.) У меня всегда было подозрение, что у Клеймора хешрейт выше, чем эффективный … но поскольку мы не можем прочитать код …

immagine1

И последнее, но не менее важное: ethminer можно использовать бесплатно без ваших «читов» (которые в ближайшем будущем вполне могут обойти Claymore’s). И это открытый исходный код: возможность читать код и быть уверенным, что за кулисами не происходит ничего нежелательного или неожиданного, очень ценится.

ВЕРДИКТ: выносить абсолютный вердикт — всегда не лучшая идея.

И я останавливаюсь здесь.

tonyak >> Claymores показывает примерно на 10% больше фактического хешрейта на пуле.

Это абсолютно НЕ правда! Сообщенный хешрейт отправляется в пул, чтобы люди действительно могли сравнить реальный хешрейт с сообщенным. Здесь я использовал установку 4x 1060 1x 1050ti 20 часов подряд. Полученные результаты:

Средний хешрейт за последние 6 часов: 105,3 Mh / s
Последний отчетный хешрейт: 106,2 Mh / s.

Пул — eth.nanopool.org. Небольшая разница на самом деле составляет 1% от комиссии Клеймора. Это также хороший способ проверить, не крадет ли пул доли. Вероятно, ваш опыт связан с фактом кражи акций, а не с неверным сообщением Claymore о хешрейте.

_AndreaLanfranchi >> Для сравнения у меня есть 6x EVGA 1060 4Gb на Micron (не на Samsung), и я могу выжать из каждого примерно 18,67 Mh / s. с использованием -200 / + 850 при 72,50 Вт с использованием Claymore (более сильное нажатие делает всю систему нестабильной и / или не отвечает) _

Я могу высказать вердикт, потому что построил много ригов. Я делаю это для себя, а также за деньги для других людей.

Микронная память тоже довольно быстрая, она должна дать вам около 21 mh / s (по крайней мере!). Если ваша система становится нестабильной / не отвечает при дальнейшем OC, проблема не в графическом процессоре, а в вашем источнике питания или проводке. Поскольку превышение предела OC должно выдавать ошибку «GPU отключен от шины», установка не должна зависать или перестать отвечать. Уменьшая тактовые частоты и играя с ограничением мощности, вы просто получаете стабильность системы в качестве компромисса вместо обеспечения стабильного питания вашего оборудования.

Если вы используете преобразователи питания SATA -> 6PIN, откажитесь от них. Припаяйте качественные толстые провода прямо к блоку питания, и вы удивитесь, насколько лучше будет работать ваша установка. Я прошел через это.

В качестве альтернативы вы можете попробовать удалить 5 графических процессоров и запустить свою систему на 1 графическом процессоре. Посмотри, сможешь ли ты лучше разобраться. Я уверен, что вы можете (поскольку графический процессор получает больше мощности). Кроме того, упоминание о том, что система перестает отвечать, предполагает, что ваш ЦП / материнская плата / память недостаточно мощны из-за слишком большого количества графических процессоров в вашей установке или, опять же, из-за плохой проводки.

ОБНОВИТЬ:

Я попробовал это на установке с 2x 1060 Hynix и 2x GTX 970 Hynix.

Клеймора:
GPU0 18,473 Mh / s, GPU1 18,465 Mh / s, GPU2 10,292 Mh / s, GPU3 10,536 Mh / s

Этминер:
gpu / 0 18,60 gpu / 1 18,60 gpu / 2 10,49 gpu / 3 10,49

Это даже немного быстрее. )) Очень интересно. Кроме того, это может быть подсказкой для разработчиков ethminer. Как хешрейт соотносится со скоростью памяти?

ps GTX 970 раньше была намного быстрее (до 21 mhs), но они стали значительно медленнее после определенной эпохи ethash: ((

4x1080ti evga
Windows
16 гб оперативной памяти

Этот код появился сегодня дважды. Оба раза я входил в систему через vnc. Похоже, что это вызвало это.
70% мощности
149 разгон
499 разгон памяти

Я сталкиваюсь с такими же проблемами, когда пытаюсь использовать GPU в keras.

InternalError: CUDA runtime implicit initialization on GPU:0 failed. Status: an illegal memory access was encountered

Была ли эта страница полезной?

0 / 5 — 0 рейтинги

Источник

I have a P106-100 Graphics card which crashed halfway through mining.

When I now run the miner software I get «cuda error — an illegal memory access encountered»

I have rebooted my PC and I still cannot resolve the issue.

Is my graphics card knackered ? is there a way to reset the memory (I am assuming somehow the memory is not being refreshed after a device power off)

@cdawall Probably best person to help you
Have tagged him
he will be along to help you hopefully soon

Some have mentioned it’s an issue from power states. You need to use Nvidia inspector to turn the P2 state off.

@erocker thanks, I will give that a go and report back

cdawall

where the hell are my stars

Which specific miner is causing an issue?

I’ve got a 8 GPU machine where one of the GPU’s is knackered

I’m using EthMiner

The error occurs when attempting to generate the DAG file

kastriot

Maybe while mining it encountered pocket with methane and exploded, use non pyrophoric tools.

Maybe while mining it encountered pocket with methane and exploded, use non pyrophoric tools.

Lol

lexluthermiester

What happens when you take the card out and try running it all?

qubit

Overclocked quantum bit

I see that this is a mining specific card. Are you able to run the card on its own, ie remove all the others from the rig? If you run a different card on its own does it run? If the answers are no and yes, then your card is likely faulty. It might also help to try moving it to a different slot if you get an error when testing this.

Indeed it is a mining specific card.

Tried everything you suggested. Only thing I can think of is the memory blocks are somehow corrupted (but I would expect the memory blocks to be cleared down after the device is powered off and back on)

Anyone aware of any software to check the integrity of GPU memory and fix any memory related issues ( assuming the memory blocks are not cleared down after a device is powered off)

R-T-B

Indeed it is a mining specific card.

Tried everything you suggested. Only thing I can think of is the memory blocks are somehow corrupted (but I would expect the memory blocks to be cleared down after the device is powered off and back on)

Anyone aware of any software to check the integrity of GPU memory and fix any memory related issues ( assuming the memory blocks are not cleared down after a device is powered off)

Like a stick of ram, it’s rare, but GPU memory can go bad. This is likely what you are seeing. If so, no, a program will not fix it. A quick warranty claim might though.

Indeed it is a mining specific card.

Like a stick of ram, it’s rare, but GPU memory can go bad. This is likely what you are seeing. If so, no, a program will not fix it. A quick warranty claim might though.

many here will be intreasted on how any warranty Claim goes (re with the news of Specific 90 day warranty’s)
if you RMA PLEASE KEEP THE THREAD( AND US) UPDATED

qubit

Overclocked quantum bit

Indeed it is a mining specific card.

Tried everything you suggested. Only thing I can think of is the memory blocks are somehow corrupted (but I would expect the memory blocks to be cleared down after the device is powered off and back on)

Anyone aware of any software to check the integrity of GPU memory and fix any memory related issues ( assuming the memory blocks are not cleared down after a device is powered off)

Unfortunately the card is indeed faulty in that case. How long did you have it before it failed? I’m curious, because mining is known to hammer graphics cards which are working flat out 24/7.

lexluthermiester

many here will be intreasted on how any warranty Claim goes (re with the news of Specific 90 day warranty’s)
if you RMA PLEASE KEEP THE THREAD( AND US) UPDATED

I’m not miner but find this interesting and I agree with @dorsetknob, do keep us updated on how things go.

cdawall

where the hell are my stars

I’ve got a 8 GPU machine where one of the GPU’s is knackered

I’m using EthMiner

The error occurs when attempting to generate the DAG file

Any OC and are they 6gb cards?

Any OC and are they 6gb cards?

Does not work with OC or without OC

They are 6GB cards

cdawall

where the hell are my stars

Does not work with OC or without OC

They are 6GB cards

Try reseating all the cards

Источник

An illegal memory access was encountered ошибка

Войдите, чтобы написать ответ

Поддерживается ли разрешение 5120:1440 и 165 гц на видеокарте gtx 1660 ti?

Как мне выбрать видеокарату?

Планирую поменять процессор. Как заранее понять, какой будет прогресс в производительности?

Хватит ли процессора для видеокарты?

Встроенная AMD Ryzen 5 3400G Radeon Vega Graphics 2GB лучше,или Nvidia Geforce Gt 730? 4 GB?

Почему afterburner сам меняет частоты ГП?

Почему видеокарта потребляет разное кол-во ватт в играх, при максимальной нагрузке?

Что лучше для видеокарты VRAM или GDDR?

Как обновить драйвер Intel HD Graphics 4000?

Macbook pro 15 2014 года не видит дискретную видел карту, что делать?

Минуточку внимания

Решение Powershell для сбоев CUDA

Инструкции:

$ d = Get-Date

nvidia-xconfig: файл конфигурации X, созданный nvidia-xconfig

nvidia-xconfig: версия 387.34 (buildmeister @ swio-display-x64-rhel04-15) Вт, 21 ноября, 03:31:45 PST 2017

! / bin / sh

nvidia-settings -a GPUFanControlState = 0

nvidia-settings -a GPUGraphicsClockOffset [3] = — 100

nvidia-settings -a GPUMemoryTransferRateOffset [3] = 1200

nvidia-smi -pm 1

nvidia-smi -pl 155

nvidia-settings -a [gpu: 0] / GPUGraphicsClockOffset [3] = — 150

nvidia-settings -a [графический процессор: 0] / GPUMemoryTransferRateOffset [3] = 1200

nvidia-settings -a [графический процессор: 0] / GPUFanControlState = 1

nvidia-settings -a [вентилятор: 0] / GPUTargetFanSpeed ​​= 80

nvidia-settings -a [gpu: 1] / GPUGraphicsClockOffset [3] = — 150

nvidia-settings -a [графический процессор: 1] / GPUMemoryTransferRateOffset [3] = 1450

nvidia-settings -a [графический процессор: 1] / GPUFanControlState = 1

nvidia-settings -a [вентилятор: 1] / GPUTargetFanSpeed ​​= 80

nvidia-settings -a [gpu: 2] / GPUGraphicsClockOffset [3] = — 150

nvidia-settings -a [графический процессор: 2] / GPUMemoryTransferRateOffset [3] = 1150

nvidia-settings -a [графический процессор: 2] / GPUFanControlState = 1

nvidia-settings -a [вентилятор: 2] / GPUTargetFanSpeed ​​= 80

nvidia-settings -a [графический процессор: 3] / GPUGraphicsClockOffset [3] = — 100

nvidia-settings -a [графический процессор: 3] / GPUMemoryTransferRateOffset [3] = 1050

nvidia-settings -a [графический процессор: 3] / GPUFanControlState = 1

nvidia-settings -a [вентилятор: 3] / GPUTargetFanSpeed ​​= 80

nvidia-settings -a [gpu: 4] / GPUGraphicsClockOffset [3] = — 150

nvidia-settings -a [графический процессор: 4] / GPUMemoryTransferRateOffset [3] = 1050

nvidia-settings -a [графический процессор: 4] / GPUFanControlState = 1

nvidia-settings -a [вентилятор: 4] / GPUTargetFanSpeed ​​= 80

nvidia-settings -a [графический процессор: 5] / GPUGraphicsClockOffset [3] = — 100

nvidia-settings -a [графический процессор: 5] / GPUMemoryTransferRateOffset [3] = 800

nvidia-settings -a [графический процессор: 5] / GPUFanControlState = 1

nvidia-settings -a [вентилятор: 5] / GPUTargetFanSpeed ​​= 80

nvidia-settings -a [графический процессор: 6] / GPUGraphicsClockOffset [3] = — 100

nvidia-settings -a [графический процессор: 6] / GPUMemoryTransferRateOffset [3] = 900

nvidia-settings -a [графический процессор: 6] / GPUFanControlState = 1

nvidia-settings -a [вентилятор: 6] / GPUTargetFanSpeed ​​= 80

! / bin / sh

-i 5 номер GPU для мониторинга

AOC 23 мес

генерируется по умолчанию

генерируется по умолчанию

EndSection

! / bin / sh

nvidia-settings -a GPUFanControlState = 0

nvidia-settings -a GPUGraphicsClockOffset [3] = — 100

nvidia-settings -a GPUMemoryTransferRateOffset [3] = 1200

nvidia-smi -pm 1

nvidia-smi -pl 155

nvidia-settings -a [gpu: 0] / GPUGraphicsClockOffset [3] = — 150

nvidia-settings -a [графический процессор: 0] / GPUMemoryTransferRateOffset [3] = 1200

nvidia-settings -a [графический процессор: 0] / GPUFanControlState = 1

nvidia-settings -a [вентилятор: 0] / GPUTargetFanSpeed ​​= 80

nvidia-settings -a [gpu: 1] / GPUGraphicsClockOffset [3] = — 150

nvidia-settings -a [графический процессор: 1] / GPUMemoryTransferRateOffset [3] = 1450

nvidia-settings -a [графический процессор: 1] / GPUFanControlState = 1

nvidia-settings -a [вентилятор: 1] / GPUTargetFanSpeed ​​= 80

nvidia-settings -a [gpu: 2] / GPUGraphicsClockOffset [3] = — 150

nvidia-settings -a [графический процессор: 2] / GPUMemoryTransferRateOffset [3] = 1150

nvidia-settings -a [графический процессор: 2] / GPUFanControlState = 1

nvidia-settings -a [вентилятор: 2] / GPUTargetFanSpeed ​​= 80

nvidia-settings -a [графический процессор: 3] / GPUGraphicsClockOffset [3] = — 100

nvidia-settings -a [графический процессор: 3] / GPUMemoryTransferRateOffset [3] = 1050

nvidia-settings -a [графический процессор: 3] / GPUFanControlState = 1

nvidia-settings -a [вентилятор: 3] / GPUTargetFanSpeed ​​= 80

nvidia-settings -a [вентилятор: 0] / GPUTargetFanSpeed = 80

nvidia-settings -a [вентилятор: 1] / GPUTargetFanSpeed = 80

nvidia-settings -a [вентилятор: 2] / GPUTargetFanSpeed = 80

nvidia-settings -a [вентилятор: 3] / GPUTargetFanSpeed = 80

nvidia-settings -a [вентилятор: 4] / GPUTargetFanSpeed = 80

nvidia-settings -a [вентилятор: 5] / GPUTargetFanSpeed = 80

nvidia-settings -a [вентилятор: 6] / GPUTargetFanSpeed = 80

nvidia-settings -a [вентилятор: 0] / GPUTargetFanSpeed = 80

nvidia-settings -a [вентилятор: 1] / GPUTargetFanSpeed = 80

nvidia-settings -a [вентилятор: 2] / GPUTargetFanSpeed = 80

nvidia-settings -a [вентилятор: 3] / GPUTargetFanSpeed = 80

nvidia-settings -a [вентилятор: 4] / GPUTargetFanSpeed = 80

nvidia-settings -a [вентилятор: 5] / GPUTargetFanSpeed = 80

nvidia-settings -a [вентилятор: 6] / GPUTargetFanSpeed = 80