Несколько графических процессоров и вентиляторов в Linux
У меня есть два GTX 1080ti на коробке с Ubuntu 18.04, оба издания Founder's edition. Я использую их в основном для обучения нейронных сетей.
Теперь у меня есть две проблемы:
Установка "холодных битов" (даже с параметром --enable-all-gpus) позволяет мне устанавливать скорость вентилятора и тактовые частоты только для графического процессора, подключенного к монитору.
Я не хотел бы устанавливать статическую скорость вращения вентилятора: скорее, я бы хотел установить динамический профиль, % скорости вентилятора и температуры. Имейте в виду, что в автоматическом режиме под нагрузкой один 1080ti регулярно достигает 89-90C, независимо от удушения и того факта, что корпус вместительный.. (другие 1080ti остаются холоднее.. Я думаю, что не все графические процессоры созданы равными),
Информация о моем конфиге:
inxi -b
System: Host: nimrod Kernel: 4.15.0-46-generic x86_64 bits: 64
Desktop: Xfce 4.12.3 Distro: Ubuntu 18.04.2 LTS
Machine: Device: desktop Mobo: FUJITSU model: D3128-B2 v: S26361-D3128-B2 serial: N/A
UEFI: FUJITSU // American Megatrends v: V4.6.5.4 R1.8.0 for D3128-B2x date: 06/28/2018
CPU: 10 core Intel Xeon E5-2680 v2 (-MT-MCP-) speed/max: 2269/3600 MHz
Graphics: Card-1: Advanced Micro Devices [AMD/ATI] Park [Mobility Radeon HD 5430]
Card-2: NVIDIA GP102 [GeForce GTX 1080 Ti]
Card-3: NVIDIA GP102 [GeForce GTX 1080 Ti]
Display Server: x11 (X.Org 1.19.6 )
drivers: modesetting,nvidia,ati,radeon,nouveau (unloaded: fbdev,vesa)
Resolution: 2560x1080@60.00hz
OpenGL: renderer: GeForce GTX 1080 Ti/PCIe/SSE2
version: 4.6.0 NVIDIA 415.27
Network: Card: Intel 82579LM Gigabit Network Connection (Lewisville)
driver: e1000e
Drives: HDD Total Size: 2262.5GB (9.5% used)
Info: Processes: 413 Uptime: 10 min Memory: 3677.2/96560.4MB
Client: Shell (bash) inxi: 2.3.56
Nvidia-сми:
Mon Mar 25 04:19:30 2019
+-----------------------------------------------------------------------------+
| NVIDIA-SMI 415.27 Driver Version: 415.27 CUDA Version: 10.0 |
|-------------------------------+----------------------+----------------------+
| GPU Name Persistence-M| Bus-Id Disp.A | Volatile Uncorr. ECC |
| Fan Temp Perf Pwr:Usage/Cap| Memory-Usage | GPU-Util Compute M. |
|===============================+======================+======================|
| 0 GeForce GTX 108... Off | 00000000:03:00.0 Off | N/A |
| 23% 39C P8 10W / 250W | 2MiB / 11178MiB | 0% Default |
+-------------------------------+----------------------+----------------------+
| 1 GeForce GTX 108... Off | 00000000:04:00.0 On | N/A |
| 31% 57C P0 69W / 250W | 204MiB / 11176MiB | 2% Default |
+-------------------------------+----------------------+----------------------+
+-----------------------------------------------------------------------------+
| Processes: GPU Memory |
| GPU PID Type Process name Usage |
|=============================================================================|
| 1 1465 G /usr/lib/xorg/Xorg 201MiB |
+-----------------------------------------------------------------------------+
И наконец мой xorg.conf
# nvidia-xconfig: X configuration file generated by nvidia-xconfig
# nvidia-xconfig: version 415.27
Section "ServerLayout"
Identifier "Layout0"
Screen 0 "Screen0"
Screen 1 "Screen1" RightOf "Screen0"
InputDevice "Keyboard0" "CoreKeyboard"
InputDevice "Mouse0" "CorePointer"
EndSection
Section "Files"
EndSection
Section "InputDevice"
# generated from default
Identifier "Mouse0"
Driver "mouse"
Option "Protocol" "auto"
Option "Device" "/dev/psaux"
Option "Emulate3Buttons" "no"
Option "ZAxisMapping" "4 5"
EndSection
Section "InputDevice"
# generated from default
Identifier "Keyboard0"
Driver "kbd"
EndSection
Section "Monitor"
Identifier "Monitor0"
VendorName "Unknown"
ModelName "Unknown"
HorizSync 28.0 - 33.0
VertRefresh 43.0 - 72.0
Option "DPMS"
EndSection
Section "Monitor"
Identifier "Monitor1"
VendorName "Unknown"
ModelName "Unknown"
HorizSync 28.0 - 33.0
VertRefresh 43.0 - 72.0
Option "DPMS"
EndSection
Section "Device"
Identifier "Device0"
Driver "nvidia"
VendorName "NVIDIA Corporation"
BoardName "GeForce GTX 1080 Ti"
BusID "PCI:3:0:0"
EndSection
Section "Device"
Identifier "Device1"
Driver "nvidia"
VendorName "NVIDIA Corporation"
BoardName "GeForce GTX 1080 Ti"
BusID "PCI:4:0:0"
EndSection
Section "Screen"
Identifier "Screen0"
Device "Device0"
Monitor "Monitor0"
DefaultDepth 24
Option "AllowEmptyInitialConfiguration" "True"
Option "Coolbits" "31"
SubSection "Display"
Depth 24
EndSubSection
EndSection
Section "Screen"
Identifier "Screen1"
Device "Device1"
Monitor "Monitor1"
DefaultDepth 24
Option "AllowEmptyInitialConfiguration" "True"
Option "Coolbits" "31"
SubSection "Display"
Depth 24
EndSubSection
EndSection
Обратите внимание, что крутые биты установлены для них обоих.
Вы можете мне помочь?
Спасибо!:)
0 ответов
Испытал точно то же самое на прошлой неделе. Это вина водителя. Попробуйте версию 390 или 430, это две версии, которые, как я подтвердил, правильно работают на арке, с двумя 1080ti.
Трудно определить проблему. Сначала я подумал, что вина моей материнской платы не в том, что она не поддерживает SLI, поэтому я использовал другую материнскую плату и активировал SLI, затем я смог установить скорость вращения вентилятора для обоих графических процессоров. Однако при использовании SLI две графические карты использовали одинаковую память на двух графических процессорах. Это недопустимо, поскольку SLI уменьшает размер партии. Затем я деактивирую SLI и не могу снова установить скорость вентилятора для обеих карт. Поэтому я попытался изменить драйвер nvidia, который затем работает правильно. Черт побери, я сломал базу LGA на первой материнской плате, когда я заменял другую материнскую плату вместо этого, и сжег i5-9400f из-за сломанной базы. Я знаю, что это из-за моей невнимательности, но мне не пришлось бы страдать, если бы не ошибка водителей nvidia (только некоторые глупости жалуются)