Ситуация
У меня есть сервер с двумя gpu (Ubuntu 12.04), где я переключил Tesla C1060 на GTX 670. Чем я установил CUDA 5.0 по сравнению с 4.2. Впоследствии я скомпилировал все примеры execpt для simpleMPI без ошибок. Но когда я запускаю ./devicequery
, я получаю следующее сообщение об ошибке:
[email protected]:~/NVIDIA_CUDA-5.0_Samples/bin/linux/release$ ./deviceQuery
./deviceQuery Starting...
CUDA Device Query (Runtime API) version (CUDART static linking)
cudaGetDeviceCount returned 38
-> no CUDA-capable device is detected
Что я пробовал
Чтобы решить эту проблему, я попробовал все мысли, рекомендованные устройством с поддержкой CUDA, но безрезультатно:
-
/dev/nvidia*
есть и разрешения 666 (crw-rw-rw-) и корень владельца: root[email protected]:/dev$ ls -l nvidia* crw-rw-rw- 1 root root 195, 0 Oct 24 18:51 nvidia0 crw-rw-rw- 1 root root 195, 1 Oct 24 18:51 nvidia1 crw-rw-rw- 1 root root 195, 255 Oct 24 18:50 nvidiactl
-
Я попытался выполнить код с помощью sudo
-
CUDA 5.0 одновременно устанавливает драйвер и библиотеки
PS здесь lspci | grep -i nvidia:
[email protected]:/dev$ lspci | grep -i nvidia
03:00.0 VGA compatible controller: NVIDIA Corporation GK104 [GeForce GTX 670] (rev a1)
03:00.1 Audio device: NVIDIA Corporation GK104 HDMI Audio Controller (rev a1)
04:00.0 VGA compatible controller: NVIDIA Corporation G94 [Quadro FX 1800] (rev a1)
[обновление]
[email protected]:~/NVIDIA_CUDA-5.0_Samples/bin/linux/release$ nvidia-smi -a
NVIDIA: API mismatch: the NVIDIA kernel module has version 295.59,
but this NVIDIA driver component has version 304.54. Please make
sure that the kernel module and all NVIDIA driver components
have the same version.
Failed to initialize NVML: Unknown Error
Как это может быть, если я использую установщик CUDA 5.0 для установки драйверов и библиотек одновременно. Может ли старая версия 4.2, которая все еще лежит вокруг беспорядка?