>source

현재 내 코드는 매우 간단합니다 :

import torch 
device = torch.device("cuda" if torch.cuda.is_available() else "cpu")
torch.cuda.current_device()
    ---------------------------------------------------------------------------
RuntimeError                              Traceback (most recent call last)
<ipython-input-20-3380d2c12118> in <module>
----> 1 torch.cuda.current_device()
~/.conda/envs/tensorflow/lib/python3.6/site-packages/torch/cuda/__init__.py in current_device()
    349 def current_device():
    350     r"""Returns the index of a currently selected device."""
--> 351     _lazy_init()
    352     return torch._C._cuda_getDevice()
    353 
~/.conda/envs/tensorflow/lib/python3.6/site-packages/torch/cuda/__init__.py in _lazy_init()
    161             "Cannot re-initialize CUDA in forked subprocess. " + msg)
    162     _check_driver()
--> 163     torch._C._cuda_init()
    164     _cudart = _load_cudart()
    165     _cudart.cudaGetErrorName.restype = ctypes.c_char_p
RuntimeError: cuda runtime error (30) : unknown error at /opt/conda/conda-bld/pytorch_1556653099582/work/aten/src/THC/THCGeneral.cpp:51

인터넷을 보면 버전 문제인 것처럼 보이지만 CUDA 10.0, 10.1, tensorflow-gpu 13, 12 등의 드라이버 조합을 모두 시도했지만 아무 것도 작동하지 않는 것 같습니다.

NVIDIA 드라이버 : nvidia-smi :

   +-----------------------------------------------------------------------------+
| NVIDIA-SMI 430.14       Driver Version: 430.14       CUDA Version: 10.2     |
|-------------------------------+----------------------+----------------------+
| GPU  Name        Persistence-M| Bus-Id        Disp.A | Volatile Uncorr. ECC |
| Fan  Temp  Perf  Pwr:Usage/Cap|         Memory-Usage | GPU-Util  Compute M. |
|===============================+======================+======================|
|   0  GeForce 930MX       Off  | 00000000:01:00.0 Off |                  N/A |
| N/A   36C    P8    N/A /  N/A |    139MiB /  2004MiB |      4%      Default |
+-------------------------------+----------------------+----------------------+
+-----------------------------------------------------------------------------+
| Processes:                                                       GPU Memory |
|  GPU       PID   Type   Process name                             Usage      |
|=============================================================================|
|    0       986      G   /usr/lib/xorg/Xorg                            64MiB |
|    0      1242      G   /usr/bin/gnome-shell                          72MiB |
+-----------------------------------------------------------------------------+

CUDA VERSION nvcc --version  :

nvcc: NVIDIA (R) Cuda compiler driver
Copyright (c) 2005-2018 NVIDIA Corporation
Built on Sat_Aug_25_21:08:01_CDT_2018
Cuda compilation tools, release 10.0, V10.0.130

tensorflow-GPU 버전 : pip list | grep tensorflow :

tensorflow                         1.13.1   
tensorflow-estimator               1.13.0 

피 토치 버전 pip list | grep torch

pytorch-pretrained-bert            0.6.2    
torch                              1.1.0    
torchvision                        0.3.0  

어떤 사람이 호환성 문제를보고 왜 어떻게 고칠 수 있는지 설명 할 수 있습니까?


  • 답변 # 1

    CUDA 설치를 테스트 했습니까? 그렇지 않으면 사용할 수 있습니다 (시간이 오래 걸릴 수 있음) :

    $ cd ~/NVIDIA_CUDA-10.0_Samples
     $ make
    
    

    그리고 :

    $ cd ~/NVIDIA_CUDA-10.0_Samples/bin/x86_64/linux/release
    $./deviceQuery
    
    

    "테스트 통과!" 결과적으로

    소스

관련 자료

  • 이전 typescript - 순차적으로 체인 약속
  • 다음 c# - Entity Framework에서 잘못된 열 이름 'Id'이 (가) 발생합니다 \ r \ n 잘못된 열 이름 'Id'입니다 "