
der genaue Fehler:
CUDA error at ../../common/inc/helper_cuda.h:1263 code=30(cudaErrorUnknown) "cudaGetDevice(&dev)"
Ich installiere cuda für Tensorflow GPU. Ich habe cuda 8 installiert (nachdieseAnweisungen für Ubuntu 16.04), und ich habe einen Fehler beim Testen der beschreibbaren Beispiele (Abschnitt 6.2.1 in diesem Link). Ich erhalte diesen Fehler immer wieder bei allen Beispielen, und nichts, was ich google, zeigt diesen Fehler an (nur cudaGetDeviceCount()-Fehler). Was könnte das sein? Ich habe ursprünglich versehentlich das Cuda 9.1-Toolkit installiert (Tensorflow benötigt 8.0), aber ich habe es vollständig deinstalliert und alle damit verbundenen Pfadvariablen oder Verzeichnisse entfernt.
Dieser Fehler tritt auf, wenn die ausführbare Datei ausgeführt wird, die das Makefile in den Beispielverzeichnissen erstellen soll, und das Makefile selbst diese Warnung/Fehlermeldung erzeugt:
nvcc warning : The 'compute_20', 'sm_20', and 'sm_21' architectures are deprecated, and may be removed in a future release (Use -Wno-deprecated-gpu-targets to suppress warning).
Ich denke, dass die Make-Datei überhaupt nichts erstellt, da die Make-Datei am Ende auch Folgendes ausführt:
cp simpleZeroCopy ../../bin/x86_64/linux/release
Dabei wird die ausführbare Datei aus einem Verzeichnis mit zwischengespeicherten ausführbaren Dateien aller Beispiele kopiert. Das Makefile und der Quellcode für dieses Beispiel sind groß und ich weiß nicht, ob sie dabei hilfreich sind, aber ich werde sie bei Bedarf veröffentlichen.
Der Beispielcode, den ich auszuführen versuche, stammt direkt von CUDA, ich habe ihn also nicht selbst programmiert. Daher vermute ich, dass mir entweder ein NVIDIA-Treiber fehlt oder ich CUDA einfach falsch installiert bzw. die entsprechenden Pfadvariablen nicht festgelegt habe (obwohl ich mir ziemlich sicher bin, dass ich das alles problemlos gemacht habe).
Ich verwende Ubuntu 16.04, x86_64, und die Grafikkarte ist eine GTX 780 Ti.
Ich möchte klarstellen, dass der Fehler vor der Installation von Tensorflow-GPU auftritt.Ihre Anweisungenmüssen zuerst cuda separat installiert werden, dann tensorflow. Ich erhalte diesen Fehler, wenn ich cuda teste, bevor ich tensorflow installiere
Bearbeiten: Pfadvariablen sind:
$PFAD:
/usr/local/cuda-8.0/bin:/home/maurcio/anaconda3/bin:/home/maurcio/bin:/home/maurcio/.local/bin:/usr/local/sbin:/usr/local/bin:/usr/sbin:/usr/bin:/sbin:/bin:/usr/games:/usr/local/games:/snap/bin:.
$LD_LIBRARY_PATH:
/usr/local/cuda-8.0/lib64
Antwort1
Ihr Link zur Installationsanleitung ist fehlerhaft. Schauen Sie sichhttps://docs.google.com/viewer?url=https%3A%2F%2Fdeveloper.download.nvidia.com%2Fcompute%2Fcuda%2F9.1%2FProd%2Fdocs%2Fsidebar%2FCUDA_Installation_Guide_Linux.pdf&pdf=true
Verwenden Sie grundsätzlich die von Ubuntu angebotenen Treiber (wenn möglich, bei einer 980 ti bin ich mir nicht sicher), verwenden Sie die Intel-Deb-CUDA-Installation und installieren Sie das Ubuntu-CUDA-Paket, das das Toolkit erhält. Kopieren Sie die Beispiele an einen beschreibbaren Ort, ändern Sie die Pfade und CUDA sollte funktionieren.