Aller au contenu

GPU NVIDIA

GPU disponible

Pour voir quels sont les GPU disponibles,

nvidia-smi

Processus relié au GPU

Parfoit nvidia-smi n'affiche pas que le GPU est utilisé alors qu'il est inaccessible, on peut sortir la liste des processus qui utilisent les GPUs, et qui n'ont pas terminés correctement.

lsof /dev/nvidia*

Ensuite on tue les process sur le GPU bloqué.

kill ProcessPIDNumber

Limiter le nombre de GPU utilisés

Si le serveur contient 4 GPUs [0,1,2,3]

CUDA_VISIBLE_DEVICES=numero_GPU python monprogram.py

ex

CUDA_VISIBLE_DEVICES=1 python monprogram.py

Tout dépendant de l'application, il est possible que le programme utilise tous les GPU ce qui n'est pas souhaitable la plupart du temps. Dans d'autres cas, si la variable CUDA_VISIBLE_DEVICES n'est pas spécifiée c'est le GPU 0 qui va être utilisé par défaut et il est très possible que celui-ci soit occupé alors que d'autres sont disponibles.