problème de minutes allouées

Bonjour,

J’ai réussi à lancer l’entrainement d’un réseau de neurone et j’aimerai maintenant démarrer un nouvel entrainement avec de nouveaux paramètres mais le job que je soumet est déclaré “AssocGrpCPUMinutesLimit”.

Je me suis limité à lancer un script à la fois. Même si mon dernier test à tourné plusieurs heures sur un unique gpu, je ne pensais pas que cela poserai de problème. J’avais compris qu’il n’y avait pas de restriction d’allocation des ressource, j’espère donc ne pas avoir fait d’erreur. Pouvez-vous m’expliquer le problème.

Avec mes excuses

Bonjour,

Avez-vous bien spécifié votre compte projet avec l’argument -A ?

Votre compte par défaut est le compte demo mais il est volontairement bridé.

Cordialement.

Bonjour,

Je vous remercie pour votre réponse.

Suite à votre recommandation, j’ai lu la partie concernée dans la documentation SLURM et j’ai spécifié :

#SBATCH --account=imagoseine

dans mon script. J’ai malheureusement toujours une déclaration “AssocGrpCPUMinutesLimit”. En vérifiant les comptes qui me sont associé j’ai bien “imagoseine” mais il est lui aussi déclaré avec “Def Acct demo”

Cordialement

Bonjour,

Oui, votre compte projet par défaut est toujours “demo” mais il ne sera utilisé que si vous omettez l’argument --account (ou -A).

Vous pouvez si vous voulez changer votre compte projet par défaut avec la commande suivante: sacctmgr update user moisan set defaultaccount=imagoseine

Mais le problème n’a pas l’air de venir de là.

Pourriez-vous me copier / coller le contenu de votre script sbatch ? Ce sera plus simple à débugger.

Cordialement.

Je vous remercie, voici mon script submit.sh :

#!/bin/bash
#!/usr/bin/env python

#SBATCH --job-name=stardist
#SBATCH --account=imagoseine

#SBATCH --ntasks=1
#SBATCH --nodes=1
#SBATCH --mem=12GB

#SBATCH --gres=gpu:1

python stardist-train.py

Cordialement

Il y a plusieurs erreurs, à commencer par:

#!/usr/bin/env python

qui n’a rien à faire ici.

Puis:

#SBATCH --mem=12GB

L’unité est “G” (sans le B).