Bonjour,
Je me permets de vous contacter au sujet de nombreux jobs que j’ai lancés sur la partition master-bi du cluster de calcul, et qui ont abouti à l’erreur " WARNING: ran out of memory, skipping batch".
Voici un exemple de script que j’utilise :
cat liste_top10_medicament.o | while read DRUG; do
SMILES=$(grep $DRUG liste_smiles_chemEMBL_correct.o | awk ‘{print$3}’) ;
cat liste_partenaire_AKT1.o | while read NAME SEQ ; do
NAME=$(echo $DRUG""$NAME | tr ‘[A-Z]’ ‘[a-z]’) ;
if [ ! -e data_AKT1-Compound-Partner/boltz_results$NAME/predictions/$NAME/affinity_$NAME.json ]; then
cat ../template_protein_compound.yaml | sed “s|ZZZZ|$SEQ|” | sed “s|BBBB|‘$SMILES’|”> data_AKT1-Compound-Partner/$NAME.yaml;
sbatch -J $NAME -p master-bi -A master-bi --gres=gpu:1 -c 1 --mem=100G --time=02:00:00 -o data_AKT1-Compound-Partner/boltz_AKT1_$NAME.out --wrap=“boltz predict data_AKT1-Compound-Partner/$NAME.yaml --use_msa_server --diffusion_samples 1 --out_dir data_AKT1-Compound-Partner/”;
fi;
done;
done
J’ai essayé différentes valeurs de -c et --mem, sans succès, ainsi que de lancer un seul job séparément, avec --mem=30G, et il n’y a pas eu de problème. Par conséquent, je me demande si j’utilise bien le --mem dans mon script. L’erreur est-elle due au nombre important de jobs que je lance simultanément, bien que seulement 5 jobs tournent en parallèle grâce au --mem=100G ?
Je vous remercie par avance pour votre aide.
Cordialement,
Nicoleta IANCU M2BI