User Tools

Site Tools


slurm_tips

Differences

This shows you the differences between two versions of the page.

Link to this comparison view

Both sides previous revisionPrevious revision
Next revision
Previous revision
slurm_tips [2025/11/20 16:44] bbruzzoslurm_tips [2026/02/18 15:04] (current) bbruzzo
Line 59: Line 59:
 sacctmgr modify user name=<user> set defaultaccount=users sacctmgr modify user name=<user> set defaultaccount=users
 sacctmgr modify user name=<user> set adminlevel=administrator sacctmgr modify user name=<user> set adminlevel=administrator
 +</code>
 +
 +===== Monitorear tiempo de espera y priority =====
 +
 +Si los usuarios se quejan de que su job tarda mucho en entrar, podemos 
 +en primera instancia utilizar squeue con un poco más de información:
 +
 +<code>
 +squeue -o "%.7i %.20V %.10a %.15u %.5t %.7C %.7Q %.R"
 +</code>
 +
 +Esto nos permite ver fecha de envío del job, y la priority del mismo, junto con el job size.
 +
 +Si queremos ver en más detalle calcular el tiempo de espera de cada job:
 +
 +<code>
 +sacct -Xa --starttime=0215 --parsable --endtime=now --format=JobID,Submit,Start,Priority,Account,User%10,AllocCPUs,State | awk -F'|' '
 +NR==1 {
 +    # Print header with fixed widths
 +    printf "%-15s %-20s %-20s %-10s %-10s %-10s %-10s %-12s %-10s\n", $1, $2, $3, $4, $5, $6, $7, $8, "WaitDays"
 +    next
 +}
 +$3 ~ /[0-9]/ {
 +    s1 = $2; s2 = $3;
 +    gsub(/[-T:]/, " ", s1);
 +    gsub(/[-T:]/, " ", s2);
 +    
 +    # Calculate days
 +    w_days = (mktime(s2) - mktime(s1)) / 86400;
 +
 +    # Print data rows with matching fixed widths
 +    # %-15s = string, left-aligned, 15 chars wide
 +    # %-10.2f = float, 2 decimals, 10 chars wide
 +    printf "%-15s %-20s %-20s %-10s %-10s %-10s %-10s %-12s %-10.2f\n", $1, $2, $3, $4, $5, $6, $7, $8, w_days
 +}'
 +
 +</code>
 +
 +Veremos que en la última columna está el tiempo que tardó el job en entrar a queue. 
 +
 +Ajustar la fecha de --starttime acordemente.
 +
 +
 +Para analizar usuarios por fairshare (peor fairshare) usar opción --reverse si se quiere ver al revez.
 +
 +<code>
 +sshare -aU | awk 'NR<=2; NR>2 {print $0 | "sort -k7,7rn"}'
 </code> </code>
slurm_tips.1763657086.txt.gz · Last modified: by bbruzzo