hbm
Differences
This shows you the differences between two versions of the page.
| Next revision | Previous revision | ||
| hbm [2025/10/24 17:58] – created joaquintorres | hbm [2025/10/24 18:12] (current) – joaquintorres | ||
|---|---|---|---|
| Line 1: | Line 1: | ||
| ====== HBM ====== | ====== HBM ====== | ||
| Casi toda la info se puede encontrar en [[https:// | Casi toda la info se puede encontrar en [[https:// | ||
| + | |||
| + | {{ : | ||
| Cada nodo tiene un paquete de 64GB de HBM por cada socket, i.e. 128GB en total. La memoria tiene dos modos de operación en conjunto con DDR4: Flat y Cache. | Cada nodo tiene un paquete de 64GB de HBM por cada socket, i.e. 128GB en total. La memoria tiene dos modos de operación en conjunto con DDR4: Flat y Cache. | ||
| Line 22: | Line 24: | ||
| (Disabled para desactivarlo) | (Disabled para desactivarlo) | ||
| - | ===== Headline | + | ===== Configuración del kernel |
| + | |||
| + | De acuerdo a la documentación, | ||
| + | |||
| + | < | ||
| + | # osdeploy updateboot rhel-8.8-x86_64-diskless-gpu | ||
| + | # nodedeploy < | ||
| + | </ | ||
| + | |||
| + | Además, cuando ya bootea, es necesario hacer un enable de zone-reclaim: | ||
| + | |||
| + | < | ||
| + | # echo 2 > / | ||
| + | </ | ||
| + | (automatizable en confluent/ | ||
| + | |||
| + | y antes de cada job hacer un flush de la cache: | ||
| + | |||
| + | < | ||
| + | # sync; echo 3 > / | ||
| + | # echo 1 > / | ||
| + | </ | ||
| + | (Automatizable en un prolog de Slurm) | ||
hbm.1761328736.txt.gz · Last modified: by joaquintorres
