gpfs
Differences
This shows you the differences between two versions of the page.
| Both sides previous revisionPrevious revisionNext revision | Previous revision | ||
| gpfs [2025/07/10 21:06] – [Monitoreo de salud] joaquintorres | gpfs [2025/09/23 16:39] (current) – joaquintorres | ||
|---|---|---|---|
| Line 95: | Line 95: | ||
| En cada nodo se puede correr un comando más específico: | En cada nodo se puede correr un comando más específico: | ||
| < | < | ||
| - | # / | + | # / |
| Node name: cn013-ib0 | Node name: cn013-ib0 | ||
| Line 107: | Line 107: | ||
| FILESYSTEM | FILESYSTEM | ||
| </ | </ | ||
| + | |||
| + | Para todos los nodos sería mmhealth node show -N all | ||
| Y se puede obtener un histórico con | Y se puede obtener un histórico con | ||
| Line 118: | Line 120: | ||
| 2024-10-21 14: | 2024-10-21 14: | ||
| </ | </ | ||
| + | |||
| + | Los eventos que aparecen **pueden hacer de trigger para algún script en caso de falla**. Eso estaría bueno implementarlo. | ||
| + | |||
| + | ==== Logs ==== | ||
| + | Los logs se encuentran disponibles en los nodos, en / | ||
| ===== Rebuild de los módulos del kernel ===== | ===== Rebuild de los módulos del kernel ===== | ||
| Line 233: | Line 240: | ||
| mmcesminfuncs | mmcesminfuncs | ||
| </ | </ | ||
| + | ===== Restart ===== | ||
| + | Si el nodo se encuentra colgado por problema con los fs, y si estamos seguros de que está colgado por este motivo, se puede ejecutar: | ||
| + | |||
| + | < | ||
| + | mmshutdown; mmstartup | ||
| + | </ | ||
| + | |||
| + | Que intenta desarmar el stack de gpfs (fs, driver, modulos) y volver a cargarlos, vuelve tambien a montar los fs, pero interrumpe todo proceso que de estos dependa. | ||
| + | |||
| + | Si se desea hacer un restart de cero de todo el cluster, se ejecuta: | ||
| + | |||
| + | < | ||
| + | mmstartup -a # levanta | ||
| + | mmgetstate -a #verifica | ||
| + | mmlsfs all #lista fs | ||
| + | mmlsmount all -L #verifica lo montado | ||
| + | </ | ||
gpfs.1752181568.txt.gz · Last modified: by joaquintorres
