Monitoraggio GPU in tempo reale
Il sito mostra temperatura, utilizzo e VRAM di 6 GPU: 2x RTX 3060, 2x Tesla P4, 2x Tesla P100.
Raccolta dati
Uno script cron ogni minuto raccoglie i dati tramite nvidia-smi e li salva in un JSON nella cache del sito.
Visualizzazione
Ogni GPU viene mostrata con barra di utilizzo colorata, temperatura, VRAM usata/totale, nome server e modello GPU.
Gestione errori
Se un server non risponde, la card mostra stato "offline" con ultimo dato disponibile dalla cache.
Risultato: Monitoraggio real-time di 6 GPU su 3 server con aggiornamento automatico.