[bglug] Il server si blocca... perchè???

Alessandro Rinaldi rinaldi.aless@gmail.com
Mar 10 Giu 2008 22:47:46 CEST


Ciao a tutti...
Ho un problema stranissimo, mai capitato...
Avevo un server LTSP con HD IDE da 40GB, 1GB di ram e 1,80Ghz di
processore... e, nonostante le risorse un po' limitate, svolgeva
egregiamente il suo lavoro.
Adesso abbiamo cambiato server: HD SATA da 250GB, 2GB di ram e 3Ghz di
processore. Abbiamo copiato i dati da uno all'altro (collegando il
disco ide al nuovo server) con un semplice "dd if=/dev/hda
of=/dev/sda".
Tutto ok, il server si avvia e fa quello che deve fare.
Tuttavia, dopo qualche giorno di accensione, decide di bloccarsi.
Ma non è il crash di un servizio o un kernel panic: nel primo caso,
tutto il resto funzionerebbe, mentre nel secondo lampeggerebbero i led
della tastiera (per quanto ne so).

Si tratta semplicemente di un blocco "veloce ed indolore": non
risponde più ad alcuna richiesta di rete, nè alle richieste di IP nè
ai comandi che lancio con uno script creato da me simile ad ssh.
Il monitor rimane esattamente come si trovava (acceso, ma con lo
schermo tutto nero: modalità risparmio energia quando si è nel
terminale).
Passiamo ai logs: abbiamo 3 processi pianificati per ogni minuto, che
vengono registrati in syslog ad ogni esecuzione. All'improvviso, nei
logs si vede un "balzo temporale", da quando il server si blocca a
quando lo riavvio e cron riparte.
Insomma, nulla viene registrato, almeno per quanto ho visto io.
Ho a disposizione tutti i logs di uno di questi crash, se serve li
posto, ma... per favore... aiutatemi! In questo momento il server si
trova in questa situazione e domani mattina, prima che inizino ad
usarlo, devo andare a fare il reboot! non posso continuare così! Sono
3 volte che me lo fa!


Maggiori informazioni sulla lista bglug