Le redémarrage involontaire des serveurs hier soir vers 19h30 mérite une explication un peu plus détaillée. Hier soir, lors d'une mise à jour afin d'améliorer notre solution de stockage, les serveurs sont tous partis en 'Kernel Panic' et ont rebooté d'eux même. L'opération de mise à jour s'est effectuée en parallèle mais, sur plusieurs milliers de serveurs, elle a pris plusieurs heures pour les moins chanceux et s'est terminée, pour 99% d'entres vous, vers minuit.

La situation ce matin est encore problématique pour certains serveurs :
  • pour ceux dont le serveur est marqué comme lancé mais ne réponds pas, un redemarrage via l'interface peut résoudre le problème
  • pour ceux dont le disque est en lecture seule, un 'fsck' sur le disque est nécessaire en ssh ou via un accès console
  • pour les autres, un mail au support et on s'occupe de vous ce matin