Interruption de services

Comme certains d’entre vous ont dû le constater il y a eu une interruption de service pour tout Jeedom (entre autres). Attention je parle des services autour de Jeedom et pas de votre installation qui peut marcher en standalone.

Les services impactés ont été :

  • Le forum
  • Le blog
  • Le site
  • Le market
  • Le système de suivi de projet

La faute à pas de chance

L’interruption a débutée vendredi après-midi pour finir ce matin (dimanche). La raison est une accumulation de « pas de chance ». Vendredi est sortie la nouvelle version de Ubuntu 14.04 (en LTS, support étendu de 5 ans, donc stable), j’ai donc décidé, après avoir mis un autre serveur à jour avec succès, de faire la mise à jour du serveur hébergeant les services Jeedom. La mise à jour se passe bien (hormis une perte du LDAP, mais aucun impact sur Jeedom). J’effectue son redémarrage et là plus rien, impossible de me reconnecter en SSH. J’y accède donc par iDRAC (merci à online de proposer ce service dès l’entrée de gamme) et je m’aperçois que le système a décidé de renommer eth0 en em1 (aller savoir pourquoi enfin ça explique la perte de réseau). Je commence donc à faire les modifications (j’en profite aussi pour basculer sur le nouveau réseau online car l’autre s’arrête en septembre), et là perte de l’iDRAC (plutôt grave car c’est vraiment la seule solution de secours). Je contacte donc le service client qui s’aperçoit que l’iDRAC n’est plus alimenté, il le redémarre et je récupère tout. Je continue donc ma modification réseau là où j’en étais et là : à nouveau perte de l’iDRAC . Re-ticket au support qui cette fois envoie un administrateur matériel pour regarder (il était environ 18 h). N’ayant aucun retour je décide le lendemain d’appeler le support pour savoir où ça en est. La personne se renseigne et me dit que mon serveur est mort (apparemment l’équipe matériel y aurait passé la nuit avec l’aide du constructeur sans pouvoir le ressusciter). Quand je vous parle d’une accumulation de facteurs pas de chance…

Le truc c’est que quand la machine est morte online n’essaye même pas de récupérer les disques pour les mettre sur la nouvelle (un peu léger quand même). Mais bon j’ai eu la nouvelle machine disponible immédiatement et par chance j’ai un système de back-up assez poussé qui fait des back-up tous les soirs et les envoie sur 2 machines distantes donc niveau perte de données c’est bon mais il faut quand même refaire toute la machine.

Dans les prochains articles je vais essayer de détailler toute l’architecture que j’ai mise en place (si il faut tout réinstaller autant améliorer le système existant et surtout faire en sorte que si je perds à nouveau la machine je puisse tout remettre rapidement).

Nouvelle architecture \o/

Le système qui est mort était basé sur une distribution Ubuntu (j’aime bien cette distribution car relativement stable, mises à jour suivies et bien documentée), je ne compte pas en changer par contre j’aimerais restaurer plus rapidement en cas de crash (et aussi de mise à jour ratée). En plus ce serveur héberge Jeedom et des sites web perso (type owncloud) et pour des questions de sécurité je voudrais bien séparer les deux. La solution était donc de virtualiser le système. Donc un ESXi sur la machine physique et 2 vm par dessus une pour Jeedom et le reste pour le perso. Niveau matériel c’est vraiment la limite très basse pour du vmware mais bon ça devrait passer.

Matériels :

  • core i3 avec 2 cores + hyperthreading (soit 4 cores virtuels) à 3 GHz
  • 4 Go ram
  • 2 * 1 To en raid 1

Vive la virtualisation !

Quelles sont les intérêts de la virtualisation :

  • Possibilité de séparer 2 machines sur un même serveur physique
  • On peut sauvegarder la machine virtuelle d’un seul bloc. Donc si on a un problème on a juste à réinstaller l’ESXi remettre les fichiers de la machine et c’est reparti
  • On peut faire des snapshot (pour permettre un retour arrière facile lors d’une mise à jour capricieuse)

Il y a quand même un désavantage c’est que globalement on perd en performance (mais vmware a quand même énormément optimisé le système)

Installation

Voici les différentes étapes (j’en ai détaillé certaines dans d’autre articles)

Cet article a été lu 1098 fois

Vous aimerez aussi...