Terminé, situation ok
[EDIT du mercredi 3/8/2022 9h] une opération de maintenance mineure à 6h du matin s’est mal passée, elle a provoquée une perturbation sur plusieurs service jusqu’à 8h30 (pb config MBR suite au remplacement de plusieurs disques SSD sur un de nos serveurs de stockage , cf ci dessous pour + d’infos)
[EDIT du lundi 1/8/2022 16h] (suite du point ci dessous) Dernière coupure de service de quelques minutes vers 16h. 3eme et dernier ssd remplacé : ils sont les 3 à neuf sur ce “pool” de disks (après 5 ans d’utilisation intensive pour une douzaine de BDD et de services critiques…).
[EDIT du lundi 1/8/2022 14h] (suite du point ci dessous) ssd remplacé à chaud. Pas de coupure de service. Merci
[EDIT du lundi 1/8/2022 13h] (suite du point ci dessous) pendant que le fournisseur est sur le pont, on va remplacer un autre SSD de façon préventive entre 13h et 14h (coupure de 15 minutes à prévoir)
[EDIT du lundi 1/8/2022 10h30] (suite du point ci dessous) coupure de 30 min vers 10h ce matin : notre fournisseur a remplacé le disque SSD défectueux (alors que nous avions demandé de faire ce remplacement demain matin avant 6h…)
[EDIT du lundi 1/8/2022 8h30] une 2nde casse de disque SSD cette nuit (logique car ces 3 SSD sont en mirroir depuis plusieurs années et ils ont le même taux d’usure…). Cette fois on a l’expérience : panne résolue ce matin à 8h30. Merci de votre confiance.
Billet du 22 juillet :
Suite à un incident technique, plusieurs services ont été perturbés entre vendredi 22/7 fin de de journée et lundi 25/7 9h30
La panne est résolue. Toutes nos excuses pour la gêne occasionnée.
Cause : une panne matérielle sur un disque SSD. Ils sont en miroir triple mais ce mode dégradé (erreurs aléatoires et timeout) a fortement perturbé la partie stockage de notre infra . Nous avons eu bcp de mal à trouver la panne car ce disque n’était pas complètement HS et il passait sous les radars (aucune erreur sur les tests de disk linux classiques par exemple)
Merci de votre confiance et bonne journée
cordialement
l’équipe Z/
Bravo pour votre travail acharné et 1000 mercis pour tout depuis toutes ces années !
N’hésitez pas à publier un petit message plus tôt sur Mastodon si un soucis devait à nouveau arriver… 😉
Merci. Oui bien sûr. La personne qui fait ça habituellement était hors réseau ce weekend. Malheureux concours de circonstances.
Merci et bravo pour la réparation. Et merci de votre communication et de votre transparence.
Je suis un abonné très récent et j’ai confiance en vous.
Merci de votre soutien et bienvenue à vous.
Bravo!
Bien qu’inquiet au cours du WE, garde une bonne confiance,
et tout est OK.
Merci!
Bonjour. Merci du boulot effectué ce week-end.
J’ai lu que vous aviez pu communiquer sur Mastodon. Inquiet, j’avais cherché des nouvelles sur facebook… Quel sot. Je saurais pour la prochaine fois.
Bonjour et merci de votre patience. Nous communiquons de préférence sur notre cher Mastodon car c’est là que notre communauté est la plus active et réactive.
Cette nuit nous avons aussi passé du temps à répondre individuellement aux messages privés sur Twitter afin d’informer le plus largement possible.
Amicalement
Bonjour,
Une messagerie indisponible pendant plus de 2 jours, c’est très difficile et j’ai été obligé d’utiliser une autre messagerie … moins éthique.
Je constate aujourd’hui toujours des difficultés à envoyer des corriels avec des pièces jointes (taille de 2 ou 3 Mo); j’ai pratiquement toujours un échec de transmission.
Tout n’a aps été résolu techniquement?
Au plaisir
service zmail : si vous aviez des problèmes d’envoi de mail ce lundi 25/7 , le module manquant (DMARC) vient d’être relancé à l’instant
merci de votre compréhension
Bonjour
Bravo pour la réparation !
Une remarque et une question :
* ne pourriez-vous pas constituer une liste de diffusion des abonnés à ces services pour envoyer un “bulletin” dans le cas de pannes aussi importantes ?
* peut-on considérer en toute sérénité que rien (données, événements d’agenda, etc…) n’a été perdu dans la bataille, et reprendre sans craintes les synchronisations ?
Cordialement
Bonjour et merci,
Non aucune perte. Comme dit ce disque est la copie de sécurité des deux autres. Pour qu’il y ait perte à ce niveau, il faudrait que les 3 soient défectueux simultanément. Et dans ce cas il y aurait encore des sauvegardes ailleurs pour les services et niveaux d’abonnement concernés.
Une diffusion à plusieurs milliers d’abonné(e)s requiert beaucoup de temps et n’est pas adaptée à une mise à jour de l’info en direct. C’est pourquoi nous utilisons la Gazette et Mastodon.
Amicalement
Tout semble rétabli. merci de votre réponse et bon courage
0 communication pendant 3jours, c’est vraiment dommage… et regrettable
Oui désolés. D’habitude on fait mieux mais là, avec une équipe restreinte nous avons dû concentrer toutes nos forces sur la panne avant que les gens reprennent le travail ce lundi.
Bravo à toute l’équipe. J’avoue avoir été un peu inquiet sans nouvelles pendant 3 jours… Mais la confiance et la patience étaient là. Merci encore pour votre efficacité et votre énergie ! je vais m’inscrire sur Mastodon !
Merci pour le boulot et pour tout ce que vous faites.
Ce petit désagrément n’est rien à côté de tout ce que vous abattez comme taf.
Continuez comme ça.
Tout est ok de mon côté, merci pour votre implication.
Bonjour,
Merci pour l’information, bon courage
Ça fait plaisir de retrouver le site zaclys.com et de pouvoir suivre les nouvelles.
Bravo et merci pour le travail en cours !
Merci pour cette info, je voyais bien un dysfonctionnement, mais impossible aussi d’accéder à zaclys.com : existe-il un autre canal d’information pour ces cas-là ?
Bonjour,
Oui Mastodon : https://mastodon.zaclys.com/@zaclys/108706153988265768
Merci de votre patience
Bon courage, il y a plus sympa pour s’occuper un dimanche d’été 🙁
Merci pour l’info. Pour les mails, y’a t-il un risque de perdre les mails reçus depuis le début du problème (hivers vers 12h30 de mémoire) ?