Explanation for the interuption of service of today

Announcements about Eurobilltracker or this forum

Moderators: avij, Phaseolus, eddydevries, dserrano5, Nerzhul, claudio vda

Post Reply
EuroBillTracker
Euro-Expert
Euro-Expert
Posts: 704
Joined: Mon Feb 04, 2002 2:53 pm
Location: Paris, France
Contact:

Explanation for the interuption of service of today

Post by EuroBillTracker »

Here is the message from the top guy at OVH, the hosting company. I don't have time to translate but if you do, go ahead... or if someone wants to play with babelfish.altavista.com and post it, go ahead...

-------------------------------------------------------------------------------------

Salut,
Nous avons eu une panne ce matin de plus de 3h pour mutualisé
et pour certains dédié plus importante. La derniere machine
a été remonté il y a quelques minutes.

La panne a touché alétoirement certainnes baies dont la baie
la plus importante, celle de netapp principal. C'est pourquoi
l'ensemble des sites ont été en panne ainsi que l'email.
Pour les dédiés ça a touché 5-6 baies soit environ 80-100
machines.

En bref, c'est la plus importante panne qu'on n'a jamais eu.

L'origine de la panne est problement un défaut de masse
sur certainnes alims des serveurs. Ce qui a provoqué des
differences des tentions entre les differents machines qui
sont reliés à un même apc (la baie étant sur la masse ainsi
que l'apc) et une mise en protection des alims. Il a fallu
ouvrir une 20ène des machines pour remettre les alim en marche.
Ce qui explique que seulement certains dijoncteurs ont sauté.
Nous avons eu 1 machine cassée completement (alim + boitier)
et le serveur a été remplacée. L'une des alims de netapp a
été cassé aussi et on vient de la changer.

Machines étant en fonctionnement, on est en train de vérifier
les masses sur chaque baie et chaque apc. Si ce que je reconte
est vrai on devrait trouver des baies et des apc sans cable
masse. Biensûr les cables 220v sont déjà avec la masse et
donc chaque serveur a branché sur la masse.
Nous allons désormais viser un cable de masse en plus de la
masse dans le cable d'alim sur chaque machine et le relier
l'ensemble à la même masse de la baie. Nous allons aussi
installer des galvanometres pour calculer le courant de
fuite sur chaque baie.

Les logs des mutualisés auront 24h de retard. Les emails
ne sont pas perdus. Ils vont arrivés dans la journée.

Pour les serveurs dédiés, nous allons jouer les SLA. Merci
de nous contacter en precisant l'ip et le nom de la machine
ainsi que le temps de la panne que la machine a subit.

Désolé encore.

Amicalemetn
octave
Post Reply

Return to “Announcements”