Stellungnahme zum Stromausfall im Rechenzentrum

Foto Steffen Griesel
02.11.2014 23:55
von Steffen Griesel

Wir hatten am Samstag durch einen Stromausfall in unserem Rechenzentrum in Frankfurt einen mehrstündigen Clusterausfall, weil die Notstromversorgung nicht funktionierte. Unseren Kunden wurde mittlerweile die Stellungnahme des Rechenzentrums übersandt.

Verfügbarkeit des Clusters

Unser aller Business, ob als Händler oder Softwaredienstleister, hängt von einer stabilen Cloud ab. Wir hatten bis einschließlich Oktober ein sehr stabiles Jahr 2014 mit einer Verfügbarkeit von 99,98%, da wir permanent an der Optimierung des Server-Clusters arbeiten. Es ist daher für uns ein herber Rückschlag, dass beim gestrigen Stromausfall die Sicherheitsroutine unseres Providers im Rechenzentrum versagt und die Notstromzufuhr trotz entsprechender Vorkehrungen nicht funktioniert hat. Die aktuelle Verfügbarkeit liegt jetzt im Blick auf das laufende Jahr bei 99,89%. Wir werden jetzt erhebliche Mittel in einen weiteren Standort investieren.

Ist-Zustand

Das plentymarkets Cluster wurde in den letzten Jahren auf allen Ebenen redundant ausgebaut. Jede lebenswichtige Serverkomponente ist mindestens doppelt vorhanden. Weiterhin wurden Lösungen implementiert, welche im Falle eines Ausfalls die alternative Hardwarekomponente aktiviert und deren Aufgaben übernimmt. Dieser Ausbau wurde zuerst auf Ebene der Firewalls vorgenommen und darauf bei den Webservern fortgesetzt. Die Webserver und die mittlerweile vorgeschalteten Proxy-Server sind in unterschiedliche Segmente unterteilt. Die automatische Prüfung, welcher Server erreichbar ist und somit Anfragen verarbeiten kann, wird durch mehrere Loadbalancer gesteuert. Diese sind ebenfalls so eingerichtet, dass deren Aufgaben bei einem Ausfall durch ein Ersatzsystem übernommen werden kann. Jedes plentymarkets System verfügt über eine Datenbank. Diese wird immer auf zwei Datenbankservern vorgehalten. Änderungen werden direkt zu dem zweiten Server übertragen, um bei einem Ausfall direkt den aktuellen Datenstand bereitstellen zu können. Ihr Webspace wird auf Storage-Servern vorgehalten, auch diese sind mehrfach vorhanden und werden ständig synchron gehalten.

Soll-Zustand

Wir werden jetzt umgehend mit der konzeptionellen Arbeit an einem zweiten Standort beginnen. Das ist angesichts der Komplexität unseres bestehenden Server-Clusters kein triviales Unterfangen. Die Herausforderung zweier Standorte besteht im Wesentlichen in einem optimalen Konzept für die Synchronisierung großer Datenmengen in kürzester Zeit und einer automatischen Lösung, welche die Auslieferung der Anfragen über das zweite Rechenzentrum vornimmt. Die Umsetzung solcher Konzepte für klassische Webseiten ist sehr einfach. In unserem Fall ändern sich sekündlich große Datenmengen, schließlich werden permanent Aufträge und somit Änderungen am Warenbestand vorgenommen. Wir werden hier einen passenden Lösungsansatz erarbeiten und in die Umsetzung investieren, damit sich die Stabilität des Server-Clusters weiter erhöht.

Zukunft gestalten

Darüber hinaus sind alle an der Zukunft von plentymarkets interessierten User zur nächstjährigen „plentymarkets E-Commerce Zukunftskonferenz“ eingeladen, die am Nachmittag des 27.02.2015 unmittelbar vor dem eigentlichen plentymarkets Online-Händler-Kongress stattfinden wird. Diese Veranstaltung wird als Open-Space-Konferenz konzipiert, um ein hohes Maß an Diskussion und Beteiligung zu gewährleisten. Bei einer Open Space Konferenz (open space = engl. für offener Raum) gibt es ein Leitthema, aber keine festgelegten Referenten oder vorbereitete Arbeitsgruppen. Die Teilnehmer bestimmen selbst, wer wie lange zu welchen Themen arbeiten will. Die Ergebnisse der Zukunftskonferenz werden dann am Kongresstag allen Teilnehmern zugänglich gemacht. Wir halten ein solches Vorgehen in der jetzigen Phase für sinnvoll, um die unterschiedlichen Interessen der User auszuloten und eine Orientierung zu bekommen, in welche Richtung die Weiterentwicklung von plentymarkets zukünftig gehen soll. Die Teilnahme ist kostenfrei.



Vorheriger Blog

Stromausfall im Rechenzentrum: Bitte prüfen Sie Ihr System!

Zum vorherigen Blog

Nächster Blog

Dynamischer Export: individuelle Kundendatenfelder

Zum nächsten Blog

Nach oben