Michael Hickins | Content Strategist | 16. Mai 2024
Geschäftskontinuität bringt Menschen und Technologie zusammen, um Organisationen zu helfen, sich auf Unterbrechungen des normalen Geschäftsbetriebs vorzubereiten und diese zu überwinden. Geschäftskontinuitätsplanung umfasst zwar Disaster Recovery (die Wiederherstellung von IT-Diensten nach einem unerwarteten Ausfall), ist aber umfangreicher angelegt. Das Ziel einer Strategie zur Geschäftskontinuität besteht darin, den Geschäftsbetrieb aufrechtzuerhalten, unabhängig davon, ob der Betrieb durch eine ungeplante Katastrophe wie ein Erdbeben oder ein geplantes Ereignis wie die Durchführung eines größeren Infrastruktur-Patches beeinträchtigt wird.
Unternehmensleiter nutzen die Geschäftskontinuität als Paradigma für die Aufrechterhaltung des Betriebs, wenn auch in vorübergehend eingeschränkter Kapazität, im Falle unerwarteter oder geplanter Unterbrechungen der normalen Geschäftsprozesse. Zu diesen Unterbrechungen können Naturkatastrophen, Cyberangriffe, bewaffnete Konflikte oder andere Fälle höherer Gewalt, globale Pandemien, Stromausfälle aufgrund von Stürmen oder Überschwemmungen, Infrastrukturausfälle, geplante Wartungsarbeiten und sogar das unerwartete Ausscheiden eines wichtigen Mitarbeiters gehören. Cloud-Computing-Technologien wie Containerisierung und Virtualisierung können dazu beitragen, dass Maßnahmen zur Geschäftskontinuität für Unternehmen jeder Größe erschwinglicher werden.
Wichtige Erkenntnisse
Unternehmen verfolgen in der Regel Strategien, um existenzielle Bedrohungen wie etablierte Wettbewerber, Marktneulinge, plötzliche Veränderungen im Kundenverhalten oder -geschmack und technologische Veränderungen abzuwehren.
Eine andere, schwerer vorhersehbare Bedrohung sind jedoch unerwartete, meist vorübergehende Ereignisse, die es dem Unternehmen erschweren oder unmöglich machen, den Betrieb wie gewohnt fortzusetzen. Naturereignisse wie Hurrikane und anhaltende Hitzewellen können zu einem Ausfall der Stromversorgung führen, die für den Betrieb von Einrichtungen oder kritischen IT-Services benötigt wird. Kriminelle Vereinigungen oder Nationalstaaten können IT-Vorgänge unterbrechen oder Daten als Lösegeld fordern. Andere Arten von Ereignissen, wie der unerwartete Tod oder das Ausscheiden von Schlüsselpersonal, Unterbrechungen der Lieferkette aufgrund von Krieg oder Streiks und Verbraucherboykotte, sind ebenso schwer zu planen.
Erfolgreiche Unternehmen entwickeln daher Pläne zur Aufrechterhaltung des Geschäftsbetriebs, die als Vorlage dafür dienen, wie Manager und andere Mitarbeiter reagieren sollten, wenn solche außergewöhnlichen Ereignisse eintreten.
Auf der anderen Seite sind Unternehmen, die keine Pläne zur Aufrechterhaltung des Geschäftsbetriebs haben, einer erheblichen Gefahr ausgesetzt. Selbst wenn man Variablen wie Branche, Unternehmensgröße und Geschäftsart berücksichtigt, kann die Ausfallzeit der Online-Präsenz eines Unternehmens allein zwischen 2.300 und 9.000 US-Dollar pro Minute kosten – und dabei sind die Kosten für die Schädigung des Rufs und der Geschäftsbeziehungen noch nicht berücksichtigt.
Die meisten Unternehmen können es verkraften, ihre Geschäftstätigkeit für kurze Zeit zu verlangsamen oder einzustellen. Banken, Versorgungsunternehmen, Gesundheitsdienstleister und Unternehmen in einigen anderen Branchen hingegen können sich diesen Luxus nicht leisten. Sie müssen gesetzliche Anforderungen befolgen und sicherstellen, dass sie ihren normalen Betrieb fast unmittelbar nach einer Unterbrechung wieder aufnehmen können.
In den meisten Fällen können es sich Unternehmen unabhängig von den gesetzlichen Anforderungen kaum leisten, dass ihre Aktivitäten über einen längeren Zeitraum unterbrochen werden, da selbst die geduldigsten Kunden früher oder später alternative Anbieter finden. Tatsächlich kann ein längerer Ausfall bei einem Konkurrenten anderen in der Branche die Möglichkeit bieten, Marktanteile zu gewinnen.
Bei der Planung der Geschäftskontinuität sollten Organisationen auch Partner, Lieferanten und sensible Lieferketten berücksichtigen, bei denen Ausfälle irreparable Kaskadeneffekte nach sich ziehen könnten.
Im einfachsten Sinne bedeutet Geschäftskontinuität, dass eine Organisation ihren Betrieb trotz Katastrophen, Ereignissen, böswilligen Handlungen oder anderen Unglücken, die den normalen Geschäftsablauf vorübergehend unterbrechen, fortsetzt. Dazu können folgende Aufgaben gehören:
Im Grunde genommen ist ein Geschäftskontinuitätsplan (BCP) nichts anderes als die einfache Bestätigung der Unternehmensführung, dass unvorhergesehene Störfälle, die sich oft der Kontrolle des Unternehmens entziehen, unvermeidlich sind und dass sie Maßnahmen ergreifen sollten, um sicherzustellen, dass das Unternehmen seine Geschäftstätigkeit fortsetzen kann, wenn auch für kurze Zeit in begrenztem Umfang.
Ein BCP muss den Disaster Recovery-Plan (DR) enthalten, der, wie der Name schon sagt, ein Rahmen für die Wiederherstellung von Systemen und vor allem von Daten nach einem unerwarteten Ausfall ist. Zu den Ereignissen, die einen solchen Ausfall verursachen können, gehören Hurrikane oder Tornados, die den Strom ausfallen lassen oder die Anreise zu Unternehmensbüros unmöglich machen, bewaffnete Konflikte, die Lieferketten unterbrechen, Cyberangriffe, die Systeme funktionsunfähig machen, und globale Pandemien, die Menschen dazu zwingen, von zu Hause aus zu arbeiten. Die häufigste Ursache für Katastrophen ist jedoch menschliches Versagen, z. B. wenn ein Mitarbeiter unwissentlich auf einen Phishing-Betrug hereinfällt oder ein Datenbankadministrator erst dann ein Software-Patch anwendet, wenn das System bereits kompromittiert wurde.
Und obwohl es stimmt, dass zukünftige Ereignisse nicht vorhersehbar sind, wäre es leichtsinnig, sich nicht auf sie vorzubereiten – und verstößt gegen Gesetze und Vorschriften, die viele Branchen regeln. Wie Dwight D. Eisenhower, der ehemalige US-Präsident und Oberbefehlshaber der Alliierten in Europa während des Zweiten Weltkriegs, feststellte: „Pläne sind wertlos, aber Planung ist alles.“
Mit anderen Worten: Unerwartete Ereignisse können die Details vieler Pläne irrelevant oder anachronistisch machen, aber allein der Planungsprozess hilft einer Organisation, sich auf das vorzubereiten, was als Nächstes kommen mag. Eisenhower sagte außerdem über Planung: „Wenn Sie nicht geplant haben, können Sie nicht anfangen zu arbeiten, zumindest nicht auf intelligente Weise.“
Dennoch ist DR ein wesentlicher, aber nicht der einzige Schlüsselbestandteil eines effektiven BCP. Ein umfassender BCP sollte folgende Elemente enthalten:
Die Planung der Geschäftskontinuität ist für das Überleben einer Organisation im Falle einer Naturkatastrophe oder einer anderen Störung des normalen Geschäftsbetriebs von entscheidender Bedeutung. Tatsächlich werden etwa 25 % der Unternehmen nach Katastrophen nicht wiedereröffnet, so die Federal Emergency Management Agency der USA. Unternehmen sollten die folgenden Schritte unternehmen, um einen effektiven BCP zu erstellen:
Nicht zuletzt raten Experten dazu, Wiederherstellungsvorgänge so weit wie möglich zu automatisieren, damit sich die Beteiligten und Mitarbeiter auf den allgemeinen Geschäftskontinuitätsplan konzentrieren können. Ein Beispiel hierfür ist der Einsatz von Failover-Systemen, die automatisch auf Backup-Server oder -Netzwerke umschalten, wenn die primären ausfallen. Automatisierung erhöht die Chancen auf ein positives, vorhersehbares Ergebnis.
Geschäftskontinuitätspläne sind nur so gut wie die Gewohnheiten der Menschen, die sie anwenden. Während es nahezu unmöglich ist, eine tatsächliche Katastrophe vorherzusagen, ist es durchaus möglich, ein Störfall zu simulieren, damit die Mitarbeiter die Maßnahmen üben können, die sie wahrscheinlich durchführen müssen. Bevor Tests durchgeführt werden können, müssen die Beteiligten den BCP gesehen und verinnerlicht haben.
Bei den Tests sollten die wichtigsten Elemente des Plans bewertet werden, darunter die Reaktionszeiten bei Strom- und IT-Ausfällen, die Funktionsfähigkeit interner und externer Kommunikationssysteme sowie die Alarmierungs- und Aktivierungsverfahren für Schlüsselpersonal.
Durch Tests werden die Menschen nicht nur mit ihren Aufgaben im Falle einer Störung vertraut gemacht, sondern es werden auch Lücken oder Schwachstellen im Plan aufgedeckt, sodass diese vor einem tatsächlichen Notfall behoben werden können.
Zu den Best Practices für diese Art von Tests gehören:
BCMs sollten mindestens einmal jährlich Tests durchführen und ein Format für die Weitergabe und Überprüfung der Ergebnisse durch die Beteiligten festlegen.
Geschäftskontinuitätspläne in bestimmten Branchen – insbesondere im Finanzdienstleistungssektor, in Versorgungsunternehmen und im Gesundheitswesen – unterliegen lokalen, nationalen und/oder internationalen Standards. Tatsächlich gelten laut DRI International, einer gemeinnützigen Beratungsfirma für Disaster Recovery, mehr als 120 Vorschriften für das Management der Geschäftskontinuität für eine Vielzahl von Branchen. Dazu gehören die US-amerikanischen Vorschriften der Security and Exchange Commission, der Financial Industry Regulatory Authority und des Sarbanes-Oxley-Gesetzes sowie das internationale Regelwerk für Banken BASEL III und die ISO 22301 der Internationalen Organisation für Normung.
Zu den weiteren Standards für die Geschäftskontinuität gehören die Standards SP 800-34 und 24762 des National Institute of Standards and Technology sowie der Standard NFPA 1600 der US National Fire Protection Association für Kontinuitäts-, Notfall- und Krisenmanagement. Zu den allgemeineren Vorschriften zur Geschäftskontinuität gehört die Datenschutz-Grundverordnung der EU, die aufgrund ihrer Regelungen zur Speicherung und Verbreitung von Daten auch für die Geschäftskontinuität relevant ist.
Geschäftskontinuität und Disaster Recovery sind eng miteinander verbunden. Beide sind Organisationspläne, um eine potenziell katastrophale Betriebsunterbrechung zu überstehen und sich schnell davon zu erholen, und beide sind auch eng mit der IT verbunden, da Unternehmen auf IT-Infrastruktur und -Anwendungen angewiesen sind.
Um nur ein Beispiel dafür zu nennen, wie abhängig alle Unternehmen von der IT geworden sind: Die meisten professionellen Sportstätten in den Vereinigten Staaten akzeptieren keine Barzahlungen mehr, was bedeutet, dass computergestützte Kassensysteme betriebsbereit sein müssen, damit sie Lebensmittel, Getränke, Ausrüstung und andere Waren verkaufen können.
Die ISO 22301 definiert Geschäftskontinuität als „dokumentierte Verfahren, die Organisationen dabei unterstützen, nach einer Unterbrechung zu reagieren, sich zu erholen, den Betrieb wieder aufzunehmen und auf ein vordefiniertes Betriebsniveau zurückzukehren.“ Disaster Recovery ist ein Teilbereich der Geschäftskontinuität, der die Wiederherstellung von IT-Services umfasst, bei Bedarf auch schrittweise. Ein wesentlicher Unterschied zwischen Geschäftskontinuität und DR besteht darin, dass die Geschäftskontinuität alle Geschäftsunterbrechungen berücksichtigt, auch die geplanten.
Die Geschäftskontinuität hängt von einer Vielzahl von Faktoren ab, darunter die Branche, in der ein Unternehmen tätig ist, und die Art der Störung selbst. Im Informationszeitalter hängt jedoch fast die gesamte Geschäftskontinuität von einem gewissen Grad an IT-Funktionalität ab. Daher ist es für Unternehmen von entscheidender Bedeutung, sicherzustellen, dass sie über angemessene redundante Infrastrukturen und Datenreplikationen verfügen, nicht nur, um den normalen Geschäftsablauf zu unterstützen, sondern auch, um sicherzustellen, dass das Unternehmen während eines Störfalls effizient genug arbeiten kann.
Je kürzer die RTOs und RPOs, desto besser die Kontinuität. Die Kosten für das Erreichen eines RTO oder RPO steigen jedoch, je kürzer das jeweilige Ziel ist. Die Wahl der richtigen Architektur kann helfen. Unternehmensleiter sollten die Nutzung von Cloud-Computing und, im Idealfall, Containern in Betracht ziehen, um kritische Daten weiter von Systemen zu isolieren, die gestört wurden. Sie sollten außerdem nach Cloud-Service-Anbietern mit geografisch verstreuten Failover-Einrichtungen suchen.
Einer der Vorteile des Cloud-Computing aus Sicht der Geschäftskontinuität sind sogenannte „Pilotlicht-Bereitstellungen“, bei denen sekundäre Standorte oder Kopien von Unternehmens-Workloads so klein wie eine einzelne virtuelle Maschine (VM) oder ein Container sein können. Im Falle eines Failovers kann diese einzelne VM oder dieser einzelne Container bei Bedarf einen automatisierten Prozess starten, mit dem Ihre Organisation den Rest der Infrastruktur hochfahren kann. Und durch den Einsatz eines Pilotlichts müssen Organisationen nur für diese eine Ressource bezahlen, anstatt ein ganzes System zu replizieren.
Eine weitere Strategie ist die sogenannte „blau-grüne“ Architektur, bei der eine Organisation anstelle von vier bis sechs redundanten Umgebungen für Entwicklung und Tests und einer separaten für die Produktionsbereitstellung nur zwei redundante, verteilte Umgebungen einsetzt. Nehmen wir an, die „blaue“ Umgebung ist die Produktion und die „grüne“ ist die Entwicklung und die Tests. Wenn die Entwicklung abgeschlossen ist, wird die „grüne“ Umgebung zur primären Produktionsumgebung, und die „blaue“ Umgebung wird für Entwicklung, Tests und Disaster Recovery verwendet. Dieser Zyklus wiederholt sich anschließend.
Oracle macht es einfacher und erschwinglicher, einen ganzheitlichen Geschäftskontinuitätsplan zu entwickeln. Da Oracle Cloud Infrastructure (OCI) später als andere Hyperscale-Clouds entwickelt wurde, wurde sie im Vergleich zu konkurrierenden Clouds für eine bessere Effizienz und Zuverlässigkeit, geringere Latenz und überlegene Flexibilität konzipiert. Zusätzlich zu Containern bietet OCI flexible virtuelle Maschinen an, sodass Unternehmen nur so viel Rechenleistung kaufen können, wie sie benötigen. Andere Anbieter bieten weniger Flexibilität und verlangen von den Kunden, dass sie ihre Instanzen überdimensionieren, was sie mehr Geld kostet. OCI verfügt über mehrere geografisch getrennte Cloud-Regionen in vielen Ländern, sodass Kunden die Vorschriften zur Datenhoheit einhalten können und gleichzeitig über unterschiedliche Standorte für die Zwecke der Geschäftskontinuität verfügen.
Auf der Grundlage jahrzehntelanger Entwicklungserfahrung und Kundenfeedback aus der Praxis hat Oracle bewährte Verfahren entwickelt, die als Oracle Maximum Availability Architecture (MAA) bezeichnet werden. Oracle MAA bietet die Blaupause für die Implementierung von Lösungen für Hochverfügbarkeit, Skalierbarkeit, Disaster Recovery und Datenschutz in Oracle-Datenbankumgebungen.
Die Best Practices von Oracle MAA, die von einem Team von Oracle-Entwicklern gepflegt werden, validieren kontinuierlich die integrierte Nutzung von Oracle Database High Availability-Funktionen wie Oracle Real Application Clusters und Oracle Data Guard unter Verwendung von Chaos-Engineering-Techniken und anderen Testmethoden.
Oracle MAA wird durch den Oracle Cloud Infrastructure Full Stack Disaster Recovery-Service erweitert. OCI Full Stack Disaster Recovery orchestriert den Übergang von Datenverarbeitung, Datenbanken und Anwendungen zwischen OCI-Regionen aus der ganzen Welt per Mausklick. Kunden können die erforderlichen Schritte zur Wiederherstellung eines oder mehrerer Geschäftssysteme automatisieren, ohne vorhandene Infrastruktur, Datenbanken oder Anwendungen neu zu gestalten oder neu zu strukturieren und ohne dass spezielle Verwaltungs- oder Konvertierungsserver erforderlich sind.
Darüber hinaus verfügen die Oracle Autonomous Database und der Oracle Exadata Database Service über eine integrierte Redundanz, sodass Kunden keine zusätzlichen Kosten für die Datenreplikation innerhalb derselben Verfügbarkeitszone zahlen müssen.
Die Erwartungen an die Geschäftskontinuität haben sich mit der Weiterentwicklung der Technologielandschaft verändert. Zum Beispiel betrachteten die meisten Unternehmen RTOs früher als sogenannte Tier-1-Anwendungen, aber kostengünstigere Cloud-Computing-Optionen wie Pilotlichter bedeuten, dass Unternehmen es sich leisten können, Business-Continuity-Pläne für alle ihre Anwendungen zu erstellen.
Die Cloud ist der Schlüssel zu einer erfolgreichen und erschwinglichen Geschäftskontinuitätsstrategie. Erfahren Sie den Grund.
Was sind die 4 Säulen der Geschäftskontinuität?
Im Grunde genommen besteht die Geschäftskontinuität darin, ein Team zusammenzustellen, das sich auf die Geschäftskontinuität konzentriert, zu bewerten, welche Bereiche des Unternehmens bei einem Störfall am stärksten gefährdet sind, einen Plan zur Aufrechterhaltung des Betriebs auf einem minimalen Niveau zu erstellen und diesen Plan dann regelmäßig zu üben und zu testen.
Was ist der Unterschied zwischen Geschäftskontinuität und Disaster Recovery?
Geschäftskontinuität ist ein organisatorischer Ansatz, der sicherstellt, dass eine Organisation auch bei einer Unterbrechung, ob geplant oder ungeplant, in irgendeiner Form weiterarbeiten kann, während sich die Disaster Recovery auf die Wiederherstellung von IT-Systemen konzentriert.
Warum ist ein BCP wichtig?
Organisationen, die keine aktuellen Geschäftskontinuitätspläne vorweisen können, sind einem größeren Risiko ausgesetzt als solche, die über solche Pläne verfügen. Im schlimmsten Fall können sie aufgrund einer erheblichen unerwarteten Störung des normalen Betriebs, die Kunden zur Konkurrenz treibt, Datenverluste verursacht und deren Behebung sich als kostspielig erweist, dauerhaft aus dem Geschäft ausscheiden.