Was ist eine Datenbank?

24. November 2020

Was ist eine Datenbank?

Datenbank definiert

Eine Datenbank ist eine organisierte Sammlung von strukturierten Informationen oder Daten, die typischerweise elektronisch in einem Computersystem gespeichert sind. Eine Datenbank wird normalerweise von einem Datenbankverwaltungssystem (DBMS) gesteuert. Zusammen werden die Daten und das DBMS sowie die damit verbundenen Anwendungen als Datenbanksystem bezeichnet, das oft auf die reine Datenbank beschränkt ist.

Daten innerhalb der gängigsten Arten von heutigen Datenbanken werden typischerweise in Zeilen und Spalten in einer Reihe von Tabellen modelliert, um die Verarbeitung und Datenabfrage effizient zu gestalten. Die Daten können dann einfach abgerufen, verwaltet, modifiziert, aktualisiert, kontrolliert und organisiert werden. Die meisten Datenbanken verwenden die Structured Query Language (SQL) zum Schreiben und Abfragen von Daten.

Was ist Structured Query Language (SQL)?

SQL ist eine Programmiersprache, die von fast allen relationalen Datenbanken zum Abfragen, Manipulieren und Definieren von Daten sowie für Zugriffskontrolle verwendet wird. SQL wurde erstmals in den 1970er Jahren bei IBM mit Oracle als wichtigstem Partner entwickelt und führte zur Implementierung des SQL ANSI-Standards. SQL hat zu vielen Erweiterungen von Unternehmen wie IBM, Oracle und Microsoft beigetragen. Obwohl SQL heute noch weit verbreitet ist, entstehen immer mehr neue Programmiersprachen.

Datenbankevolution

Datenbanken haben sich seit ihrer Entstehung in den frühen 1960er Jahren dramatisch weiterentwickelt. Navigationsdatenbanken wie die hierarchische Datenbank (die sich auf ein baumähnliches Modell stützte und nur eine 1:n-Beziehung ermöglichte) und die Netzwerkdatenbank (ein flexibleres Modell, das mehrere Beziehungen ermöglichte) waren die ursprünglichen Systeme, die zum Speichern und Bearbeiten von Daten verwendet wurden. Diese frühen Systeme waren zwar einfach, aber unflexibel. In den 1980er Jahren erfreuten sich relationale Datenbanken einer großen Beliebtheit, gefolgt von objektorientierten Datenbanken in den 1990er. In jüngster Zeit entstanden NoSQL-Datenbanken als Reaktion auf das Wachstum des Internets und die Notwendigkeit einer schnelleren Geschwindigkeit und Verarbeitung unstrukturierter Daten. Heute gehen Cloud-Datenbanken und selbstverwaltende Datenbanken neue Wege bei der Sammlung, Speicherung, Verwaltung und Nutzung von Daten.

Was ist der Unterschied zwischen einer Datenbank und einer Kalkulationstabelle?

Datenbanken und Tabellenkalkulationen (wie z. B. Microsoft Excel) sind beide bequeme Methoden zum Speichern von Informationen. Die Hauptunterschiede zwischen den beiden sind:

  • Speicherung und Bearbeitung von Daten
  • Personen, die auf die Daten zugreifen können
  • Datenmenge, die gespeichert werden kann

Tabellenkalkulationen wurden ursprünglich für einen einzelnen Benutzer entwickelt, und ihre Eigenschaften spiegeln dies wider. Sie eignen sich hervorragend für einzelne Benutzer oder eine kleine Anzahl von Benutzern, die nicht viele unglaublich komplizierte Datenbearbeitungsprozesse durchführen müssen. Datenbanken hingegen sind so konzipiert, dass sie viel größere Sammlungen von organisierten Informationen manchmal in großen Mengen enthalten. Datenbanken ermöglichen es mehreren Benutzern gleichzeitig, mit hochkomplexer Logik und Sprache schnell und sicher auf die Daten zuzugreifen und sie abzufragen.

Datenbanktypen

Es gibt viele verschiedene Datenbanktypen. Was der beste Datenbanktyp für ein bestimmtes Unternehmen ist, hängt davon ab, wie das Unternehmen die Daten verwenden möchte.

    Relationale Datenbanken

  • In den achtziger Jahren dominiertenrelationale Datenbanken. Elemente in einer relationalen Datenbank sind als ein Satz von Tabellen mit Spalten und Zeilen organisiert. Die relationale Datenbanktechnologie bietet den effizientesten und flexibelsten Weg, um auf strukturierte Informationen zuzugreifen.
  • Objektorientierte Datenbanken

  • Informationen in einer objektorientierten Datenbank werden wie bei der objektorientierten Programmierung in Form von Objekten dargestellt.
  • Verteilte Datenbanken

  • Eine verteilte Datenbank besteht aus zwei oder mehr Dateien, die sich an verschiedenen Standorten befinden. Die Datenbank kann auf mehreren Rechnern gespeichert werden, sich an einem einzigen physischen Standort befinden oder über verschiedene Netzwerke verteilt sein.
  • Data Warehouses

  • Als ein zentrales Daten-Repository handelt es sich bei einem Data Warehouse um einen Datenbanktyp, der speziell für schnelle Abfragen und Analysen entwickelt wurde.
  • NoSQL-Datenbanken

  • Eine NoSQL- oder nicht-relationale Datenbank ermöglicht die Speicherung und Manipulation unstrukturierter und semistrukturierter Daten (im Gegensatz zu einer relationalen Datenbank, die eindeutig definiert, wie alle in die Datenbank eingegebenen Daten zusammengesetzt sein müssen). NoSQL-Datenbanken wurden immer beliebter, da Webanwendungen immer häufiger und komplexer wurden.
  • Diagrammdatenbanken

  • Eine Diagrammdatenbank speichert Daten in Form von Entitäten und Beziehungen zwischen Entitäten.
  • OLTP-Datenbanken. Eine OLTP-Datenbank ist eine schnelle, analytische Datenbank, die für eine Vielzahl von Transaktionen durch mehrere Benutzer ausgelegt ist.

Dies sind nur einige der mehreren Dutzend Datenbanktypen, die heute im Einsatz sind. Andere, weniger verbreitete Datenbanken sind auf sehr spezifische wissenschaftliche, finanzielle oder andere Funktionen zugeschnitten. Neben den verschiedenen Datenbanktypen treiben Veränderungen in der Technologieentwicklung und dramatische Fortschritte wie Cloud und Automatisierung Datenbanken in völlig neue Richtungen. Zu einigen der neuesten Datenbanken zählen

    Open-Source-Datenbanken

  • Ein Open-Source-Datenbanksystem ist durch Open-Source-Quellcode charakterisiert; solche Datenbanken umfassen SQL- oder NoSQL-Datenbanken.
  • Cloud-Datenbanken

  • Eine Cloud-Datenbank ist eine Sammlung von strukturierten oder unstrukturierten Daten, die sich auf einer privaten, öffentlichen oder hybriden Cloud Computing-Plattform befinden. Es gibt zwei Arten von Cloud-Datenbankmodellen: traditionell und Database-as-a-Service (DBaaS). Mit DBaaS werden administrative Aufgaben und die Wartung von einem Serviceprovider übernommen.
  • Multimodale Datenbank

  • Multimodale Datenbanken vereinen verschiedene Arten von Datenbankmodellen in einem einzigen, integrierten Backend. Diese können verschiedene Datentypen verarbeiten.
  • Dokument-/JSON-Datenbank

  • Dokumentdatenbanken, die zum Speichern, Abrufen und Verwalten dokumentenorientierter Informationen entwickelt wurden, bieten eine moderne Möglichkeit, Daten im JSON-Format und nicht in Form von Zeilen und Spalten zu speichern.
  • Selbstverwaltende Datenbanken

  • Selbstverwaltende Datenbanken (auch bekannt als autonome Datenbanken) sind als der neueste und bahnbrechendste Datenbanktyp cloudbasiert und verwenden Machine Learning, um Datenbankoptimierung, Sicherheit, Backups, Updates und andere Routineverwaltungsaufgaben zu automatisieren, die traditionell von Datenbankadministratoren durchgeführt werden.

Was ist eine Datenbanksoftware?

Datenbanksoftware wird zum Erstellen, Bearbeiten und Verwalten von Datenbankdateien und -datensätzen verwendet, um die Erstellung von Dateien und Datensätzen, die Dateneingabe, die Datenbearbeitung, die Aktualisierung und die Berichterstellung zu vereinfachen. Die Software steuert auch die Datenspeicherung und -sicherung sowie die Berichterstellung, die Mehrfach-Zugriffskontrolle und die Sicherheit. Eine starke Datenbanksicherheit ist heutzutage besonders wichtig, da es immer häufiger zu Datendiebstahl kommt. Datenbanksoftware wird manchmal auch als „Datenbankverwaltungssystem“ (DBMS) bezeichnet.

Die Datenbanksoftware vereinfacht die Datenverwaltung, da Benutzer Daten in strukturierter Form speichern und dann darauf zugreifen können. In der Regel verfügt sie über eine grafische Oberfläche, mit deren Hilfe die Daten erstellt und verwaltet werden können. In einigen Fällen können Benutzer mithilfe von Datenbanksoftware auch eigene Datenbanken erstellen.

Was ist ein Datenbankverwaltungssystem (DBMS)?

Eine Datenbank erfordert in der Regel ein umfassendes Datenbanksoftwareprogramm, das als Datenbankverwaltungssystem (DBMS) bezeichnet wird. Ein DBMS dient als Schnittstelle zwischen der Datenbank und ihren Endbenutzern oder Programmen, die es den Benutzern ermöglicht, Informationen abzurufen und zu aktualisieren sowie ihre Organisation und Optimierung zu verwalten. Ein DBMS erleichtert auch die Überwachung und Kontrolle von Datenbanken und ermöglicht eine Vielzahl von administrativen Abläufen wie Leistungsüberwachung, Abstimmung sowie Backup und Wiederherstellung.

Einige Beispiele für gängige Datenbanksoftware oder DBMSs umfassen MySQL, Microsoft Access, Microsoft SQL Server, FileMaker Pro, Oracle Database und dBASE.

Was ist eine MySQL Database?

MySQL ist ein relationales, auf SQL basierendes Open-Source-Datenbankmanagementsystem. Es wurde für Webanwendungen entwickelt und optimiert und kann auf jeder Plattform ausgeführt werden. Mit dem Auftauchen neuer und unterschiedlicher Anforderungen an das Internet, wurde MySQL zur Plattform der Wahl für Webentwickler und webbasierte Anwendungen. MySQL ist für die Verarbeitung von Millionen von Anfragen und Tausenden von Transaktionen konzipiert und ist damit eine beliebte Wahl für E-Commerce-Unternehmen, die viele Geldüberweisungen verwalten müssen. On-Demand-Flexibilität ist das Hauptmerkmal von MySQL.

MySQL ist das DBMS hinter einigen der führenden Websites und webbasierten Anwendungen der Welt, darunter Airbnb, Uber, LinkedIn, Facebook, Twitter und YouTube.

Verwendung von Datenbanken zur Verbesserung der Unternehmensperformance und Entscheidungsfindung

Durch die massive Datenerfassung aus dem Internet der Dinge, die Alltag und Industrie auf der ganzen Welt verändern, haben Unternehmen heute Zugriff auf mehr Daten als je zuvor. Zukunftsorientierte Unternehmen können heute Datenbanken nutzen, um über die grundlegende Datenspeicherung und Transaktionen hinaus große Datenmengen aus mehreren Systemen zu analysieren. Mithilfe von Datenbanken und anderen IT- und Business Intelligence-Tools können Unternehmen die erfassten Daten jetzt nutzen, um effizienter zu arbeiten, bessere Entscheidungen zu treffen und agiler und skalierbarer zu werden. Die Optimierung des Datenzugriffs und -durchsatzes ist heute für Unternehmen von entscheidender Bedeutung, da mehr Datenvolumen nachverfolgt werden muss. Es ist entscheidend, eine Plattform zu haben, die die Leistungsfähigkeit, Skalierbarkeit und Agilität bieten kann, die Unternehmen beim langfristigen Wachstum benötigen.

Die selbstverwaltende Datenbank kann diese Möglichkeiten deutlich verbessern. Selbstverwaltende Datenbanken automatisieren teure und zeitaufwändige manuelle Prozesse und befreien damit geschäftliche Benutzer von der Aufgabe, ihre Daten proaktiver zu verwalten. Durch die direkte Steuerung der Möglichkeiten zur Erstellung und Nutzung von Datenbanken erhalten die Benutzer mehr Kontrolle und Unabhängigkeit bei gleichzeitiger Einhaltung wichtiger Sicherheitsstandards.

Datenbank-Herausforderungen

Große Unternehmensdatenbanken von heute unterstützen oft sehr komplexe Abfragen und es wird erwartet, dass sie nahezu sofort auf diese Anfragen reagieren. Aus diesem Grund sind Datenbankadministratoren ständig damit beschäftigt, eine Vielzahl von Methoden zur Leistungssteigerung bereitzustellen. Zu den häufigen Herausforderungen, mit denen sie konfrontiert sind, zählen:

  • Aufnahme signifikanter Steigerungen des Datenvolumens. Aufgrund der explosionsartigen Zunahme von Daten, die von Sensoren, vernetzten Rechnern und Dutzenden anderer Quellen stammen, müssen Datenbankadministratoren ihre Unternehmensdaten effizient verwalten und organisieren.
  • Gewährleistung der Datensicherheit. Datenverletzungen sind heutzutage an der Tagesordnung und der Einfallsreichtum der Hacker nimmt immer weiter zu. Heute ist es wichtiger denn je, sicherzustellen, dass die Daten sicher und für die Benutzer leicht zugänglich sind.
  • Mit der Nachfrage Schritt halten. In der heutigen schnelllebigen Geschäftswelt benötigen Unternehmen Echtzeitzugriff auf ihre Daten, um zeitnahe Entscheidungen zu treffen und neue Möglichkeiten zu nutzen.
  • Verwaltung und Wartung von Datenbanken und Infrastruktur. Datenbankadministratoren müssen die Datenbank ständig auf Probleme überwachen und präventive Wartungsmaßnahmen sowie Software-Upgrades und Patches durchführen. Mit zunehmender Komplexität der Datenbanken und dem wachsenden Datenvolumen müssen Unternehmen zusätzliche Fachkräfte für die Überwachung und Optimierung ihrer Datenbanken einstellen.
  • Aufhebung der Skalierbarkeitseinschränkungen. Ein Unternehmen muss wachsen, wenn es überleben will, und seine Datenverwaltung muss mit ihm wachsen. Für Datenbankadministratoren ist es jedoch sehr schwierig vorherzusagen, wie viel Kapazität das Unternehmen benötigt, insbesondere bei lokalen Datenbanken.
  • Gewährleistung von Datenresidenz, Datensouveränität oder Latenzanforderungen. Einige Organisationen verfügen über Anwendungsfälle, die besser für die On-Premises-Ausführung geeignet sind. In diesen Fällen sind vorkonfigurierte und für die Ausführung der Datenbank vorab optimierte Engineered Systems bestens geeignet.

All diese Herausforderungen zu meistern, kann zeitaufwendig sein und Datenbankadministratoren daran hindern, strategische Aufgaben wahrzunehmen.

So verbessert autonome Technologie die Datenbankverwaltung

Selbstverwaltende Datenbanken sind der Zukunftstrend. Sie bieten eine faszinierende Möglichkeit für Unternehmen, die die beste verfügbare Datenbanktechnologie nutzen wollen, diese Technologie unkompliziert auszuführen und zu betreiben.

Selbstverwaltende Datenbanken nutzen cloudbasierte Technologie und Machine Learning zur Automatisierung vieler für die Verwaltung von Datenbanken erforderlichen Routineaufgaben, unter anderem in den Bereichen Abstimmung, Sicherheit, Backups, Updates sowie bei anderen Routineverwaltungsaufgaben. Durch die Automatisierung dieser aufwändigen Aufgaben erhalten Datenbankadministratoren mehr Spielraum, um sich mit strategischen Aufgaben zu befassen. Die selbstverwaltenden, selbstsichernden und selbstreparierenden Funktionen von selbstverwaltenden Datenbanken werden die Art und Weise, wie Unternehmen ihre Daten verwalten und sichern, revolutionieren und zu Leistungsvorteilen, geringeren Kosten und verbesserter Sicherheit führen.

Die Zukunft von Datenbanken und Autonomous Databases

Die erste autonome Datenbank wurde Ende 2017 eingeführt. Mehrere unabhängige Branchenanalysten erkannten schnell das Technologiepotenzial und die möglichen Auswirkungen auf Computing.

Ein Bericht von Wikibon 2021 (PDF) lobte autonome Datenbanktechnologie und sagte: „Oracle hat bei weitem die beste Tier-1 Cloud Database Platform ... Wikibon ist der Meinung, dass Oracle die stärkste Cloud Database Platform mit Autonomous Database hat.“

Und KuppingerCole's Leadership Compass 2021 (PDF) sagte: „Die Oracle Autonomous Database, die Bereitstellungs-, Verwaltungs-, Optimierungs- und Upgradeprozesse von Datenbankinstanzen ohne Ausfallzeiten vollständig automatisiert, verbessert nicht nur die Sicherheit und Compliance sensibler gespeicherter Daten wesentlich in Oracle-Datenbanken, sondern liefert auch ein überzeugendes Argument für das Verschieben dieser Daten in die Oracle Cloud.“ Da Oracle Autonomous Database auf der hochverfügbaren und skalierbaren Architektur von Oracle Exadata basiert, ist es möglich, das Datenbank-Deployment einfach zu skalieren, wenn die Anforderungen wachsen.