Datenmanagement ist das sichere, effiziente und kostengünstige Erfassen, Speichern und Nutzen von Daten. Das Ziel des Datenmanagements besteht darin, Mitarbeitern, Organisationen und verbundenen Unternehmen dabei zu helfen, die Verwendung von Daten im Rahmen von Richtlinien und Vorschriften zu optimieren, damit sie Entscheidungen treffen und Maßnahmen ergreifen können, die den Nutzen für das Unternehmen maximieren. Eine robuste Datenmanagementstrategie ist wichtiger denn je, da Unternehmen zunehmend auf immaterielle Ressourcen angewiesen sind, um Werte zu schaffen.
Die Verwaltung digitaler Daten in einem Unternehmen beinhaltet eine breite Palette von Aufgaben, Richtlinien, Verfahren und Vorgehensweisen. Der Bereich des Datenmanagements ist breit gefächert und umfasst Faktoren wie die Vorgehensweise beim:
Eine formelle Datenmanagementstrategie befasst sich mit den Aktivitäten von Nutzern und Administratoren, den Funktionen von Datenmanagementtechnologien, den regulatorischen Anforderungen und dem Bedarf des Unternehmens, aus seinen Daten Nutzen zu ziehen.
In der digitalen Wirtschaft von heute sind Daten eine Art Kapital, ein wirtschaftlicher Produktionsfaktor für digitale Güter und Services. So wie ein Autohersteller kein neues Modell herstellen kann, wenn ihm das nötige finanzielle Kapital fehlt, kann er keine autonomen Fahrzeuge konstruieren, wenn die Daten für die Eingabe der Bordalgorithmen fehlen. Diese neue Rolle der Daten hat Auswirkungen auf die Wettbewerbsstrategie sowie auf die Zukunft des Computing.
Angesichts dieser zentralen und unternehmenskritischen Rolle von Daten sind starke Managementpraktiken und ein robustes Managementsystem für jedes Unternehmen unerlässlich, unabhängig von Größe oder Typ.
Unternehmen von heute benötigen eine Datenmanagementlösung, mit der sich Daten auf einer vielfältigen, aber einheitlichen Datenebene effizient verwalten lassen. Datenmanagementsysteme basieren auf Datenmanagementplattformen und können Datenbanken, Data Lakes und Data Warehouses, Big Data-Managementsysteme, Datenanalysen und mehr umfassen.
All diese Komponenten arbeiten als „Datendienstprogramm“ zusammen, um die Datenverwaltungsfunktionen bereitzustellen, die ein Unternehmen für seine Anwendungen benötigt, sowie die Analysen und Algorithmen, die die von diesen Anwendungen stammenden Daten verwenden. Obwohl Datenbankadministratoren (DBAs) mit den aktuellen Tools viele der herkömmlichen Managementaufgaben automatisieren können, sind aufgrund der Größe und Komplexität der meisten Datenbankbereitstellungen immer noch manuelle Eingriffe erforderlich. Mit jedem manuellen Eingriff steigt die Wahrscheinlichkeit von Fehlern. Die Reduzierung des Bedarfs an manuellem Datenmanagement ist ein zentrales Ziel einer neuen Datenmanagementtechnologie, der autonomen Datenbank.
Der wichtigste Schritt bei der kontinuierlichen Lieferung von Software ist die kontinuierliche Integration (CI). Die CI ist eine Entwicklungspraxis, bei der Entwickler ihre Codeänderungen (normalerweise klein und inkrementell) in ein zentrales Quell-Repository übertragen, das eine Reihe automatisierter Builds und Tests anstößt. Dank dieses Repositorys können Entwickler Fehler frühzeitig und automatisch erfassen, bevor diese an die Produktion weitergegeben werden. Die Pipeline für die kontinuierliche Integration umfasst normalerweise eine Reihe von Schritten, bevor ein Build-Artefakt erstellt wird: angefangen von der Einspeisung des Codes über die Durchführung einer grundlegenden automatisierten Lintanalyse/statischen Analyse und die Erfassung von Abhängigkeiten bis hin zur Erstellung der Software und Durchführung einiger grundlegender Komponententests. Systeme zur Verwaltung des Quellcodes wie Github, Gitlab usw. bieten eine Webhooks-Integration, die CI-Tools wie Jenkins abonnieren können, um nach jedem Code-Check-in automatisierte Builds und Tests auszuführen.
Eine Datenmanagement-Plattform ist das grundlegende System zum Erfassen und Analysieren großer Datenmengen in einem Unternehmen. Kommerzielle Datenplattformen umfassen in der Regel Softwaretools für die Verwaltung, die vom Datenbankanbieter oder von Drittanbietern entwickelt wurden. Diese Datenmanagementlösungen unterstützen IT-Teams und Datenbankadministratoren bei der Ausführung typischer Aufgaben, z. B.:
Die immer beliebteren Cloud-Datenbankplattformen ermöglichen Unternehmen eine schnelle und kostengünstige Skalierung. Einige sind als Service verfügbar, sodass Unternehmen sogar noch mehr sparen können.
Eine autonome Datenbank basiert auf der Cloud und nutzt künstliche Intelligenz (KI) und maschinelles Lernen, um viele von Datenbankadministratoren ausgeführte Datenmanagementaufgaben zu automatisieren, einschließlich der Verwaltung von Datenbanksicherungen, Sicherheit und der Optimierung von Performance.
Die auch als selbstverwaltete Datenbank bezeichnete autonome Datenbank bietet erhebliche Vorteile für das Datenmanagement, einschließlich:
Die immer beliebter werdenden Cloud-Datenplattformen ermöglichen Unternehmen eine schnelle und kostengünstige Skalierung. Einige sind als Service verfügbar, sodass Unternehmen sogar noch mehr sparen können.
In gewisser Weise ist Big Data genau das, wonach es klingt – eine Unmenge an Daten. Aber Big Data gibt es auch in einer größeren Vielfalt an Formen als herkömmliche Daten und sie werden mit hoher Geschwindigkeit erfasst. Man denke nur an all die Daten, die jeden Tag oder jede Minute von einer Social Media-Quelle wie Facebook eingehen. Die Menge, Vielfalt und Geschwindigkeit dieser Daten machen sie für Unternehmen so wertvoll, aber sie machen ihre Verwaltung auch sehr komplex.
Da immer mehr Daten aus so unterschiedlichen Quellen wie Videokameras, Social Media, Audioaufnahmen und IoT-Geräten (Internet of Things) gesammelt werden, sind Big-Data-Managementsysteme entstanden. Diese Systeme sind auf drei allgemeine Bereiche spezialisiert.
Unternehmen nutzen Big Data, um die Produktentwicklung, die vorausschauende Wartung, das Kundenerlebnis, die Sicherheit, betriebliche Effizienz und vieles mehr zu verbessern und zu beschleunigen. Mit der Größe von Big Data steigen auch die Möglichkeiten.
Die meisten Herausforderungen beim Datenmanagement liegen heute im höheren Geschäftstempo und in der zunehmenden Verbreitung von Daten. Die stetig wachsende Vielfalt, Geschwindigkeit und Datenmengen, die Unternehmen zur Verfügung stehen, zwingt sie dazu, nach effektiveren Verwaltungstools zu suchen, um Schritt zu halten. Zu den wichtigsten Herausforderungen für Unternehmen zählen:
Keine Dateneinblicke |
Daten von einer zunehmenden Anzahl und Vielfalt an Quellen wie Sensoren, intelligenten Geräten, Social Media und Videokameras werden gesammelt und gespeichert. Aber diese Daten sind nicht nützlich, wenn das Unternehmen nicht weiß, welche Daten es hat, wo sie sich befinden und wie sie verwendet werden. Datenmanagementlösungen benötigen Skalierung und Performance, um aussagekräftige Einblicke zeitnah zu liefern. |
Schwierigkeiten bei der Verwaltung der Leistungsebenen für das Datenmanagement |
Unternehmen erfassen, speichern und verwenden ständig immer mehr Daten. Um Spitzenwerte bei den Reaktionszeiten auf dieser expandierenden Ebene aufrechtzuerhalten, müssen Unternehmen die Art der Fragen, die die Datenbank beantwortet, kontinuierlich überwachen und die Indizes ändern, wenn sich die Abfragen ändern – ohne die Performance zu beeinträchtigen. |
Herausforderungen bei der Einhaltung sich ändernder Datenanforderungen |
Compliance-Regelungen sind komplex und multijurisdiktional und ändern sich ständig. Unternehmen müssen in der Lage sein, ihre Daten leicht zu überprüfen und alles zu identifizieren, was unter neue oder geänderte Anforderungen fällt. Insbesondere müssen personenbezogene Daten (PII) erfasst, nachverfolgt und überwacht werden, um die Einhaltung der zunehmend strengeren globalen Datenschutzbestimmungen zu gewährleisten. |
Einfache Verarbeitung und Konvertierung von Daten erforderlich |
Das Sammeln und Identifizieren der Daten selbst bietet keinen Mehrwert – das Unternehmen muss sie auch verarbeiten. Wenn es viel Zeit und Mühe kostet, die Daten in das umzuwandeln, was das Unternehmen für die Analyse benötigt, wird diese Analyse nicht stattfinden. Infolgedessen geht der potenzielle Wert dieser Daten verloren. |
Konstante Datenspeicherung erforderlich |
In der neuen Welt des Datenmanagements speichern Unternehmen Daten in mehreren Systemen, einschließlich Data Warehouses und unstrukturierten Data Lakes, in denen alle Daten in jedem Format in einem einzigen Repository gespeichert sind. Die Datenwissenschaftler eines Unternehmens benötigen eine Möglichkeit, Daten schnell und einfach von ihrem ursprünglichen Format in die Form, das Format oder das Modell zu transformieren, in dem sie für eine Vielzahl von Analysen benötigt werden. |
Bedarf zur kontinuierlichen Optimierung der IT-Agilität und -Kosten |
Mit der Verfügbarkeit von Cloud-Datenmanagementsystemen können Unternehmen entscheiden, ob Daten in On-Premise-Umgebungen, in der Cloud oder in einer hybriden Mischung aus beiden gespeichert und analysiert werden können. IT-Organisationen müssen die Gleichheit zwischen On-Premise- und Cloud-Umgebungen bewerten, um maximale IT-Agilität und niedrigere Kosten zu erreichen. |
Die von der Europäischen Union erlassene und im Mai 2018 umgesetzte Datenschutz-Grundverordnung (DSGVO) enthält sieben Grundprinzipien für das Management und die Verarbeitung personenbezogener Daten. Zu diesen Grundsätzen gehören Rechtmäßigkeit, Verarbeitung nach Treu und Glauben, Transparenz; Zweckbindung; Richtigkeit; Speicherbegrenzung; Integrität und Vertraulichkeit und mehr.
Die DSGVO und andere Gesetze, die in ihre Fußstapfen treten, wie der California Consumer Privacy Act (CCPA), verändern das Datenmanagement. Diese Anforderungen sehen standardisierte Datenschutzgesetze vor, die dem Einzelnen die Kontrolle über seine personenbezogenen Daten und deren Verwendung ermöglichen. Verbraucher werden praktisch zu Datenakteuren mit echtem Rechtsanspruch, wenn Unternehmen keine Einwilligungserklärung bei Datenerfassung einholen, die Datennutzung oder -lokalität nur unzureichend kontrollieren oder die Datenlösch- oder Portabilitätsanforderungen nicht erfüllen.
Um die Herausforderungen des Datenmanagements bewältigen zu können, sind umfassende, durchdachte Best Practices erforderlich. Obwohl die spezifischen Best Practices je nach Art der betroffenen Daten und Branche variieren, werden die folgenden Best Practices für die wesentlichen Herausforderungen des Datenmanagements eingesetzt, mit denen Unternehmen heute konfrontiert sind:
Erstellen Sie eine Ermittlungsebene, um Ihre Daten zu identifizieren |
Eine Ermittlungsebene basierend auf der Datenebene Ihres Unternehmens ermöglicht es Datenanalysten, nach Datensätzen zu suchen, um Ihre Daten nutzbar zu machen. |
Entwickeln Sie eine Datenwissenschaftsumgebung, um Ihre Daten effizient für neue Zwecke zu verwenden |
Eine Data Science-Umgebung automatisiert so weit wie möglich die Aufgaben der Datentransformation und rationalisiert die Erstellung und Auswertung von Datenmodellen. Einige Tools, mit denen die manuelle Datentransformation überflüssig wird, können das Aufstellen von Hypothesen und das Testen neuer Modelle beschleunigen. |
Nutzen Sie autonome Technologien, um die Performance-Niveaus in Ihrer erweiterten Datenebene beizubehalten. |
Autonome Datenfunktionen verwenden KI und maschinelles Lernen, um Datenbankabfragen kontinuierlich zu überwachen und Indizes zu optimieren, wenn sich die Abfragen ändern. Auf diese Weise kann die Datenbank schnelle Reaktionszeiten gewährleisten und DBAs und Datenanalysten von zeitaufwändigen manuellen Aufgaben befreien. |
Nutzen Sie Datenermittlung, um den Überblick über Compliance-Anforderungen zu behalten. |
Neue Tools verwenden die Data Discovery, um Daten zu überprüfen und die Verbindungsketten zu identifizieren, die erkannt, nachverfolgt und überwacht werden müssen, um die Einhaltung mehrerer Gerichtsbarkeiten zu gewährleisten. Da die Compliance-Anforderungen weltweit steigen, wird diese Funktion für Risiko- und Sicherheitsbeauftragte immer wichtiger. |
Stellen Sie sicher, dass Sie eine konvergierte Datenbank verwenden |
Eine konvergente Datenbank ist eine Datenbank, die native Unterstützung für alle modernen Datentypen und die neuesten Entwicklungsmodelle bietet, die in einem Produkt integriert sind. Die besten konvergenten Datenbanken können verschiedene Arten von Workloads ausführen, darunter Graph, IoT, Blockchain und maschinelles Lernen. |
Stellen Sie sicher, dass Ihre Datenbankplattform über die Performance, Skalierbarkeit und Verfügbarkeit verfügt, um Ihr Unternehmen zu unterstützen |
Das Ziel der Datenzusammenführung ist es, sie analysieren zu können, um bessere und fristgerechtere Entscheidungen zu treffen. Eine skalierbare, leistungsstarke Datenbankplattform ermöglicht Unternehmen die schnelle Analyse von Daten aus mehreren Quellen durch erweiterte Analysen und maschinelles Lernen, damit sie bessere Geschäftsentscheidungen treffen können. |
Verwenden Sie eine gemeinsame Abfrageebene, um mehrere und unterschiedliche Formen des Daten-Storage zu verwalten. |
Dank neuer Technologien können Datenmanagement-Repositorys zusammenarbeiten, sodass die Unterschiede zwischen ihnen verschwinden. Über eine gemeinsame Abfrageebene, die die zahlreichen Arten von Datenspeicherung umfasst, können Datenanalysten und Anwendungen auf Daten zugreifen, ohne dass sie wissen müssen, wo sie gespeichert sind, und ohne dass die Daten manuell in ein verwendbares Format umgewandelt werden müssen. |
Die Data Science ist ein interdisziplinärer Bereich, der mit wissenschaftlichen Methoden, Verfahren, Algorithmen und Systemen Wert aus Daten gewinnt. Datenanalysten kombinieren unterschiedliche Kompetenzen, z. B. aus dem Bereich Statistik, Informatik oder Betriebswirtschaft, um Daten zu analysieren, die aus dem Internet, von Smartphones, Kunden, Sensoren und anderen Quellen stammen.
Mit der neuen Rolle der Daten als Unternehmenskapital entdecken Unternehmen, was digitalen Startups und Disruptoren bereits wissen: Daten sind ein wichtiger Faktor für die Erkennung von Trends, die Entscheidungsfindung und die Ergreifung von Maßnahmen vor Mitbewerbern. Die neue Position von Daten in der Wertschöpfungskette veranlasst Unternehmen, aktiv nach besseren Möglichkeiten zu suchen, um mit diesem neuen Kapital den Wert zu maximieren.
Erfahren Sie mehr darüber, wie Sie vom besten Datenmanagement profitieren können, einschließlich der Vorteile einer autonomen Strategie in der Cloud und skalierbaren, leistungsstarken Datenbank-Cloud-Funktionen.