HeatWave ist eine speicherinterne, massiv parallele, hybride, spaltenförmige Datenverarbeitungs-Engine. Es implementiert hochmoderne Algorithmen für die verteilte Abfrageverarbeitung, die eine sehr hohe Performance bieten.
HeatWave partitioniert Daten massiv über ein Cluster von Knoten, die parallel betrieben werden können. Dies bietet eine hervorragende internodale Skalierbarkeit. Jeder Knoten innerhalb eines Clusters und jeder Kern innerhalb eines Knotens kann partitionierte Daten parallel verarbeiten. HeatWave verfügt über einen intelligenten Abfrage-Scheduler, der die Berechnung mit Netzwerkkommunikationsaufgaben überlappt, um eine sehr hohe Skalierbarkeit über Tausende von Kernen zu erreichen.
Die Abfrageverarbeitung in HeatWave wurde für Commodity-Server in der Cloud optimiert. Die Größe der Partitionen wurde optimiert, um sie an den Cache der zugrunde liegenden Formen anzupassen. Die Überlappung von Berechnungen mit der Kommunikation ist für die verfügbare Netzwerkbandbreite optimiert. Verschiedene Primitives zur Analyseverarbeitung verwenden die Hardwareanweisungen der zugrunde liegenden virtuellen Maschinen (VMs). HeatWave ist auch als skalierbare Datenverarbeitungs-Engine konzipiert, die für die Abfrage von Daten im Objektspeicher optimiert ist.
Oracle HeatWave GenAI bietet integrierte, automatisierte und sichere generative KI mit datenbankinternen großen Sprachmodellen (LLMs), einem automatisierten Vektorspeicher in der Datenbank, Scale-out-Vektorverarbeitung und der Möglichkeit, kontextbezogene Konversationen in natürlicher Sprache zu führen. So können Sie die Vorteile generativer KI ohne KI-Expertise, Datenbewegung oder zusätzliche Kosten nutzen.
Verwenden Sie die integrierten LLMs in allen Oracle Cloud Infrastructure (OCI)-Regionen, OCI Dedicated Region, Oracle Alloy, Amazon Web Services (AWS) und Microsoft Azure und erzielen Sie einheitliche Ergebnisse mit vorhersehbarer Leistung über alle Bereitstellungen hinweg. Reduzieren Sie die Infrastrukturkosten, indem Sie die Bereitstellung von GPUs überflüssig machen.
Nutzen Sie vorab trainierte Grundmodelle von Cohere und Meta über OCI Generative AI Service, wenn Sie HeatWave GenAI auf OCI verwenden, und über Amazon Bedrock, wenn Sie HeatWave GenAI auf AWS verwenden.
Führen Sie RAG (Retrieval-Augmented Generation) über LLMs und Ihre eigenen Dokumente in verschiedenen Formaten durch, die im HeatWave Vector Store untergebracht sind, um genauere und kontextuell relevante Antworten zu erhalten – ohne die Daten in eine separate Vektordatenbank zu verschieben.
Nutzen Sie die automatisierte Pipeline, um proprietäre Dokumente im HeatWave Vector Store zu entdecken und aufzunehmen. So können Entwickler und Analysten ohne KI-Kenntnisse den Vektorspeicher einfacher verwenden.
Die Vektorverarbeitung wird auf bis zu 512 HeatWave-Clusterknoten parallelisiert und mit der Speicherbandbreite ausgeführt. Dies trägt zu schnellen Ergebnissen mit einer geringeren Wahrscheinlichkeit eines Genauigkeitsverlusts bei.
Führen Sie kontextbezogene Konversationen auf der Grundlage Ihrer unstrukturierten Dokumente im Objektspeicher unter Verwendung natürlicher Sprache. Darüber hinaus können Sie den integrierten Lakehouse Navigator nutzen, um LLMs bei der Suche nach bestimmten Datensätzen zu unterstützen. So können Sie die Kosten senken und erhalten schneller genauere Ergebnisse.
HeatWave MySQL ist ein vollständig verwalteter Datenbankservice und der einzige auf MySQL Enterprise Edition basierende Cloud-Service mit erweiterten Sicherheitsfunktionen für Verschlüsselung, Datenmaskierung, Authentifizierung und einer Datenbank-Firewall. HeatWave verbessert die MySQL-Abfrageleistung um ein Vielfaches und ermöglicht Ihnen Echtzeitanalysen Ihrer Transaktionsdaten in MySQL – ohne die Komplexität, Latenz, Risiken und Kosten einer ETL-Duplizierung (Extrahieren, Transformieren und Laden) in eine separate Analysedatenbank.
Analyseabfragen greifen auf die aktuellsten Daten zu, da Aktualisierungen von Transaktionen automatisch in Echtzeit in das HeatWave-Analysecluster repliziert werden. Es ist nicht erforderlich, die Daten zu indizieren, bevor Analyseabfragen ausgeführt werden. Sie können den komplexen, zeitaufwendigen und kostspieligen ETL-Prozess und die Integration mit einer separaten Analysedatenbank eliminieren.
Mit HeatWave Lakehouse können Benutzer ein halbes Petabyte an Daten im Objektspeicher abfragen – in verschiedenen Dateiformaten wie CSV, Parquet, Avro, JSON und Exportdateien aus anderen Datenbanken. Die Abfrageverarbeitung erfolgt vollständig in der HeatWave-Engine, sodass Kunden HeatWave zusätzlich zu MySQL-kompatiblen Workloads auch für Nicht-MySQL-Workloads nutzen können.
Kunden können mithilfe von SQL-Standardbefehlen Daten in verschiedenen Formaten im Objektspeicher, Transaktionsdaten in MySQL Databases oder eine Kombination aus beidem abfragen. Genau so schnelle Abfrage von Daten im Objektspeicher wie in den Datenbanken, wie durch eine 10 TB TPC-H-Benchmark demonstriert wurde.
Mit HeatWave AutoML können Kunden Daten im Objektspeicher, in der Datenbank oder in beiden verwenden, um ML-Modelle automatisch zu erstellen, zu trainieren, bereitzustellen und zu erklären – ohne die Daten in einen separaten ML-Cloud-Service zu verschieben.
Die massiv partitionierte Architektur von HeatWave ermöglicht eine Scale-Out-Architektur für HeatWave Lakehouse. Die Verarbeitung von Abfragen und die Abläufe beim Datenmanagement wie das Laden/Neuladen von Daten werden entsprechend des Datenumfangs skaliert. Kunden können mit HeatWave Lakehouse bis zu einem halben Petabyte an Daten im Objektspeicher abfragen, ohne diese in die MySQL Database zu kopieren. Der HeatWave-Cluster lässt sich auf 512 Knoten skalieren.
HeatWave Autopilot-Funktionen wie das automatische Provisioning, die automatische Verbesserung des Abfrageplans und das automatische parallele Laden wurden für HeatWave Lakehouse erweitert, wodurch sich der Aufwand für die Datenbankadministration reduziert und somit die Performance gesteigert wird. Die neuen HeatWave Autopilot-Funktionen sind auch für HeatWave Lakehouse verfügbar.
HeatWave AutoML enthält alles, was Benutzer zum Erstellen, Trainieren und Erklären von ML-Modellen in HeatWave benötigen, und das ohne zusätzliche Kosten.
Mit datenbankinternen ML-Funktionen in HeatWave müssen Kunden keine Daten zu einem separaten ML-Service verschieben. Mit HeatWave Lakehouse können sie maschinelles Lernen, Training, Inferenz und Erklärung einfach und sicher auf Daten anwenden, die sowohl in MySQL als auch im Objektspeicher gespeichert sind. Dadurch können sie ML-Initiativen beschleunigen, die Sicherheit erhöhen und Kosten senken.
HeatWave AutoML automatisiert den Lebenszyklus des maschinellen Lernens, einschließlich Algorithmusauswahl, intelligentes Data Sampling für das Modelltraining, Funktionsauswahl und Hyperparameter-Optimierung, was Datenanalysten und Data Scientists viel Zeit und Mühe spart. Aspekte der Pipeline für maschinelles Lernen können angepasst werden, einschließlich Algorithmusauswahl, Featureauswahl und Hyperparameteroptimierung. HeatWave AutoML unterstützt Aufgaben der Anomalieerkennung, Prognose, Klassifizierung, Regression und Recommendation Engine, einschließlich in Textspalten. Benutzer können Feedback zu den Ergebnissen der unüberwachten Anomalieerkennung geben und diese gekennzeichneten Daten zur Verbesserung nachfolgender Vorhersagen verwenden.
Durch die Berücksichtigung sowohl impliziten Feedbacks (vergangene Käufe, Surfverhalten usw.) als auch expliziten Feedbacks (Bewertungen, Likes usw.) kann die HeatWave AutoML-Recommendation Engine personalisierte Empfehlungen generieren. Analysten können beispielsweise Artikel vorhersagen, die einem Benutzer gefallen werden, Benutzer, denen ein bestimmter Artikel gefallen wird, und Bewertungen, die Artikel erhalten werden. Sie können außerdem, sofern ein Benutzer angegeben wird, eine Liste ähnlicher Benutzer und, sofern ein bestimmter Artikel angegeben wird, eine Liste ähnlicher Artikel abrufen.
Mit der interaktiven Konsole können Business Analysts ML-Modelle mit der visuellen Benutzeroberfläche erstellen, trainieren, ausführen und erklären – ohne SQL-Befehle oder Programmierung. Die Konsole macht es außerdem einfach, Was-wäre-wenn-Szenarien zu untersuchen, um geschäftliche Annahmen zu bewerten, wie z. B. „Wie würde sich eine um 30 % höhere Investition in bezahlte Werbung in sozialen Medien auf Umsatz und Gewinn auswirken?“
Alle von HeatWave AutoML trainierten Modelle sind erklärbar. HeatWave AutoML liefert Prognosen mit einer Erläuterung der Ergebnisse und hilft Organisationen bei der Compliance, Fairness, Wiederholbarkeit, Kausalität und Vertrauen.
Die Themenmodellierung hilft Benutzern, Erkenntnisse in großen Textdatensätzen zu gewinnen, indem sie wichtige Themen in Dokumenten verständlich macht, z. B. um eine Stimmungsanalyse in Social-Media-Daten durchzuführen. Die Erkennung von Datendrift hilft Analysten dabei, festzustellen, wann Modelle neu trainiert werden müssen, indem sie die Unterschiede zwischen den für das Training verwendeten Daten und neu eingehenden Daten erkennt.
Entwickler und Datenanalysten können ML-Modelle mit vertrauten SQL-Befehlen erstellen. Sie müssen keine neuen Tools und Programmiersprachen lernen. Darüber hinaus ist HeatWave AutoML in beliebte Notebooks wie Jupyter und Apache Zeppelin integriert.
HeatWave Autopilot bietet eine Workload-bezogene, durch maschinelles Lernen unterstützte Automatisierung. Darüber hinaus verbessert der Service die Performance und Skalierbarkeit, sorgt für mehr Produktivität von Entwicklern und Datenbankadministratoren und trägt dazu bei, menschliche Fehler zu eliminieren – und das ohne erforderliches Fachwissen zur Datenbankoptimierung. HeatWave Autopilot automatisiert viele der wichtigsten und häufig anspruchsvollsten Aspekte der Erzielung einer hohen Abfrageperformance im großen Maßstab – einschließlich Provisioning, Laden von Daten, Abfrageausführung und Fehlerbehandlung. HeatWave Autopilot ist für HeatWave MySQL-Kunden ohne zusätzliche Kosten erhältlich.
HeatWave Autopilot bietet zahlreiche Funktionen sowohl für HeatWave als auch für OLTP, darunter
Mit Echtzeitelastizität können Kunden die Größe ihres HeatWave-Clusters um eine beliebige Anzahl von Knoten erhöhen bzw. verringern, ohne dass es zu Ausfallzeiten oder schreibgeschützten Zeiten kommt.
Der Vorgang der Größenänderung dauert nur wenige Minuten, während dieser Zeit bleibt HeatWave online und für alle Vorgänge verfügbar. Sobald die Größe geändert wurde, werden die Daten aus dem Objektspeicher heruntergeladen, automatisch zwischen allen verfügbaren Cluster-Knoten neu verteilt und stehen sofort für Abfragen zur Verfügung. Dadurch profitieren Kunden selbst in Spitzenzeiten von der konstant hohen Leistungsfähigkeit und den niedrigeren Kosten, indem sie ihren HeatWave-Cluster bei Bedarf verkleinern – ohne dass es zu Ausfallzeiten oder schreibgeschützten Zeiten kommt.
Durch effizientes Neuladen von Daten aus dem Objektspeicher können Kunden ihr HeatWave-Cluster auch unterbrechen und fortsetzen, um Kosten zu senken.
Kunden können ihren HeatWave-Cluster auf eine beliebige Anzahl von Knoten erweitern oder reduzieren. Sie sind nicht auf überdimensionierte und kostspielige Instanzen beschränkt, die durch starre Größenmodelle erzwungen werden, und Teil des Angebots von anderen Cloud-Datenbankprovidern sind. Bei HeatWave zahlen Kunden nur für genau die Ressourcen, die sie nutzen.
Sie können HeatWave auf OCI, AWS oder Azure bereitstellen. Darüber hinaus können Sie Daten aus On-Premises-OLTP-Anwendungen auf HeatWave replizieren, um Analysen in nahezu Echtzeit zu erhalten und Vektordaten in der Cloud zu verarbeiten. Sie können HeatWave außerdem in Ihrem Data Center mit OCI Dedicated Region verwenden.
HeatWave auf AWS bietet AWS-Kunden eine native Erfahrung. Konsole, Control Plane und Data Plane befinden sich in AWS.