Functies van HeatWave

HeatWave

HeatWave is een in-memory, parallelle en hybride engine voor dataverwerking in kolomvorm. Deze oplossing implementeert geavanceerde algoritmen voor gedistribueerde queryverwerking die zeer hoge prestaties leveren.

Ontworpen voor enorme schaalbaarheid en prestaties

Met HeatWave worden data massaal gepartitioneerd over een cluster met nodes, die parallel kunnen worden verwerkt. Dit biedt een uitstekende interne schaalbaarheid tussen nodes. Gepartitioneerde data kunnen parallel worden verwerkt door elke node in een cluster en elke core in een node. HeatWave heeft een intelligente queryplanner die berekeningen laat overlappen met netwerkcommunicatietaken om een zeer hoge schaalbaarheid via duizenden cores te realiseren.

Geoptimaliseerd voor de cloud en data in een objectopslag

Queryverwerking in HeatWave is geoptimaliseerd voor standaardservers in de cloud. De grootte van de partities is aangepast aan de cache van de onderliggende vormen. De overlap van compute en communicatie is geoptimaliseerd voor de beschikbare netwerkbandbreedte. Voor verschillende functies voor analyseverwerking worden de hardware-instructies van de onderliggende virtuele machines (VM's) gebruikt. HeatWave is ook ontworpen als een uitbreidbare dataverwerkingsengine die is geoptimaliseerd voor het uitvoeren van query's op data in een objectopslag.


HeatWave GenAI

Oracle HeatWave GenAI biedt geïntegreerde en geautomatiseerde generatieve AI met in-database LLM's (grote taalmodellen), een geautomatiseerde in-database vectoropslag, scale-out vectorverwerking en de mogelijkheid om contextuele gesprekken in een natuurlijke taal te voeren. Zo kunt u profiteren van generatieve AI zonder expertise op het gebied van AI, gegevensverplaatsing of extra kosten.

In-database LLM's

Gebruik de ingebouwde LLM's in alle Oracle Cloud Infrastructure (OCI) regio's, OCI Dedicated Region, Oracle Alloy, Amazon Web Services (AWS) en Microsoft Azure en behaal consistente resultaten met voorspelbare prestaties in verschillende implementaties. De kosten voor infrastructuur worden lager doordat er geen GPU's meer moeten worden ingericht.

Geïntegreerd met OCI Generative AI en Amazon Bedrock

Gebruik vooraf getrainde basismodellen van Cohere en Meta via de OCI Generative AI service wanneer u HeatWave GenAI gebruikt op OCI en via Amazon Bedrock wanneer u HeatWave GenAI gebruikt op AWS.

In-database vectoropslag

Als u meer nauwkeurige en contextueel relevante antwoorden wilt krijgen zonder data naar een afzonderlijke vectordatabase te verplaatsen, voert u retrieval-augmented generation (RAG) uit voor LLM's en uw eigen documenten in verschillende indelingen die zijn opgeslagen in HeatWave Vector Store.

Geautomatiseerde generatie van embeddingen

Maak gebruik van de geautomatiseerde pijplijn om eigen documenten te ontdekken en op te nemen in HeatWave Vector Store, waardoor het eenvoudiger wordt voor ontwikkelaars en analisten zonder AI-expertise om de vectoropslag te gebruiken.

Scale-out vectorverwerking

Vectorverwerking wordt parallel uitgevoerd over maximaal 512 HeatWave clusternodes en uitgevoerd op geheugenbandbreedte, waardoor snelle resultaten worden verkregen met een kleinere kans op verlies van nauwkeurigheid.

HeatWave Chat

Gebruik natuurlijke taal om contextuele gesprekken te voeren op basis van uw ongestructureerde documenten in de objectopslag. Gebruik de geïntegreerde Lakehouse Navigator om LLM's te begeleiden bij het doorzoeken van specifieke datasets, zodat u de kosten kunt verlagen en sneller nauwkeurigere resultaten kunt behalen.

Meer informatie over HeatWave GenAI


HeatWave MySQL

HeatWave MySQL is een volledig beheerde databaseservice en de enige cloudservice die is gebouwd op MySQL Enterprise Edition, met geavanceerde beveiligingsfuncties voor codering, datamaskering, verificatie en een databasefirewall. HeatWave verbetert de queryprestaties van MySQL met ordes van grootte en biedt u realtime analyse van uw transactionele data in MySQL, zonder de complexiteit, vertraging, risico's en kosten die gepaard gaan met het dupliceren van data voor extractie, transformatie en laden (ETL) naar een afzonderlijke analytische database.

Realtime analyses zonder ETL

Analyseverzoeken hebben toegang tot de meest actuele informatie omdat updates van transacties automatisch in realtime worden gerepliceerd naar het HeatWave-analysecluster. U hoeft de data niet te indexeren voordat u analysequery's uitvoert. Met een afzonderlijke analysedatabase kunt u het complexe, tijdrovende en dure ETL-proces en integratie elimineren.

Meer informatie over HeatWave MySQL


HeatWave Lakehouse

Met HeatWave Lakehouse kunnen gebruikers in verschillende bestandsindelingen, zoals CSV, Parquet, Avro, JSON en exportbestanden van andere databases, een halve petabyte aan data in de objectopslag doorzoeken. De verwerking van query's vindt volledig plaats in de HeatWave-engine, zodat klanten niet alleen van HeatWave kunnen profiteren voor workloads die compatibel zijn met MySQL, maar ook voor niet-MySQL-workloads.

Snelle lakehouse-analytics en machine learning voor alle data

Met behulp van standaard SQL-opdrachten kunnen klanten query's uitvoeren op data in verschillende indelingen in de objectopslag, op transactiedata in MySQL-databases of op een combinatie van deze twee. Het doorzoeken van de gegevens in de objectopslag is net zo snel als het doorzoeken van de databases, zoals wordt aangetoond met een 10 TB TPC-H-benchmark.

Met HeatWave AutoML kunnen klanten data in de objectopslag, in de database of in allebei gebruiken om automatisch ML-modellen te bouwen, te trainen, te implementeren en uit te leggen, zonder de data naar een afzonderlijke ML-cloudservice te verplaatsen.

Uitbreidbare architectuur voor databeheer en queryverwerking

De grootschalige gepartitioneerde architectuur van HeatWave maakt een uitbreidbare architectuur mogelijk voor HeatWave Lakehouse. Activiteiten voor queryverwerking en databeheer, zoals het laden/opnieuw laden van data, worden geschaald samen met de grootte de data. Klanten kunnen met HeatWave Lakehouse tot wel een halve petabyte aan data in een objectopslag doorzoeken zonder dat ze deze naar de MySQL-database te hoeven kopiëren. De HeatWave cluster wordt geschaald naar 512 nodes.

Verbeter de prestaties en bespaar tijd met automatisering op basis van machine learning

De functies van HeatWave Autopilot, zoals automatische provisioning, automatische verbetering van queryplannen en automatisch parallel laden, zijn verbeterd voor HeatWave Lakehouse. Hierdoor wordt de overhead voor databasebeheer nog verder verminderd en worden de prestaties verbeterd. Er zijn ook nieuwe functies van HeatWave Autopilot beschikbaar voor HeatWave Lakehouse.

  • Automatische schema-inferentie zorgt ervoor dat bestandsdata automatisch worden toegewezen aan de bijbehorende schemadefinitie voor alle ondersteunde bestandstypen, waaronder CSV. Hierdoor hoeven klanten de schematoewijzing van bestanden niet handmatig te definiëren en bij te werken, wat tijd en moeite bespaart.
  • Bij adaptieve steekproeven van data worden bestanden in de objectopslag op intelligente wijze bemonsterd om informatie af te leiden die door HeatWave Autopilot wordt gebruikt om voorspellingen te doen voor automatisering. Met behulp van adaptieve steekproeven van data kan HeatWave Autopilot binnen één minuut scannen en voorspellingen doen, zoals schematoewijzing in een bestand van 400 TB.
  • Dankzij een adaptieve datastroom kan HeatWave Lakehouse zich in elke regio dynamisch aanpassen aan de prestaties van de onderliggende objectopslag voor een verbetering van de algehele prestaties, de prijs-prestatieverhouding en de beschikbaarheid.

Meer informatie over HeatWave Lakehouse


HeatWave AutoML

HeatWave AutoML bevat alles wat gebruikers nodig hebben voor het bouwen, trainen en uitleggen van machine learning-modellen binnen HeatWave, zonder extra kosten.

Geen behoefte aan een afzonderlijke machine learning-service

Met in-database machine learning in HeatWave hoeven klanten geen data te verplaatsen naar een afzonderlijke service voor machine learning. Ze kunnen eenvoudig en veilig trainings-, interferentie- en uitlegtechnieken van machine learning toepassen op data die zijn opgeslagen in MySQL of in de objectopslag met HeatWave Lakehouse. Zo kunnen ze ML-initiatieven versnellen, de beveiliging verbeteren en de kosten verlagen.

Automatisering van de levenscyclus van machine learning bespaart tijd en moeite

HeatWave AutoML automatiseert de levenscyclus van machine learning, inclusief algoritmeselectie, intelligente voorbeelddata voor modeltraining, functieselectie en optimalisatie van hyperparameters, waardoor data-analisten en datawetenschappers veel tijd en moeite kunnen besparen. Aspecten van de pijplijn voor machine learning kunnen worden aangepast, waaronder algoritmeselectie, functieselectie en optimalisatie van hyperparameters. HeatWave AutoML ondersteunt systeemtaken voor het detecteren van afwijkingen, prognoses, classificatie, regressie en aanbevelingen, onder meer voor tekstkolommen. Gebruikers kunnen feedback geven over de resultaten van detectie van ongecontroleerde afwijkingen en deze gelabelde data gebruiken om verdere voorspellingen te verbeteren.

Aanbevelingssysteem voor gepersonaliseerde aanbevelingen

Door rekening te houden met zowel impliciete feedback (eerdere aankopen, surfgedrag enzovoort) als expliciete feedback (beoordelingen, vind-ik-leuks enzovoort), kan het aanbevelingssysteem van HeatWave AutoML gepersonaliseerde aanbevelingen genereren. Analisten kunnen bijvoorbeeld voorspellen welke items een gebruiker leuk vindt, welke gebruikers een bepaald item leuk vinden en welke beoordelingen items zullen krijgen. Ze kunnen ook voor een bepaalde gebruiker een lijst met vergelijkbare gebruikers en voor een bepaald item een lijst met soortgelijke items samenstellen.

Interactieve HeatWave AutoML-console

Met de interactieve console kunnen bedrijfsanalisten ML-modellen bouwen, trainen, uitvoeren en uitleggen via een visuele interface, zonder SQL-opdrachten of codering te gebruiken. In de console is het ook gemakkelijk om what-if-scenario's te verkennen om zakelijke aannames te evalueren. Bijvoorbeeld: "Welke invloed zou een 30% hogere investering in betaalde advertenties hebben op de omzet en winst?"

Verklaarbare ML-modellen

Alle modellen die door HeatWave AutoML zijn getraind, zijn verklaarbaar. HeatWave AutoML biedt voorspellingen met een uitleg van de resultaten, waardoor organisaties worden geholpen met naleving van regelgeving, billijkheid, herhaalbaarheid, causaliteit en vertrouwen.

Onderwerpmodellering en detectie van afwijkende data

Met onderwerpmodellering kunnen gebruikers inzichten ontdekken in grote gegevenssets met teksten. Zo krijgen ze beter inzicht in belangrijke thema's in documenten, bijvoorbeeld voor het voltooien van een sentimentanalyse van sociale-mediagegevens. Met detectie van afwijkende data kunnen analisten bepalen wanneer modellen opnieuw moeten worden getraind door de verschillen te detecteren tussen de data die worden gebruikt voor training en nieuwe inkomende data.

Gebruik van huidige vaardigheden

Ontwikkelaars en data-analisten kunnen machine learning-modellen bouwen met behulp van vertrouwde SQL-opdrachten zondat dat ze nieuwe tools en talen hoeven te leren. Ook is HeatWave AutoML geïntegreerd in populaire platforms zoals Jupyter en Apache Zeppelin.


HeatWave Autopilot

HeatWave Autopilot biedt workload-gerichte automatisering op basis van machine learning. Het verbetert de prestaties en schaalbaarheid zonder dat expertise op het gebied van databaseafstemming nodig is, het verhoogt de productiviteit van ontwikkelaars en databasebeheerders en het elimineert menselijke fouten. HeatWave Autopilot automatiseert vele essentiële en vaak complexe aspecten van het realiseren van hoge queryprestaties op grote schaal, waaronder de initialisatie, het laden van gegevens, de uitvoering van query's en het omgaan met storingen. HeatWave Autopilot is zonder extra kosten beschikbaar voor klanten van HeatWave MySQL.

HeatWave Autopilot biedt een groot aantal mogelijkheden voor HeatWave en OLTP, waaronder:

  • Met automatische initialisatie wordt het aantal HeatWave nodes voorspeld dat is vereist voor het uitvoeren van een workload door adaptieve sampling van tabeldata die moeten worden geanalyseerd. Dit betekent dat ontwikkelaars en databasebeheerders niet langer handmatig een inschatting hoeven te maken van de optimale grootte van hun cluster.
  • Met automatische threadpooling kunnen in de databaseservice meer transacties voor een bepaalde hardwareconfiguratie worden verwerkt. Hierdoor wordt een hogere doorvoer voor OLTP-workloads geleverd en wordt voorkomen dat de doorvoer op hoog niveau en bij gelijktijdige transacties afneemt.
  • De automatische vormvoorspelling monitort continu de OLTP-workload, incl. de doorvoer en het trefferpercentage van de bufferpool, zodat op elk gewenst moment de juiste compute-vorm kan worden aanbevolen en klanten steeds de beste prijs/prestatie-verhouding krijgen.
  • Met automatische codering wordt de optimale weergave bepaald van kolommen die in HeatWave worden geladen. Hierbij wordt rekening gehouden met de query's. Deze optimale weergave levert de beste queryprestaties en minimaliseert de grootte van de cluster om de kosten te beperken.
  • Met automatische verbetering van queryplannen worden verschillende statistieken gemaakt op basis van de uitvoering van query's en wordt het uitvoeringsplan voor toekomstige query's verbeterd. Dit leidt tot betere systeemprestaties naarmate er meer query's worden uitgevoerd.
  • Adaptieve queryoptimalisatie maakt gebruik van verschillende statistieken om datastructuren en systeemresources aan te passen nadat de uitvoering van een query is gestart. Hierbij wordt de uitvoering van de query voor elke node onafhankelijk geoptimaliseerd op basis van de werkelijke datadistributie tijdens de runtime. Op die manier kunnen de prestaties van ad-hoc-query's met wel 25% worden verbeterd.
  • Met automatische dataplaatsing wordt voorspeld in welke kolom de tabellen in het geheugen moeten worden gepartitioneerd om de beste prestaties te behalen voor query's. Met de aanbeveling voor de nieuwe kolom wordt ook de verwachte winst op het gebied van queryprestaties voorspeld. Hierdoor wordt dataverplaatsing tussen nodes geminimaliseerd vanwege suboptimale keuzen die operators kunnen maken wanneer ze de kolom handmatig selecteren.
  • Met automatische compressie wordt het optimale compressiealgoritme voor elke kolom bepaald, waardoor de prestaties van loads en query's worden verbeterd met snellere datacompressie en -decompressie. Door het geheugengebruik te verminderen, kunnen klanten de kosten met maar liefst 25% verlagen.
  • Met indexering worden automatisch de indexen bepaald die klanten moeten maken of verwijderen uit hun tabellen om de OLTP-doorvoer te optimaliseren, waarbij machine learning wordt gebruikt om een voorspelling te maken op basis van individuele applicatieworkloads. Hierdoor kunnen klanten tijdrovende taken zoals het maken van optimale indexen voor hun OLTP-workloads overbodig maken en deze in de loop der tijd behouden naarmate workloads evolueren.

Realtime flexibiliteit

Dankzij realtime flexibiliteit kunnen klanten hun HeatWave cluster vergroten of verkleinen met een willekeurig aantal nodes zonder uitvaltijd of alleen-lezen tijd.

Consistent hoge prestaties, zelfs tijdens piekuren, lagere kosten en geen uitvaltijd

Het wijzigen van de grootte duurt slechts enkele minuten. HeatWave blijft online en beschikbaar voor alle bewerkingen. Als de grootte is aangepast, worden data uit de objectopslag gedownload en automatisch opnieuw verdeeld over alle beschikbare clusternodes. De data zijn direct beschikbaar voor query's. Hierdoor profiteren klanten van consistent hoge prestaties, zelfs tijdens piekuren, en kunnen ze de kosten verlagen door hun HeatWave cluster indien nodig en zonder uitvaltijd of alleen-lezen tijd te verkleinen.

Door data op efficiënte wijze opnieuw te laden uit de objectopslag, kunnen klanten hun HeatWave cluster ook onderbreken en hervatten om kosten te besparen.

Geen overgeïnitialiseerde instances

Klanten kunnen hun HeatWave cluster uitbreiden naar een onbeperkt aantal nodes. Ze zijn niet beperkt tot overgeïnitialiseerde en dure instances die worden afgedwongen door de starre modellen die andere clouddatabaseproviders bieden. Met HeatWave betalen klanten alleen voor de resources die ze gebruiken.


Beschikbaar in openbare clouds en uw datacenter

U kunt HeatWave implementeren op OCI, AWS of Azure. U kunt data repliceren van lokale OLTP-applicaties naar HeatWave om vrijwel realtime analyses te maken en vectordata in de cloud te verwerken. U kunt HeatWave ook in uw datacenter gebruiken met OCI Dedicated Region.

HeatWave op AWS biedt AWS-klanten een native ervaring. Console, besturingsvlak en gegevenslaag bevinden zich allen in AWS.

Oracle-chatbot
Disconnected