HeatWave is een in-memory, parallelle en hybride engine voor dataverwerking in kolomvorm. Deze oplossing implementeert geavanceerde algoritmen voor gedistribueerde queryverwerking die zeer hoge prestaties leveren.
Met HeatWave worden data massaal gepartitioneerd over een cluster met nodes, die parallel kunnen worden verwerkt. Dit biedt een uitstekende interne schaalbaarheid tussen nodes. Gepartitioneerde data kunnen parallel worden verwerkt door elke node in een cluster en elke core in een node. HeatWave heeft een intelligente queryplanner die berekeningen laat overlappen met netwerkcommunicatietaken om een zeer hoge schaalbaarheid via duizenden cores te realiseren.
Queryverwerking in HeatWave is geoptimaliseerd voor standaardservers in de cloud. De grootte van de partities is aangepast aan de cache van de onderliggende vormen. De overlap van compute en communicatie is geoptimaliseerd voor de beschikbare netwerkbandbreedte. Voor verschillende functies voor analyseverwerking worden de hardware-instructies van de onderliggende virtuele machines (VM's) gebruikt. HeatWave is ook ontworpen als een uitbreidbare dataverwerkingsengine die is geoptimaliseerd voor het uitvoeren van query's op data in een objectopslag.
Oracle HeatWave GenAI biedt geïntegreerde en geautomatiseerde generatieve AI met in-database LLM's (grote taalmodellen), een geautomatiseerde in-database vectoropslag, scale-out vectorverwerking en de mogelijkheid om contextuele gesprekken in een natuurlijke taal te voeren. Zo kunt u profiteren van generatieve AI zonder expertise op het gebied van AI, gegevensverplaatsing of extra kosten.
Gebruik de ingebouwde LLM's in alle Oracle Cloud Infrastructure (OCI) regio's, OCI Dedicated Region, Oracle Alloy, Amazon Web Services (AWS) en Microsoft Azure en behaal consistente resultaten met voorspelbare prestaties in verschillende implementaties. De kosten voor infrastructuur worden lager doordat er geen GPU's meer moeten worden ingericht.
Gebruik vooraf getrainde basismodellen van Cohere en Meta via de OCI Generative AI service wanneer u HeatWave GenAI gebruikt op OCI en via Amazon Bedrock wanneer u HeatWave GenAI gebruikt op AWS.
Als u meer nauwkeurige en contextueel relevante antwoorden wilt krijgen zonder data naar een afzonderlijke vectordatabase te verplaatsen, voert u retrieval-augmented generation (RAG) uit voor LLM's en uw eigen documenten in verschillende indelingen die zijn opgeslagen in HeatWave Vector Store.
Maak gebruik van de geautomatiseerde pijplijn om eigen documenten te ontdekken en op te nemen in HeatWave Vector Store, waardoor het eenvoudiger wordt voor ontwikkelaars en analisten zonder AI-expertise om de vectoropslag te gebruiken.
Vectorverwerking wordt parallel uitgevoerd over maximaal 512 HeatWave clusternodes en uitgevoerd op geheugenbandbreedte, waardoor snelle resultaten worden verkregen met een kleinere kans op verlies van nauwkeurigheid.
Gebruik natuurlijke taal om contextuele gesprekken te voeren op basis van uw ongestructureerde documenten in de objectopslag. Gebruik de geïntegreerde Lakehouse Navigator om LLM's te begeleiden bij het doorzoeken van specifieke datasets, zodat u de kosten kunt verlagen en sneller nauwkeurigere resultaten kunt behalen.
HeatWave MySQL is een volledig beheerde databaseservice en de enige cloudservice die is gebouwd op MySQL Enterprise Edition, met geavanceerde beveiligingsfuncties voor codering, datamaskering, verificatie en een databasefirewall. HeatWave verbetert de queryprestaties van MySQL met ordes van grootte en biedt u realtime analyse van uw transactionele data in MySQL, zonder de complexiteit, vertraging, risico's en kosten die gepaard gaan met het dupliceren van data voor extractie, transformatie en laden (ETL) naar een afzonderlijke analytische database.
Analyseverzoeken hebben toegang tot de meest actuele informatie omdat updates van transacties automatisch in realtime worden gerepliceerd naar het HeatWave-analysecluster. U hoeft de data niet te indexeren voordat u analysequery's uitvoert. Met een afzonderlijke analysedatabase kunt u het complexe, tijdrovende en dure ETL-proces en integratie elimineren.
Met HeatWave Lakehouse kunnen gebruikers in verschillende bestandsindelingen, zoals CSV, Parquet, Avro, JSON en exportbestanden van andere databases, een halve petabyte aan data in de objectopslag doorzoeken. De verwerking van query's vindt volledig plaats in de HeatWave-engine, zodat klanten niet alleen van HeatWave kunnen profiteren voor workloads die compatibel zijn met MySQL, maar ook voor niet-MySQL-workloads.
Met behulp van standaard SQL-opdrachten kunnen klanten query's uitvoeren op data in verschillende indelingen in de objectopslag, op transactiedata in MySQL-databases of op een combinatie van deze twee. Het doorzoeken van de gegevens in de objectopslag is net zo snel als het doorzoeken van de databases, zoals wordt aangetoond met een 10 TB TPC-H-benchmark.
Met HeatWave AutoML kunnen klanten data in de objectopslag, in de database of in allebei gebruiken om automatisch ML-modellen te bouwen, te trainen, te implementeren en uit te leggen, zonder de data naar een afzonderlijke ML-cloudservice te verplaatsen.
De grootschalige gepartitioneerde architectuur van HeatWave maakt een uitbreidbare architectuur mogelijk voor HeatWave Lakehouse. Activiteiten voor queryverwerking en databeheer, zoals het laden/opnieuw laden van data, worden geschaald samen met de grootte de data. Klanten kunnen met HeatWave Lakehouse tot wel een halve petabyte aan data in een objectopslag doorzoeken zonder dat ze deze naar de MySQL-database te hoeven kopiëren. De HeatWave cluster wordt geschaald naar 512 nodes.
De functies van HeatWave Autopilot, zoals automatische provisioning, automatische verbetering van queryplannen en automatisch parallel laden, zijn verbeterd voor HeatWave Lakehouse. Hierdoor wordt de overhead voor databasebeheer nog verder verminderd en worden de prestaties verbeterd. Er zijn ook nieuwe functies van HeatWave Autopilot beschikbaar voor HeatWave Lakehouse.
HeatWave AutoML bevat alles wat gebruikers nodig hebben voor het bouwen, trainen en uitleggen van machine learning-modellen binnen HeatWave, zonder extra kosten.
Met in-database machine learning in HeatWave hoeven klanten geen data te verplaatsen naar een afzonderlijke service voor machine learning. Ze kunnen eenvoudig en veilig trainings-, interferentie- en uitlegtechnieken van machine learning toepassen op data die zijn opgeslagen in MySQL of in de objectopslag met HeatWave Lakehouse. Zo kunnen ze ML-initiatieven versnellen, de beveiliging verbeteren en de kosten verlagen.
HeatWave AutoML automatiseert de levenscyclus van machine learning, inclusief algoritmeselectie, intelligente voorbeelddata voor modeltraining, functieselectie en optimalisatie van hyperparameters, waardoor data-analisten en datawetenschappers veel tijd en moeite kunnen besparen. Aspecten van de pijplijn voor machine learning kunnen worden aangepast, waaronder algoritmeselectie, functieselectie en optimalisatie van hyperparameters. HeatWave AutoML ondersteunt systeemtaken voor het detecteren van afwijkingen, prognoses, classificatie, regressie en aanbevelingen, onder meer voor tekstkolommen. Gebruikers kunnen feedback geven over de resultaten van detectie van ongecontroleerde afwijkingen en deze gelabelde data gebruiken om verdere voorspellingen te verbeteren.
Door rekening te houden met zowel impliciete feedback (eerdere aankopen, surfgedrag enzovoort) als expliciete feedback (beoordelingen, vind-ik-leuks enzovoort), kan het aanbevelingssysteem van HeatWave AutoML gepersonaliseerde aanbevelingen genereren. Analisten kunnen bijvoorbeeld voorspellen welke items een gebruiker leuk vindt, welke gebruikers een bepaald item leuk vinden en welke beoordelingen items zullen krijgen. Ze kunnen ook voor een bepaalde gebruiker een lijst met vergelijkbare gebruikers en voor een bepaald item een lijst met soortgelijke items samenstellen.
Met de interactieve console kunnen bedrijfsanalisten ML-modellen bouwen, trainen, uitvoeren en uitleggen via een visuele interface, zonder SQL-opdrachten of codering te gebruiken. In de console is het ook gemakkelijk om what-if-scenario's te verkennen om zakelijke aannames te evalueren. Bijvoorbeeld: "Welke invloed zou een 30% hogere investering in betaalde advertenties hebben op de omzet en winst?"
Alle modellen die door HeatWave AutoML zijn getraind, zijn verklaarbaar. HeatWave AutoML biedt voorspellingen met een uitleg van de resultaten, waardoor organisaties worden geholpen met naleving van regelgeving, billijkheid, herhaalbaarheid, causaliteit en vertrouwen.
Met onderwerpmodellering kunnen gebruikers inzichten ontdekken in grote gegevenssets met teksten. Zo krijgen ze beter inzicht in belangrijke thema's in documenten, bijvoorbeeld voor het voltooien van een sentimentanalyse van sociale-mediagegevens. Met detectie van afwijkende data kunnen analisten bepalen wanneer modellen opnieuw moeten worden getraind door de verschillen te detecteren tussen de data die worden gebruikt voor training en nieuwe inkomende data.
Ontwikkelaars en data-analisten kunnen machine learning-modellen bouwen met behulp van vertrouwde SQL-opdrachten zondat dat ze nieuwe tools en talen hoeven te leren. Ook is HeatWave AutoML geïntegreerd in populaire platforms zoals Jupyter en Apache Zeppelin.
HeatWave Autopilot biedt workload-gerichte automatisering op basis van machine learning. Het verbetert de prestaties en schaalbaarheid zonder dat expertise op het gebied van databaseafstemming nodig is, het verhoogt de productiviteit van ontwikkelaars en databasebeheerders en het elimineert menselijke fouten. HeatWave Autopilot automatiseert vele essentiële en vaak complexe aspecten van het realiseren van hoge queryprestaties op grote schaal, waaronder de initialisatie, het laden van gegevens, de uitvoering van query's en het omgaan met storingen. HeatWave Autopilot is zonder extra kosten beschikbaar voor klanten van HeatWave MySQL.
HeatWave Autopilot biedt een groot aantal mogelijkheden voor HeatWave en OLTP, waaronder:
Dankzij realtime flexibiliteit kunnen klanten hun HeatWave cluster vergroten of verkleinen met een willekeurig aantal nodes zonder uitvaltijd of alleen-lezen tijd.
Het wijzigen van de grootte duurt slechts enkele minuten. HeatWave blijft online en beschikbaar voor alle bewerkingen. Als de grootte is aangepast, worden data uit de objectopslag gedownload en automatisch opnieuw verdeeld over alle beschikbare clusternodes. De data zijn direct beschikbaar voor query's. Hierdoor profiteren klanten van consistent hoge prestaties, zelfs tijdens piekuren, en kunnen ze de kosten verlagen door hun HeatWave cluster indien nodig en zonder uitvaltijd of alleen-lezen tijd te verkleinen.
Door data op efficiënte wijze opnieuw te laden uit de objectopslag, kunnen klanten hun HeatWave cluster ook onderbreken en hervatten om kosten te besparen.
Klanten kunnen hun HeatWave cluster uitbreiden naar een onbeperkt aantal nodes. Ze zijn niet beperkt tot overgeïnitialiseerde en dure instances die worden afgedwongen door de starre modellen die andere clouddatabaseproviders bieden. Met HeatWave betalen klanten alleen voor de resources die ze gebruiken.
U kunt HeatWave implementeren op OCI, AWS of Azure. U kunt data repliceren van lokale OLTP-applicaties naar HeatWave om vrijwel realtime analyses te maken en vectordata in de cloud te verwerken. U kunt HeatWave ook in uw datacenter gebruiken met OCI Dedicated Region.
HeatWave op AWS biedt AWS-klanten een native ervaring. Console, besturingsvlak en gegevenslaag bevinden zich allen in AWS.