Fonctionnalités HeatWave

HeatWave

HeatWave est un moteur de traitement de requêtes en colonnes hybrides, massivement parallèle et en mémoire. Il met en place des algorithmes de pointe pour le traitement des requêtes distribuées qui apportent des hautes performances.

Architecturé pour une échelle et des performances massives

HeatWave partitionne considérablement les données dans un cluster de nœuds, qui peuvent être exécutés en parallèle. Ceci offre une excellente évolutivité entre nœuds. Chaque nœud d'un cluster et chaque cœur d'un nœud peuvent traiter les données partitionnées en parallèle. HeatWave dispose d'un planificateur intelligent de requêtes qui superpose le calcul avec les tâches de communication réseau pour atteindre une très forte évolutivité parmi des milliers de cœurs.

Optimisé pour le cloud et les données dans le stockage d'objets

Le traitement des requêtes dans HeatWave a été optimisé pour les serveurs de base dans le cloud. Les tailles des partitions ont été optimisées pour s’adapter au cache des formes sous-jacentes. La superposition du calcul avec la communication est optimisée pour la bande passante du réseau disponible. De nombreuses primitives de traitement analytique utilisent les instructions du hardware des machines virtuelles sous-jacentes (VM). HeatWave est également conçu pour être un moteur de traitement de données évolutif, optimisé pour interroger les données dans le stockage d'objets.


HeatWave GenAI

HeatWave GenAI fournit une IA générative intégrée et automatisée avec des modèles de langage volumineux (LLM) dans la base de données, un stockage vectoriel automatisé dans la base de données et la possibilité d'avoir des conversations contextuelles en langage naturel, ce qui vous permet de tirer parti de l'IA générative sans expertise en IA ni déplacement de données.

LLM dans la base de données

Utilisez les LLM intégrés et optimisés dans toutes les régions Oracle Cloud Infrastructure (OCI), dans la région dédiée OCI et dans les clouds et obtenez des résultats cohérents avec des performances prévisibles dans tous les déploiements. Réduisez les coûts d'infrastructure en éliminant le besoin de provisionner les GPU.

Intégré à l'aide d'OCI Generative AI

Accédez à des modèles de base préentraînés à partir de Cohere and Meta via le service OCI Generative AI.

Stockage vectoriel dans la base de données

Effectuez une génération augmentée par extraction (RAG) dans les LLM et vos documents propriétaires dans divers formats hébergés dans HeatWave Vector Store pour obtenir des réponses plus précises et contextuellement pertinentes, sans déplacer les données vers une base de données vectorielle distincte.

Génération automatisée d'intégrations

Tirez parti du pipeline automatisé pour découvrir et ingérer des documents propriétaires dans HeatWave Vector Store, ce qui facilite l'utilisation du stockage vectoriel par les développeurs et les analystes sans expertise en IA.

Traitement vectoriel évolutif

Le traitement vectoriel est parallélisé sur jusqu'à 512 noeuds de cluster HeatWave et exécuté à la bande passante de la mémoire, ce qui permet d'obtenir des résultats rapides avec une probabilité réduite de perte de précision.

HeatWave Chat

Ayez des conversations contextuelles éclairées par vos documents non structurés dans le stockage d'objets en langage naturel. Utilisez le navigateur Lakehouse intégré pour aider les LLM à effectuer des recherches dans des ensembles de données spécifiques, ce qui vous permet de réduire les coûts tout en obtenant des résultats plus précis plus rapidement.

En savoir plus sur HeatWave GenAI


HeatWave MySQL

HeatWave MySQL est un service de base de données entièrement géré, et le seul service cloud basé sur MySQL Enterprise Edition, avec des fonctionnalités de sécurité avancées pour le cryptage, le masquage des données, l'authentification et un pare-feu de base de données. HeatWave améliore les performances des requêtes MySQL par ordre de grandeur et vous permet d'obtenir des analyses en temps réel sur vos données transactionnelles dans MySQL, sans la complexité, la latence, les risques et le coût de la duplication de l'extraction, de la transformation et du chargement (ETL) vers une base de données d'analyse distincte.

Analyse en temps réel sans ETL

Les requêtes d'analyses accèdent toujours aux données les plus récentes à mesure que les mises à jour des transactions sont répliquées automatiquement en temps réel vers le cluster d'analyse HeatWave. Il n’est pas nécessaire d’indexer les données avant d’exécuter des requêtes d’analyse. Vous pouvez éliminer les processus et intégrations ETL complexes, longs et coûteux grâce à une base de données d'analyse distincte.

En savoir plus sur HeatWave MySQL


HeatWave Lakehouse

HeatWave Lakehouse permet aux utilisateurs d'interroger un demi-pétaoctet de données dans le stockage d'objets, dans divers formats de fichiers, tels que CSV, Parquet, Avro; JSON et des fichiers d'export d'autres bases de données. Le traitement des requêtes est entièrement effectué dans le moteur HeatWave, ce qui permet aux clients de tirer parti de HeatWave pour les workloads non MySQL en plus des workloads compatibles MySQL.

Analyses et machine learning rapides pour toutes les données de lakehouse

Les clients peuvent interroger les données sous différents formats dans le stockage d'objets, les données transactionnelles dans les bases de données MySQL, ou une combinaison des deux en utilisant les commandes SQL standard. L'interrogation des données dans le stockage d'objets est aussi rapide que dans les bases de données, d'après un test d'évaluation TPC-H de 10 To.

Avec HeatWave AutoML, les clients peuvent utiliser les données dans le stockage d'objets et/ou la base de données pour créer, entraîner, déployer et expliquer automatiquement des modèles de machine learning, sans déplacer les données vers un service cloud de machine learning distinct.

Architecture évolutive pour la gestion des données et le traitement des requêtes

L'architecture massivement partitionnée de HeatWave permet une architecture évolutive pour HeatWave Lakehouse. Le traitement des requêtes et les opérations de gestion des données telles que le chargement/rechargement des données évoluent avec la taille des données. Les clients peuvent interroger jusqu'à un demi-pétaoctet de données dans le stockage d'objets avec MySQL Lakehouse sans avoir à les copier dans la base de données MySQL. Le cluster HeatWave est redimensionné à 512 nœuds.

Améliorer les performances et gagner du temps grâce à l'automatisation alimentée à l'aide du machine learning

Les fonctionnalités de MySQL Autopilot, telles que le provisionnement automatique, l'amélioration automatique du plan de requêtes et le chargement parallèle automatique, ont été améliorées pour HeatWave Lakehouse, ce qui réduit encore les frais d'administration des bases de données et améliore les performances. Les nouvelles capacités de New HeatWave Autopilot sont également disponibles pour HeatWave Lakehouse.

  • L'inférence de schéma automatique déduit automatiquement la correspondance entre les données de fichier et la définition de schéma concerné pour tous les types de fichier pris en charge, y compris CSV. Par conséquent, les clients n'ont pas besoin de définir et de mettre à jour manuellement le mappage de schéma des fichiers, ce qui permet de gagner du temps et de faire des économies.
  • L'échantillonnage adaptatif des données échantillonne intelligemment les fichiers dans le stockage d'objets afin d'obtenir les informations utilisées par HeatWave Autopilot pour faire des prédictions d'automatisation. Grâce à l'échantillonnage adaptatif des données, HeatWave Autopilot peut analyser et effectuer des prédictions, telles que le mappage de schéma sur un fichier de 400 To en moins d'une minute.
  • Le flux de données adaptatif permet à HeatWave Lakehouse de s'adapter dynamiquement aux performances du dépôt d'objets sous-jacent dans toutes les régions afin d'améliorer les performances globales, le rapport prix-performances et la disponibilité.

En savoir plus sur HeatWave Lakehouse


HeatWave AutoML

HeatWave AUtoML comprend tout ce dont les utilisateurs ont besoin pour créer, entraîner, déployer et expliquer des modèles de machine learning dans MySQL HeatWave, sans frais supplémentaires.

Un service de machine learning distinct ? Ce n'est plus nécessaire !

Grâce au machine learning disponible dans les bases de données HeatWave, les clients n'ont pas besoin de déplacer leurs données vers un service de machine learning distinct. Ils peuvent facilement et en toute sécurité utiliser le machine learning, l'inférence et l'explication aux données stockées à l'intérieur de MySQL et dans un dépôt d'objets avec HeatWave Lakehouse. Dès lors, ils peuvent mener à bien plus rapidement leurs projets de machine learning, renforcer leur sécurité et réduire leurs coûts.

Gagnez du temps et facilitez-vous la vie grâce à l'automatisation du cycle de vie de machine learning

HeatWave AutoML automatise le cycle de vie du machine learning, notamment la sélection d'algorithmes, l'échantillonnage intelligent des données pour l'entraînement de modèle, la sélection des caractéristiques et l'optimisation des hyperparamètres. Les analystes de données et les data scientists gagnent ainsi du temps et évitent les tâches chronophages. Les aspects du pipeline de machine learning peuvent être personnalisés, notamment la sélection d'algorithmes, la sélection de fonctionnalités et l'optimisation des hyperparamètres. HeatWave AutoML prend en charge les tâches de détection d'anomalies, de prévision, de classification, de régression et de recommandation, y compris pour les colonnes de texte.

Système de recommandations personnalisées

En prenant en compte les retours implicites (achats passés, comportement de navigation, etc.) et les retours explicites (évaluations, mentions J'aime, etc.), le système de recommandation HeatWave AutoML peut générer des recommandations personnalisées. Les analystes, par exemple, peuvent prévoir les articles qu'un utilisateur désire, les utilisateurs qui aimeront un élément spécifique et les évaluations qu'ils recevront. Ils peuvent également dresser une liste des utilisateurs similaires à un utilisateur donné ou trouver des articles analogues à un autre article.

Console interactive HeatWave AutoML

La console interactive permet aux analystes de créer, d'entraîner, d'exécuter et d'expliquer des modèles de machine learning à l'aide de l'interface visuelle, sans utiliser de commandes SQL ni de codage. La console facilite également l'exploration de scénarios de simulation pour évaluer des hypothèses commerciales, comme par exemple : « Si nous investissons 30 % de plus dans la publicité payante sur les réseaux sociaux, quels en seraient les effets sur les revenus et les bénéfices ? »

Modèles de machine learning explicables

Tous les résultats des modèles entraînés par HeatWave AutoML peuvent être expliqués. HeatWave AutoML fournit des prédictions avec une explication des résultats, ce qui aide les entreprises à respecter la conformité, l'équité, la répétabilité, la causalité et la fiabilité.

Utilisez vos compétences actuelles

Les développeurs et les analystes de données peuvent créer des modèles de machine learning à l'aide de commandes SQL courantes. Ils n'ont pas besoin d'apprendre de nouveaux outils et langages. De plus, HeatWave AutoML est intégré à des blocs-notes populaires tels que Jupyter et Apache Zeppelin.


HeatWave Autopilot

HeatWave Autopilot fournit une automatisation basée sur le machine learning et tenant compte des workloads. Il améliore les performances et l'évolutivité sans nécessiter d'expertise en réglage de base de données, augmente la productivité des développeurs et des administrateurs de base de données et aide à éliminer les erreurs humaines. HeatWave Autopilot automatise la plupart des aspects les plus importants et souvent les plus difficiles pour atteindre des performances élevées de requêtes à grande échelle, dont le provisionnement, le chargement des données, l'exécution des requêtes et la gestion des pannes. HeatWave Autopilot est disponible sans coûts supplémentaires pour les clients de HeatWave MySQL.

HeatWave Autopilot offre de nombreuses fonctionnalités à la fois pour HeatWave et OLTP, dont :

  • Le provisionnement automatique prévoir le nombre de noeuds HeatWave requis pour exécuter un workload grâce à l'échantillonnage adaptatif des données de tableaux sur lesquels les analyses sont requises. Cela signifie que les développeurs et les administrateurs de bases de données ne doivent plus estimer manuellement la taille optimale de leur cluster.
  • Le regroupement automatique des threads permet au service de base de données de traiter un plus grand nombre de transactions pour une configuration matérielle donnée, ce qui permet d'augmenter le débit des charges de travail OLTP et d'éviter qu'il ne chute à des niveaux élevés de transactions et de concurrence.
  • La prédiction automatique des formes surveille en permanence le workload OLTP, et notamment le débit et le taux de succès du pool de tampons, pour recommander la bonne forme de calcul à tout moment. Les clients obtiennent ainsi le meilleur rapport coûts-performances.
  • L'auto-encodage détermine la représentation optimale des colonnes chargées dans HeatWave, en prenant en compte les requêtes. La représentation optimale apporte les meilleures performances de requêtes et minimise la taille des clusters pour optimiser les coûts.
  • L'amélioration automatique de la planification de requêtes apprend diverses statistiques à partir de l'exécution des requêtes et améliore le pan d'exécution des requêtes futures. Cela améliore les performances du systèmes au fur et à mesure que d'autres requêtes sont exécutées.
  • L'optimisation adaptative des requêtes utilise diverses statistiques pour ajuster les structures de données et les ressources système après le démarrage de l'exécution des requêtes, optimisant de manière indépendante l'exécution des requêtes pour chaque nœud en fonction de la répartition réelle des données lors de l'exécution. Cela permet d'améliorer les performances des requêtes ad hoc jusqu'à 25 %.
  • Le placement automatique des données prévoit la colonne dans laquelle les tableaux doivent être partitionnés en mémoire pour atteindre les meilleures performances pour les requêtes. Cela prédit également le gain attendu en matière de performances de requêtes grâce à la nouvelle recommandation de colonne. Cela minimise le déplacement des données dans les noeuds en raison de choix non optimaux qui peuvent être faits par des opérateurs lors de la sélection manuelle de la colonne.
  • La compression automatique détermine l'algorithme de compression optimal pour chaque colonne, ce qui améliore les performances de chargement et de requête grâce à une compression et une décompression des données plus rapides. En réduisant l'utilisation de la mémoire, les clients peuvent réaliser des économies allant jusqu'à 25 %.
  • L'indexation (disponibilité limitée) détermine automatiquement les index que les clients doivent créer ou supprimer de leurs tables pour optimiser le rendement OLTP, en utilisant le machine learning pour effectuer une prédiction en fonction des charges de travail des applications individuelles. Cela permet aux clients d'éliminer les tâches chronophages de création d'index optimaux pour leurs charges de travail OLTP et de les maintenir au fil du temps à mesure que ces charges de travail évoluent.

Elasticité en temps réel

L'élasticité en temps réel permet aux clients d'augmenter ou de réduire la taille de leur cluster HeatWave de n'importe quel nombre de nœuds, sans aucun temps d'arrêt ni temps de lecture seule.

Performances élevées, même lors des pics d'activité, et coûts réduits sans temps d'arrêt

L'opération de redimensionnement ne prend que quelques minutes, pendant lesquelles HeatWave reste en ligne et disponible pour toutes les opérations. Une fois redimensionnées, les données sont téléchargées à partir du stockage d'objets, automatiquement rééquilibrées entre tous les nœuds de cluster disponibles et deviennent immédiatement disponibles pour les requêtes. Par conséquent, les clients bénéficient de performances toujours élevées, même lors des pics d'activité, et de coûts réduits en redimensionnant à la baisse leur cluster HeatWave si nécessaire, sans aucun temps d'arrêt ni période en lecture seule.

Grâce à un rechargement efficace des données à partir du stockage d'objets, les clients peuvent également mettre en pause et reprendre leur cluster HeatWave pour réduire les coûts.

Aucune instance surprovisionnée

Les clients peuvent étendre ou réduire leur cluster HeatWave pour atteindre le nombre de nœuds de leur choix. Ils ne sont pas contraints de se contenter d'instances surprovisionnées et coûteuses, contraintes par des modèles de dimensionnement rigides. Avec HeatWave, les clients ne payent que pour les ressources exactes qu'ils utilisent.


Disponible dans les clouds publics et dans votre data center

Vous pouvez déployer HeatWave sur OCI, AWS ou Azure. Vous pouvez répliquer les données des applications OLTP sur site vers HeatWave pour obtenir des analyses en temps quasi réel et traiter les données vectorielles dans le cloud. Vous pouvez également utiliser HeatWave dans votre data center avec OCI Dedicated Region.

HeatWave sur AWS offre une expérience native aux clients AWS. La console, le plan de contrôle et le plan de données résident dans AWS.