HeatWave est un moteur de traitement de requêtes en colonnes hybrides, massivement parallèle et en mémoire. Il met en place des algorithmes de pointe pour le traitement des requêtes distribuées qui apportent des hautes performances.
HeatWave partitionne considérablement les données dans un cluster de nœuds, qui peuvent être exécutés en parallèle. Ceci offre une excellente évolutivité entre nœuds. Chaque nœud d'un cluster et chaque cœur d'un nœud peuvent traiter les données partitionnées en parallèle. HeatWave dispose d'un planificateur intelligent de requêtes qui superpose le calcul avec les tâches de communication réseau pour atteindre une très forte évolutivité parmi des milliers de cœurs.
Le traitement des requêtes dans HeatWave a été optimisé pour les serveurs de base dans le cloud. Les tailles des partitions ont été optimisées pour s’adapter au cache des formes sous-jacentes. La superposition du calcul avec la communication est optimisée pour la bande passante du réseau disponible. De nombreuses primitives de traitement analytique utilisent les instructions du hardware des machines virtuelles sous-jacentes (VM). HeatWave est également conçu pour être un moteur de traitement de données évolutif, optimisé pour interroger les données dans le stockage d'objets.
HeatWave GenAI fournit une IA générative intégrée et automatisée avec des modèles de langage volumineux (LLM) dans la base de données, un stockage vectoriel automatisé dans la base de données et la possibilité d'avoir des conversations contextuelles en langage naturel, ce qui vous permet de tirer parti de l'IA générative sans expertise en IA ni déplacement de données.
Utilisez les LLM intégrés et optimisés dans toutes les régions Oracle Cloud Infrastructure (OCI), dans la région dédiée OCI et dans les clouds et obtenez des résultats cohérents avec des performances prévisibles dans tous les déploiements. Réduisez les coûts d'infrastructure en éliminant le besoin de provisionner les GPU.
Accédez à des modèles de base préentraînés à partir de Cohere and Meta via le service OCI Generative AI.
Effectuez une génération augmentée par extraction (RAG) dans les LLM et vos documents propriétaires dans divers formats hébergés dans HeatWave Vector Store pour obtenir des réponses plus précises et contextuellement pertinentes, sans déplacer les données vers une base de données vectorielle distincte.
Tirez parti du pipeline automatisé pour découvrir et ingérer des documents propriétaires dans HeatWave Vector Store, ce qui facilite l'utilisation du stockage vectoriel par les développeurs et les analystes sans expertise en IA.
Le traitement vectoriel est parallélisé sur jusqu'à 512 noeuds de cluster HeatWave et exécuté à la bande passante de la mémoire, ce qui permet d'obtenir des résultats rapides avec une probabilité réduite de perte de précision.
Ayez des conversations contextuelles éclairées par vos documents non structurés dans le stockage d'objets en langage naturel. Utilisez le navigateur Lakehouse intégré pour aider les LLM à effectuer des recherches dans des ensembles de données spécifiques, ce qui vous permet de réduire les coûts tout en obtenant des résultats plus précis plus rapidement.
HeatWave MySQL est un service de base de données entièrement géré, et le seul service cloud basé sur MySQL Enterprise Edition, avec des fonctionnalités de sécurité avancées pour le cryptage, le masquage des données, l'authentification et un pare-feu de base de données. HeatWave améliore les performances des requêtes MySQL par ordre de grandeur et vous permet d'obtenir des analyses en temps réel sur vos données transactionnelles dans MySQL, sans la complexité, la latence, les risques et le coût de la duplication de l'extraction, de la transformation et du chargement (ETL) vers une base de données d'analyse distincte.
Les requêtes d'analyses accèdent toujours aux données les plus récentes à mesure que les mises à jour des transactions sont répliquées automatiquement en temps réel vers le cluster d'analyse HeatWave. Il n’est pas nécessaire d’indexer les données avant d’exécuter des requêtes d’analyse. Vous pouvez éliminer les processus et intégrations ETL complexes, longs et coûteux grâce à une base de données d'analyse distincte.
HeatWave Lakehouse permet aux utilisateurs d'interroger un demi-pétaoctet de données dans le stockage d'objets, dans divers formats de fichiers, tels que CSV, Parquet, Avro; JSON et des fichiers d'export d'autres bases de données. Le traitement des requêtes est entièrement effectué dans le moteur HeatWave, ce qui permet aux clients de tirer parti de HeatWave pour les workloads non MySQL en plus des workloads compatibles MySQL.
Les clients peuvent interroger les données sous différents formats dans le stockage d'objets, les données transactionnelles dans les bases de données MySQL, ou une combinaison des deux en utilisant les commandes SQL standard. L'interrogation des données dans le stockage d'objets est aussi rapide que dans les bases de données, d'après un test d'évaluation TPC-H de 10 To.
Avec HeatWave AutoML, les clients peuvent utiliser les données dans le stockage d'objets et/ou la base de données pour créer, entraîner, déployer et expliquer automatiquement des modèles de machine learning, sans déplacer les données vers un service cloud de machine learning distinct.
L'architecture massivement partitionnée de HeatWave permet une architecture évolutive pour HeatWave Lakehouse. Le traitement des requêtes et les opérations de gestion des données telles que le chargement/rechargement des données évoluent avec la taille des données. Les clients peuvent interroger jusqu'à un demi-pétaoctet de données dans le stockage d'objets avec MySQL Lakehouse sans avoir à les copier dans la base de données MySQL. Le cluster HeatWave est redimensionné à 512 nœuds.
Les fonctionnalités de MySQL Autopilot, telles que le provisionnement automatique, l'amélioration automatique du plan de requêtes et le chargement parallèle automatique, ont été améliorées pour HeatWave Lakehouse, ce qui réduit encore les frais d'administration des bases de données et améliore les performances. Les nouvelles capacités de New HeatWave Autopilot sont également disponibles pour HeatWave Lakehouse.
HeatWave AUtoML comprend tout ce dont les utilisateurs ont besoin pour créer, entraîner, déployer et expliquer des modèles de machine learning dans MySQL HeatWave, sans frais supplémentaires.
Grâce au machine learning disponible dans les bases de données HeatWave, les clients n'ont pas besoin de déplacer leurs données vers un service de machine learning distinct. Ils peuvent facilement et en toute sécurité utiliser le machine learning, l'inférence et l'explication aux données stockées à l'intérieur de MySQL et dans un dépôt d'objets avec HeatWave Lakehouse. Dès lors, ils peuvent mener à bien plus rapidement leurs projets de machine learning, renforcer leur sécurité et réduire leurs coûts.
HeatWave AutoML automatise le cycle de vie du machine learning, notamment la sélection d'algorithmes, l'échantillonnage intelligent des données pour l'entraînement de modèle, la sélection des caractéristiques et l'optimisation des hyperparamètres. Les analystes de données et les data scientists gagnent ainsi du temps et évitent les tâches chronophages. Les aspects du pipeline de machine learning peuvent être personnalisés, notamment la sélection d'algorithmes, la sélection de fonctionnalités et l'optimisation des hyperparamètres. HeatWave AutoML prend en charge les tâches de détection d'anomalies, de prévision, de classification, de régression et de recommandation, y compris pour les colonnes de texte.
En prenant en compte les retours implicites (achats passés, comportement de navigation, etc.) et les retours explicites (évaluations, mentions J'aime, etc.), le système de recommandation HeatWave AutoML peut générer des recommandations personnalisées. Les analystes, par exemple, peuvent prévoir les articles qu'un utilisateur désire, les utilisateurs qui aimeront un élément spécifique et les évaluations qu'ils recevront. Ils peuvent également dresser une liste des utilisateurs similaires à un utilisateur donné ou trouver des articles analogues à un autre article.
La console interactive permet aux analystes de créer, d'entraîner, d'exécuter et d'expliquer des modèles de machine learning à l'aide de l'interface visuelle, sans utiliser de commandes SQL ni de codage. La console facilite également l'exploration de scénarios de simulation pour évaluer des hypothèses commerciales, comme par exemple : « Si nous investissons 30 % de plus dans la publicité payante sur les réseaux sociaux, quels en seraient les effets sur les revenus et les bénéfices ? »
Tous les résultats des modèles entraînés par HeatWave AutoML peuvent être expliqués. HeatWave AutoML fournit des prédictions avec une explication des résultats, ce qui aide les entreprises à respecter la conformité, l'équité, la répétabilité, la causalité et la fiabilité.
Les développeurs et les analystes de données peuvent créer des modèles de machine learning à l'aide de commandes SQL courantes. Ils n'ont pas besoin d'apprendre de nouveaux outils et langages. De plus, HeatWave AutoML est intégré à des blocs-notes populaires tels que Jupyter et Apache Zeppelin.
HeatWave Autopilot fournit une automatisation basée sur le machine learning et tenant compte des workloads. Il améliore les performances et l'évolutivité sans nécessiter d'expertise en réglage de base de données, augmente la productivité des développeurs et des administrateurs de base de données et aide à éliminer les erreurs humaines. HeatWave Autopilot automatise la plupart des aspects les plus importants et souvent les plus difficiles pour atteindre des performances élevées de requêtes à grande échelle, dont le provisionnement, le chargement des données, l'exécution des requêtes et la gestion des pannes. HeatWave Autopilot est disponible sans coûts supplémentaires pour les clients de HeatWave MySQL.
HeatWave Autopilot offre de nombreuses fonctionnalités à la fois pour HeatWave et OLTP, dont :
L'élasticité en temps réel permet aux clients d'augmenter ou de réduire la taille de leur cluster HeatWave de n'importe quel nombre de nœuds, sans aucun temps d'arrêt ni temps de lecture seule.
L'opération de redimensionnement ne prend que quelques minutes, pendant lesquelles HeatWave reste en ligne et disponible pour toutes les opérations. Une fois redimensionnées, les données sont téléchargées à partir du stockage d'objets, automatiquement rééquilibrées entre tous les nœuds de cluster disponibles et deviennent immédiatement disponibles pour les requêtes. Par conséquent, les clients bénéficient de performances toujours élevées, même lors des pics d'activité, et de coûts réduits en redimensionnant à la baisse leur cluster HeatWave si nécessaire, sans aucun temps d'arrêt ni période en lecture seule.
Grâce à un rechargement efficace des données à partir du stockage d'objets, les clients peuvent également mettre en pause et reprendre leur cluster HeatWave pour réduire les coûts.
Les clients peuvent étendre ou réduire leur cluster HeatWave pour atteindre le nombre de nœuds de leur choix. Ils ne sont pas contraints de se contenter d'instances surprovisionnées et coûteuses, contraintes par des modèles de dimensionnement rigides. Avec HeatWave, les clients ne payent que pour les ressources exactes qu'ils utilisent.
Vous pouvez déployer HeatWave sur OCI, AWS ou Azure. Vous pouvez répliquer les données des applications OLTP sur site vers HeatWave pour obtenir des analyses en temps quasi réel et traiter les données vectorielles dans le cloud. Vous pouvez également utiliser HeatWave dans votre data center avec OCI Dedicated Region.
HeatWave sur AWS offre une expérience native aux clients AWS. La console, le plan de contrôle et le plan de données résident dans AWS.