Oracle MySQL HeatWave prend désormais en charge le stockage vectoriel et l'IA générative

Les améliorations d'Oracle MySQL HeatWave dévoilées à Oracle CloudWorld 2023 incluent le stockage vectoriel, l'IA générative pour les LLM et l'accès natif au lakehouse sur AWS.

Mike Chen | 28 septembre 2023


MySQL HeatWave d'Oracle est considéré comme le seul service de base de données cloud capable de gérer des transactions, des analyses en temps réel dans les data warehouses et les data lakes, et le machine learning dans une base de données MySQL. Tout cela est possible sans la complexité, les risques ou les coûts de la duplication ETL. Désormais, MySQL HeatWave, encensé dans un article de Forbes, fait un autre bond en avant avec une nouvelle banque de vecteurs, des fonctionnalités d'IA générative, la disponibilité de MySQL HeatWave Lakehouse sur Amazon Web Services (AWS), etc.

La prise en charge de l'IA générative, ainsi que la possibilité d'augmenter l'entraînement de grands modèles de langage (LLM) avec les données internes d'une entreprise, a été l'annonce phare de MySQL HeatWave à Oracle CloudWorld. « Les améliorations apportées aujourd'hui à MySQL HeatWave constituent une nouvelle étape importante de notre parcours pour résoudre les problèmes urgents liés aux données clients, à l'analyse et à l'IA », a déclaré Edward Screven, Architecte d'entreprise en chef d'Oracle. « Désormais, le stockage vectoriel et l'IA générative apportent la puissance des LLM aux clients, leur offrant un moyen intuitif d'interagir avec les données de leur entreprise et d'obtenir les réponses précises dont ils ont besoin pour leur entreprise. »

« Désormais, le stockage vectoriel et l'IA générative apportent la puissance des LLM aux clients, leur offrant un moyen intuitif d'interagir avec les données de leur entreprise et d'obtenir les réponses précises dont ils ont besoin pour leur entreprise. »

Edward Screven Architecte d'entreprise en chef d'Oracle

La banque de vecteurs ingère des données d'entreprise à partir d'un data lakehouse, puis les stocke en tant qu'intégrations générées via un encodeur pour une utilisation en tant que contexte supplémentaire pour les requêtes LLM. Les invites utilisateur destinées aux LLM font l'objet d'une recherche de similarité par rapport à la banque de vecteurs. Le résultat est utilisé comme requête d'entrée qui combine l'invite d'origine et la recherche de similarité, ce qui permet au LLM de fournir une réponse plus contextuelle et pertinente dérivée des données d'entreprise.

« La sortie du stockage vectoriel sert tout simplement d'entrée pour le LLM », explique Nipun Agarwal, Vice-Président senior du développement MySQL HeatWave chez Oracle. « Les LLM ne sont pas formés sur ces données propriétaires. Il n'y a donc pas de risque de fuite de données. »

Actuellement en prévisualisation privée, la combinaison du stockage vectoriel et de l'IA générative représente un outil puissant pour aider les entreprises à tirer parti des données propriétaires pour les requêtes et les recherches, conduisant finalement à des réponses plus précises aux requêtes en langage naturel.

Lancé en juillet 2023 sur Oracle Cloud Infrastructure (OCI), MySQL HeatWave Lakehouse accélère les analyses sur les données des banques d'objets dans divers formats sans les importer vers MySQL, ce qui rend HeatWave accessible même pour les workloads autres que MySQL. Désormais, les clients AWS peuvent bénéficier de ces mêmes fonctionnalités, car MySQL HeatWave Lakehouse s'exécute de manière native sur la plateforme.

« Nous utilisons l'infrastructure AWS pour exécuter MySQL HeatWave dans AWS, y compris HeatWave Lakehouse », a déclaré E. Screven. « Cela signifie que si vous utilisez HeatWave Lakehouse dans AWS, il n'y a pas de frais de sortie de données. Vous pouvez analyser les fichiers stockés dans des buckets S3. »

Des centaines de téraoctets de données au format CSV, Apache Parquet, Avro et d'autres formats, y compris les exportations d'autres bases de données, peuvent être interrogés de manière native. MySQL HeatWave est également disponible pour les utilisateurs Microsoft Azure dans le cadre d'Oracle Database Service for Microsoft Azure.

« MySQL HeatWave peut désormais interroger directement les données stockées dans des fichiers de la banque d'objets. Cela signifie que vous n'avez pas besoin de l'ingérer dans MySQL  », a expliqué E. Screven. « Cela signifie également que MySQL HeatWave Lakehouse devient un service que vous pouvez utiliser pour toutes vos données : appareils IoT, fichiers journaux, exportations à partir d'autres bases de données. »

MySQL Autopilot Indexing est une autre nouvelle fonctionnalité annoncée par E. Screven à CloudWorld. Actuellement en disponibilité limitée, Autopilot Indexing accélère et améliore l'indexation en utilisant le machine learning pour formuler des recommandations de création et de suppression d'index. Autopilot Indexing génère également des évaluations d'impact sur les performances, ainsi que des recommandations pour éclairer les décisions de réglage. D'autres fonctionnalités récemment annoncées pour MySQL HeatWave incluent :

  • La prise en charge de HeatWave AutoML pour MySQL HeatWave Lakehouse, permettant aux clients d'appliquer facilement et en toute sécurité la formation, l'inférence et l'explication du machine learning aux données dans le stockage d'objets
  • L'amélioration du système de recommandation HeatWave AutoML, qui génère des recommandations personnalisées
  • La prise en charge de JavaScript pour écrire et exécuter des procédures et des fonctions stockées dans MySQL HeatWave
  • Analyse en temps réel de documents JSON
  • Des fonctionnalités supplémentaires pour MySQL Autopilot, telles que la compression automatique et l'exécution adaptative de requêtes

Voir plus d'articles sur Oracle Connect