HeatWave GenAI fournit une IA générative intégrée, automatisée et sécurisée avec des grands modèles de langage (LLM) dans la base de données, un stockage vectoriel automatisé dans la base de données, un traitement vectoriel scale-out et la possibilité d'avoir des conversations contextuelles en langage naturel, ce qui vous permet de tirer parti de l'IA générative sans expertise en IA, ni déplacement de données, ni frais supplémentaires.
Voici les fonctionnalités clés de HeatWave GenAI :
Les versions quantisées des LLM dans la base de données suivants sont actuellement disponibles dans HeatWave :
Vous pouvez créer une banque de vecteurs pour le contenu non structuré d'entreprise à l'aide d'une seule commande SQL. Toutes les étapes de création d'une banque de vecteurs et de vectorisation sont automatisées et exécutées à l'intérieur de la base de données, y compris la découverte des documents dans le stockage d'objets, leur analyse, la génération d'intégrations de manière hautement parallèle et optimisée, et leur insertion dans la banque de vecteurs, ce qui rend HeatWave Vector Store efficace et facile à utiliser.
HeatWave s'exécute sur du matériel de base. Les LLM dans la base de données ne tournent pas sur des GPU, mais sur des CPU. Par conséquent, vous pouvez réduire les coûts et ne pas avoir à vous soucier de la disponibilité des LLM dans divers data centers.
Lorsque vous utilisez des LLM dans la base de données et une banque de vecteurs dans la base de données, les données ne quittent pas la base de données, ce qui contribue à améliorer la sécurité des données.
Oui, HeatWave GenAI est disponible nativement sur AWS, ainsi que d'autres fonctionnalités HeatWave, notamment HeatWave MySQL, HeatWave Lakehouse, HeatWave AutoML et HeatWave Autopilot.
Oui, les vecteurs peuvent être générés pour les données textuelles dans 27 langues différentes.
Les invites peuvent être émises en anglais. Les invites émises dans d'autres langues, telles que l'espagnol et l'allemand, peuvent être traduites en anglais.
Non, la recherche vectorielle est effectuée dans le cluster HeatWave.
HeatWave est exécuté sur un nœud MySQL. Nous recommandons un nœud MySQL avec une forme MySQL.32 et des nœuds HeatWave avec la forme HeatWave.512 Go pour un environnement de production. Pour le développement/test, vous pouvez utiliser une forme MySQL plus petite. Vous pouvez consulter les formes MySQL prises en charge ici. Pour HeatWave GenAI, la forme HeatWave.32 Go n'est pas prise en charge.
Les formats PDF, texte, PowerPoint, Word et HTML sont pris en charge.
Il n'y a pas de coût supplémentaire au-delà du coût du cluster HeatWave pour l'utilisation de HeatWave GenAI. Vous pouvez appeler des LLM dans la base de données et intégrer des modèles fournis avec HeatWave GenAI sans frais supplémentaires. Vous pouvez également appeler des LLM externes disponibles via OCI Generative AI sur OCI et Amazon Bedrock sur AWS. Ces services seront facturés.
Non, les LLM sont des modèles préentraînés. Vos données ne sont pas utilisées pour l'entraînement des LLM.
Non, les LLM dans la base de données fournis avec HeatWave ne peuvent pas être affinés.
Non, vous ne pouvez pas utiliser vos propres LLM et embeddings. Cependant, vous pouvez invoquer les LLM externes ou intégrer des modèles disponibles via OCI Generative AI lors de l'exécution de HeatWave GenAI sur OCI et via Amazon Bedrock lors de l'exécution de HeatWave GenAI sur AWS.
Sur la base de nos tests, les résultats sont comparables aux LLM non quantisés pour les cas d'utilisation qui reposent sur HeatWave Vector Store. Vous pouvez facilement tester les modèles pour évaluer les performances et la qualité des résultats.
Vous ne devez générer des vectorisations qu'une seule fois et elles seront stockées dans la banque de vecteurs HeatWave. Les modifications apportées aux documents non structurés dans le stockage d'objets déclenchent automatiquement les mises à jour des vectorisations associées.
Oui, la prise en charge de la reconnaissance optique de caractères permet à HeatWave Vector Store de convertir le contenu numérisé enregistré sous forme d'images en données texte pouvant être analysées, par exemple, pour effectuer des recherches de similarité.