Oracle MySQL HeatWave añade soporte para el almacenamiento vectorial y la IA generativa

Las mejoras de Oracle MySQL HeatWave presentadas en Oracle CloudWorld 2023 incluyen almacenamiento vectorial, IA generativa para LLM y acceso nativo a lakehouse en AWS.

Mike Chen | 28 de septiembre de 2023


MySQL HeatWave de Oracle es reconocido como el único servicio de base de datos en la nube capaz de ofrecer transacciones, análisis en tiempo real en almacenes de datos y lagos de datos, y machine learning en una base de datos MySQL. Todo ello sin la complejidad, los riesgos o los costos de la duplicación de ETL. Ahora MySQL HeatWave-denominada una potencial "aplicación asesina" para Oracle en un artículo de Forbes - da otro salto adelante con un nuevo almacén vectorial, capacidades de IA generativa, disponibilidad de MySQL HeatWave Lakehouse en Amazon Web Services (AWS), y más.

La compatibilidad con la IA generativa, junto con la capacidad de aumentar la formación de modelos de lenguaje de gran tamaño (LLM) con los propios datos de una empresa, fue el anuncio estrella de MySQL HeatWave en Oracle CloudWorld. "Las mejoras de hoy en MySQL HeatWave son otro paso importante en nuestro proceso para abordar los apremiantes problemas de datos, análisis e IA de los clientes", dijo Edward Screven, arquitecto corporativo jefe de Oracle. "Ahora el almacén vectorial y la IA generativa llevan el poder de los LLM a los clientes, proporcionándoles una forma intuitiva de interactuar con los datos de su empresa y obtener las respuestas precisas que necesitan para su negocio."

Ahora el almacén vectorial y la IA generativa llevan el poder de los LLM a los clientes, proporcionándoles una forma intuitiva de interactuar con los datos de su empresa y obtener las respuestas precisas que necesitan para su negocio."

Edward Screven Arquitecto corporativo jefe, Oracle

El almacén de vectores procesa los datos de la empresa desde un lago de datos y los almacena como incrustaciones generadas mediante un codificador para su uso como contexto adicional en las consultas LLM. Las peticiones de datos de usuario a los LLM se someten a una búsqueda de similitud en el almacén de vectores. El resultado se utiliza como consulta de entrada que combina la consulta original y la búsqueda de similitud, lo que permite al LLM ofrecer una respuesta más contextual y relevante derivada de los datos de la empresa.

"La salida del almacén de vectores es sólo una entrada para el LLM", comentó Nipun Agarwal, un vicepresidente senior de Oracle para el desarrollo de MySQL HeatWave. "Los LLM no reciben formación sobre estos datos confidenciales, por lo que no corres el riesgo de que se filtre información."

La combinación del almacén vectorial y la IA generativa, actualmente en fase de revisión premliminar, representa una potente herramienta para ayudar a las organizaciones a aprovechar los datos propios para consultas y búsquedas, lo que en última instancia conduce a respuestas más precisas a las consultas en lenguaje natural.

Lanzado en julio de 2023 en Oracle Cloud Infrastructure (OCI), MySQL HeatWave Lakehouse acelera el análisis de los datos de almacenes de objetos en varios formatos sin importarlos a MySQL, lo que hace que HeatWave sea accesible incluso para cargas de trabajo que no sean MySQL. Ahora, los clientes de AWS pueden disfrutar de estas mismas capacidades porque MySQL HeatWave Lakehouse se ejecuta de forma nativa en la plataforma.

"Utilizamos la infraestructura de AWS para ejecutar MySQL HeatWave en AWS, incluido HeatWave Lakehouse", afirma Screven. "Eso significa que si se utiliza HeatWave Lakehouse en AWS, no hay que pagar por la salida de datos. Puedes analizar archivos almacenados en buckets S3".

Se pueden consultar de forma nativa cientos de terabytes de datos en CSV, Apache Parquet, Avro y otros formatos, incluidas las exportaciones de otras bases de datos. MySQL HeatWave también está disponible para los usuarios de Microsoft Azure como parte de Oracle Database Service for Microsoft Azure.

"MySQL HeatWave ahora puede consultar directamente los datos almacenados en archivos del almacén de objetos. Eso significa que no es necesario procesarlo en MySQL", dijo Screven. "También significa que MySQL HeatWave Lakehouse se convierte en un servicio que puedes utilizar para todos sus datos: dispositivos IoT, archivos de registro, exportaciones de otras bases de datos".

MySQL Autopilot Indexing es otra nueva función que Screven anunció en CloudWorld. Actualmente en disponibilidad limitada, Autopilot Indexing acelera y mejora la indexación utilizando el aprendizaje automático para hacer recomendaciones a la hora de crear y eliminar índices. La indexación automática también genera evaluaciones del impacto en el rendimiento junto con recomendaciones para ayudar a tomar decisiones de ajuste. Otras funciones anunciadas recientemente para MySQL HeatWave son:

  • HeatWave AutoML es compatible con MySQL HeatWave Lakehouse, lo que permite a los clientes aplicar de forma fácil y segura la formación, inferencia y explicación del machine learning a los datos en el almacenamiento de objetos.
  • Mejoras en el sistema de recomendación HeatWave AutoML, que genera recomendaciones personalizadas
  • JavaScript admite la escritura y ejecución de funciones y procedimientos almacenados en MySQL HeatWave
  • Analítica en tiempo real de documentos JSON
  • Funciones adicionales para MySQL Autopilot, como la compresión automática y la ejecución adaptativa de consultas

Ver más artículos de Oracle Connect