Características de HeatWave

HeatWave

HeatWave es un motor de procesamiento de datos en columnas híbridas, en memoria y en paralelo. Implementa algoritmos de última generación para el procesamiento de consultas distribuidas que proporcionan un rendimiento muy elevado.

Diseñado para ofrecer una escala y un rendimiento masivos

HeatWave particiona de forma masiva los datos en un cluster de nodos que se pueden utilizar en paralelo. Esto proporciona una excelente escalabilidad internodal. Cada nodo de un cluster y cada núcleo de un nodo puede procesar los datos particionados en paralelo. HeatWave dispone de un programador de consultas inteligente que solapa las tareas de cálculo con las de comunicación de red para lograr un elevadísimo nivel de escalabilidad en miles de núcleos.

Optimizado para la nube y los datos en almacenamiento de objetos

El procesamiento de consultas en HeatWave está optimizado para servidores básicos en la nube. Los tamaños de las particiones se han optimizado para adaptarse al caché de las formas subyacentes. El solapamiento de las tareas de cálculo y comunicación se optimiza para el ancho de banda de red disponible. Diversos elementos primitivos del procesamiento analítico utilizan las instrucciones de hardware de las máquinas virtuales subyacentes. HeatWave también está diseñado para ser un motor de procesamiento de datos a escala, optimizado para consultar datos en almacenamiento de objetos.


HeatWave GenAI

Oracle HeatWave GenAI proporciona IA generativa integrada, automatizada y segura con modelos de lenguaje de gran tamaño (LLM) en la base de datos; un almacén de vectores automatizado y en la base de datos; procesamiento de vectores a escala; y la capacidad de mantener conversaciones contextuales en lenguaje natural, lo que le permite aprovechar las ventajas de la IA generativa sin conocimientos de IA, movimiento de datos ni costos adicionales.

LLM en la base de datos

Utiliza los LLM incorporados en todas las regiones de Oracle Cloud Infrastructure (OCI), OCI Dedicated Region, Oracle Alloy, Amazon Web Services (AWS) y Microsoft Azure y obtén resultados consistentes con un rendimiento predecible en todas las implementaciones. Ayuda a reducir los costos de infraestructura al eliminar la necesidad de aprovisionar GPU.

Integración con OCI Generative AI y Amazon Bedrock

Accede a modelos básicos previamente entrenados desde Cohere y Meta a través del servicio OCI Generative AI cuando uses HeatWave GenAI en OCI y a través de Amazon Bedrock cuando uses HeatWave GenAI en AWS.

Almacenamiento de vectores en la base de datos

Realiza generación mejorada por recuperación (RAG) en LLM y tus documentos propios en varios formatos alojados en HeatWave Vector Store para obtener respuestas más precisas y contextualmente relevantes, sin mover datos a una base de datos de vectores separada.

Generación automatizada de embeddings

Aprovecha el pipeline automatizado para ayudar a descubrir e ingerir documentos propios en HeatWave Vector Store, facilitando a los desarrolladores y analistas sin experiencia en IA el uso del almacenamiento de vectores.

Procesamiento de vectores a escala

El procesamiento de vector se paraleliza en hasta 512 nodos de cluster HeatWave y se ejecuta a ancho de banda de memoria, ayudando a entregar resultados rápidos con una menor probabilidad de pérdida de precisión.

HeatWave Chat

Ten conversaciones contextuales informadas por tus documentos no estructurados en almacenamiento de objetos usando lenguaje natural. Utiliza el Lakehouse Navigator integrado para ayudar a guiar a los LLM a buscar en conjuntos de datos específicos, ayudándote a reducir costos mientras obtienes resultados más precisos más rápido.

Más información sobre HeatWave GenAI


HeatWave MySQL

HeatWave MySQL es un servicio de base de datos totalmente gestionado y el único servicio en la nube basado en MySQL Enterprise Edition, con funciones avanzadas de seguridad para cifrado, enmascaramiento de datos, autenticación y un firewall de base de datos. HeatWave mejora el rendimiento de consultas de MySQL por órdenes de magnitud y te permite obtener análisis en tiempo real en tus datos transaccionales en MySQL, sin la complejidad, latencia, riesgos y costos de la duplicación de ETL (extracción, transformación y carga) a una base de datos de análisis separada.

Análisis en tiempo real sin ETL

Las consultas analíticas acceden a la información más actualizada, ya que las actualizaciones de las transacciones se replican automáticamente en tiempo real al clúster de análisis de HeatWave. No es necesario indexar los datos antes de ejecutar consultas analíticas. Puedes eliminar el proceso de ETL complejo, que consume mucho tiempo y es costoso, y la integración con una base de datos de análisis separada.

Más información sobre HeatWave MySQL


HeatWave Lakehouse

HeatWave Lakehouse permite a los usuarios consultar medio petabyte de datos en almacenamiento de objetos en una variedad de formatos de archivo, como CSV, Parquet, Avro, JSON y archivos de exportación de otras bases de datos. El procesamiento de consultas se realiza completamente en el motor de HeatWave, lo que permite a los clientes aprovechar HeatWave para cargas de trabajo no compatibles con MySQL además de las cargas de trabajo compatibles con MySQL.

Analítica de lakehouse y machine learning en todos los datos

Los clientes pueden consultar datos en varios formatos en el almacenamiento de objetos, datos transaccionales en bases de datos MySQL o una combinación de ambos utilizando comandos SQL estándar. La consulta de información en almacenamiento de objetos es tan rápida como la consulta de las bases de datos, como lo demuestra una prueba de referencia TPC-H de 10 TB.

Con HeatWave AutoML, los clientes pueden utilizar datos en el almacenamiento de objetos, la base de datos o ambos para construir, entrenar, implementar y explicar automáticamente modelos de machine learning, sin mover los datos a un servicio de nube ML separado.

Arquitectura con escalabilidad horizontal para la gestión de datos y el procesamiento de consultas.

La arquitectura particionada de HeatWave permite una arquitectura a escala para HeatWave Lakehouse. Las operaciones de procesamiento de consultas y gestión de la información, como carga/recarga, se escalan de acuerdo al tamaño de los datos. Los clientes pueden consultar hasta medio petabyte de datos en almacenamiento de objetos con HeatWave Lakehouse sin copiarlos a la base de datos MySQL. El cluster de HeatWave se escala a 512 nodos.

Aumente el rendimiento y ahorra tiempo con la automatización basada en aprendizaje automático

Las capacidades de HeatWave Autopilot, como el aprovisionamiento automático, la mejora automática del plan de consulta y la carga paralela automática, se han mejorado para HeatWave Lakehouse, reduciendo aún más la sobrecarga de administración de bases de datos y mejorando el rendimiento. También están disponibles nuevas capacidades de HeatWave Autopilot para HeatWave Lakehouse.

  • La inferencia automática de esquema infiere automáticamente la asignación de datos de archivos a la definición de esquema correspondiente para todos los tipos de archivo compatibles, incluidos los archivos CSV. Como resultado, los clientes no necesitan definir y actualizar manualmente la asignación de esquema de los archivos, lo que ahorra tiempo y esfuerzo.
  • Muestreo de datos adaptativo muestrea inteligentemente los archivos en almacenamiento de objetos para derivar información utilizada por HeatWave Autopilot para hacer predicciones para la automatización. Usando el muestreo de datos adaptativo, HeatWave Autopilot puede escanear y hacer predicciones, como el mapeo de esquemas en un archivo de 400 TB en menos de un minuto.
  • El flujo de datos adaptativo permite que HeatWave Lakehouse se adapte dinámicamente al rendimiento del almacenamiento de objetos subyacente en cualquier región para mejorar el rendimiento general, la relación precio-rendimiento y la disponibilidad.

Más información sobre HeatWave Lakehouse


HeatWave AutoML

HeatWave AutoML incluye todo lo que los usuarios necesitan para construir, entrenar y explicar modelos de aprendizaje automático dentro de HeatWave, sin costo adicional.

No es necesario un servicio de aprendizaje automático independiente.

Con el aprendizaje automático en la base de datos en HeatWave, los clientes no necesitan mover datos a un servicio de aprendizaje automático separado. Pueden aplicar fácil y seguramente el entrenamiento, la inferencia y la explicación del machine learning a los datos almacenados tanto dentro de MySQL como en el almacén de objetos con HeatWave Lakehouse. Como resultado, pueden acelerar sus iniciativas de aprendizaje automático, aumentar la seguridad y reducir los costos.

La automatización del ciclo de vida del aprendizaje automático ahorra tiempo y esfuerzo

HeatWave AutoML automatiza el ciclo de vida del aprendizaje automático, incluidos la selección de algoritmos, el muestreo inteligente de datos para el entrenamiento de modelos, la selección de funciones y la optimización de hiperparámetros, lo que permite ahorrar mucho tiempo y esfuerzo a los analistas y científicos de datos. Se pueden personalizar los aspectos del pipeline de aprendizaje automático, incluida la selección de algoritmos, la selección de funciones y la optimización de hiperparámetros. HeatWave AutoML soporta tareas del sistema de detección, previsión, clasificación, regresión y recomendación de anomalías, incluidas las columnas de texto. Los usuarios pueden proporcionar comentarios sobre los resultados de la detección de anomalías sin supervisión y utilizar estos datos etiquetados para ayudar a mejorar las predicciones posteriores.

Sistema para personalización de recomendaciones

Al considerar tanto la retroalimentación implícita (compras pasadas, comportamiento de navegación, etc.) como la retroalimentación explícita (calificaciones, gustos, etc.), el sistema de recomendación HeatWave AutoML puede personalizar las recomendaciones. Los analistas, por ejemplo, pueden predecir los elementos que a un usuario le gustarán, los usuarios a quienes les gustará un elemento específico y las calificaciones que recibirán los elementos. También pueden, dado un usuario, obtener una lista de usuarios similares y, dado un elemento específico, obtener una lista de elementos similares.

Consola interactiva HeatWave AutoML

La consola interactiva permite a los analistas de negocios crear, entrenar, ejecutar y explicar modelos de machine learning mediante una interfaz visual, sin usar comandos SQL ni programación. La consola también facilita la exploración de escenarios hipotéticos para evaluar suposiciones comerciales, por ejemplo: "¿Cómo afectaría invertir un 30 % más en publicidad pagada en redes sociales tanto a los ingresos como a las ganancias?".

Modelos de aprendizaje automático explicables

Todos los modelos entrenados por HeatWave AutoML son explicables. HeatWave AutoML ofrece predicciones con una explicación de los resultados, brindando a las organizaciones conformidad normativa, imparcialidad, repetibilidad, causalidad y confianza.

Modelado de temas y detección de cambios de datos

El modelado de temas ayuda a los usuarios a descubrir perspectivas en grandes conjuntos de datos textuales, ayudándoles a comprender los temas clave de los documentos, por ejemplo, para realizar el análisis de sentimientos en datos de redes sociales. La detección de cambios de datos ayuda a los analistas a determinar cuándo volver a entrenar los modelos mediante la detección de las diferencias entre los datos utilizados para el entrenamiento y los nuevos datos entrantes.

Utiliza tus aptitudes actuales

Los desarrolladores y analistas de datos pueden crear modelos de aprendizaje automático utilizando comandos SQL conocidos; no necesitan aprender nuevas herramientas y lenguajes. Además, HeatWave AutoML se integra a cuadernos populares, como Jupyter y Apache Zeppelin.


HeatWave Autopilot

HeatWave Autopilot proporciona automatización impulsada por aprendizaje automático y consciente de la carga de trabajo. Mejora el rendimiento y la escalabilidad sin necesidad de experiencia en el ajuste de la base de datos, aumenta la productividad de los desarrolladores y administradores de bases de datos, y ayuda a eliminar los errores humanos. HeatWave Autopilot automatiza muchos de los aspectos más importantes y a menudo desafiantes para lograr un alto rendimiento de consultas a escala, incluyendo el aprovisionamiento, la carga de datos, la ejecución de consultas y el manejo de fallos. HeatWave Autopilot está disponible sin costo adicional para los clientes de HeatWave MySQL.

HeatWave Autopilot proporciona numerosas capacidades tanto para HeatWave como para OLTP, incluyendo:

  • El aprovisionamiento automático predice el número de nodos de HeatWave necesarios para ejecutar una carga de trabajo mediante un muestreo adaptativo de los datos de tabla en los que es necesario realizar el análisis. Esto significa que los desarrolladores y administradores de bases de datos (DBA) ya no necesitan calcular manualmente el tamaño óptimo de su cluster.
  • El pool de threads automático permite al servicio de base de datos procesar más transacciones para una configuración de hardware determinada, lo que ofrece un mayor rendimiento para las cargas de trabajo OLTP y evita que se caiga en periodos de altos niveles de transacciones y simultaneidad.
  • La función de predicción de unidad automática supervisa continuamente la carga de trabajo de OLTP, incluido el rendimiento y la tasa de aciertos del pool de buffers, para recomendar la unidad de procesamiento correcta en cada momento. De esta forma, los clientes disfrutan continuamente de la mejor relación entre precio y rendimiento.
  • La codificación automática determina la representación óptima de las columnas que se cargan en HeatWave, teniendo en cuenta las consultas. Esta representación óptima proporciona el mejor rendimiento por consulta y minimiza el tamaño del cluster para reducir los costos.
  • La mejora del plan de consulta automática asimila diversas estadísticas de la ejecución de consultas y optimiza el plan de ejecución de consultas futuras. Así, el rendimiento del sistema se incrementa a medida que se ejecutan más consultas.
  • La optimización de consulta adaptativa utiliza diversas estadísticas para ajustar las estructuras de datos y los recursos del sistema después de que la ejecución de la consulta ha comenzado, optimizando independientemente la ejecución de la consulta para cada nodo según la distribución de datos real en tiempo de ejecución. Esto ayuda a mejorar el rendimiento de las consultas ad hoc hasta en un 25 %.
  • La ubicación automática de datos predice la columna en la que se deben particionar las tablas en memoria para que las consultas ofrezcan el mejor rendimiento. También predice la mejora esperada en el rendimiento de las consultas con la nueva recomendación de columnas. De esta forma, se reduce al mínimo la necesidad de mover datos de unos nodos a otros motivada por decisiones subóptimas que puedan tomar los operadores al seleccionar la columna.
  • La compresión automática determina el algoritmo de compresión óptimo para cada columna, lo que mejora el rendimiento de carga y consulta con una compresión y descompresión de datos más rápidas. Al reducir el uso de memoria, los clientes pueden disminuir los costos hasta en un 25 %.
  • La indexación determina automáticamente los índices que los clientes deben crear o borrar de sus tablas para optimizar el desempeño de OLTP, utilizando el aprendizaje automático para realizar una predicción basada en cargas de trabajo de las aplicaciones individuales. Esto ayuda a los clientes a eliminar las tediosas tareas de crear índices ideales para sus cargas de trabajo OLTP y mantenerlos a lo largo del tiempo a medida que evolucionan las cargas de trabajo.

Flexibilidad en tiempo real

La flexibilidad en tiempo real permite a los clientes aumentar o reducir el tamaño de su cluster de HeatWave en cualquier número de nodos sin que ello implique ningún tiempo de inactividad o de solo lectura.

Alto rendimiento uniforme, incluso en horas punta, y reducción de costos sin tiempo de inactividad

La operación de cambio de tamaño tarda solo unos minutos, durante los cuales HeatWave permanece en línea, disponible para todas las operaciones. Una vez que se cambia el tamaño, los datos se descargan del almacenamiento de objetos, se vuelven a equilibrar automáticamente entre todos los nodos de cluster disponibles y están disponibles inmediatamente para consultas. Como resultado, los clientes disfrutan de un rendimiento siempre elevado, incluso a horas punta, y de menores costos, ya que pueden reducir el tamaño de su cluster de HeatWave cuando corresponda, sin que ello implique ningún tiempo de inactividad o de solo lectura.

Gracias a la eficaz recarga de datos desde el almacenamiento de objetos, los clientes también pueden pausar y reanudar su clúster HeatWave para reducir los costos.

Ninguna instancia sobreaprovisionada

Los clientes pueden ampliar o reducir su cluster de HeatWave a cualquier número de nodos. No tienen por qué aceptar instancias sobreaprovisionadas y costosas obligatorias con los modelos de tamaño rígido de otros proveedores de bases de datos en la nube. Con HeatWave, los clientes solo pagan exactamente por los recursos que utilizan.


Disponible en nubes públicas y en tu centro de datos

Puedes desplegar HeatWave en OCI, AWS o Azure. Puedes replicar datos de aplicaciones OLTP locales a HeatWave para obtener análisis casi en tiempo real y procesar datos de vectores en la nube. También puedes usar HeatWave en tu centro de datos con OCI Dedicated Region.

HeatWave en AWS ofrece una experiencia nativa para los clientes de AWS. La consola, el plano de control y el plano de datos residen en AWS.