HeatWave es un motor de procesamiento de datos en columnas híbridas, en memoria y en paralelo. Implementa algoritmos de última generación para el procesamiento de consultas distribuidas que proporcionan un rendimiento muy elevado.
HeatWave particiona de forma masiva los datos en un cluster de nodos que se pueden utilizar en paralelo. Esto proporciona una excelente escalabilidad internodal. Cada nodo de un cluster y cada núcleo de un nodo puede procesar los datos particionados en paralelo. HeatWave dispone de un programador de consultas inteligente que solapa las tareas de cálculo con las de comunicación de red para lograr un elevadísimo nivel de escalabilidad en miles de núcleos.
El procesamiento de consultas en HeatWave está optimizado para servidores básicos en la nube. Los tamaños de las particiones se han optimizado para adaptarse al caché de las formas subyacentes. El solapamiento de las tareas de cálculo y comunicación se optimiza para el ancho de banda de red disponible. Diversos elementos primitivos del procesamiento analítico utilizan las instrucciones de hardware de las máquinas virtuales subyacentes. HeatWave también está diseñado para ser un motor de procesamiento de datos a escala, optimizado para consultar datos en almacenamiento de objetos.
Oracle HeatWave GenAI proporciona IA generativa integrada, automatizada y segura con modelos de lenguaje de gran tamaño (LLM) en la base de datos; un almacén de vectores automatizado y en la base de datos; procesamiento de vectores a escala; y la capacidad de mantener conversaciones contextuales en lenguaje natural, lo que le permite aprovechar las ventajas de la IA generativa sin conocimientos de IA, movimiento de datos ni costos adicionales.
Utiliza los LLM incorporados en todas las regiones de Oracle Cloud Infrastructure (OCI), OCI Dedicated Region, Oracle Alloy, Amazon Web Services (AWS) y Microsoft Azure y obtén resultados consistentes con un rendimiento predecible en todas las implementaciones. Ayuda a reducir los costos de infraestructura al eliminar la necesidad de aprovisionar GPU.
Accede a modelos básicos previamente entrenados desde Cohere y Meta a través del servicio OCI Generative AI cuando uses HeatWave GenAI en OCI y a través de Amazon Bedrock cuando uses HeatWave GenAI en AWS.
Realiza generación mejorada por recuperación (RAG) en LLM y tus documentos propios en varios formatos alojados en HeatWave Vector Store para obtener respuestas más precisas y contextualmente relevantes, sin mover datos a una base de datos de vectores separada.
Aprovecha el pipeline automatizado para ayudar a descubrir e ingerir documentos propios en HeatWave Vector Store, facilitando a los desarrolladores y analistas sin experiencia en IA el uso del almacenamiento de vectores.
El procesamiento de vector se paraleliza en hasta 512 nodos de cluster HeatWave y se ejecuta a ancho de banda de memoria, ayudando a entregar resultados rápidos con una menor probabilidad de pérdida de precisión.
Ten conversaciones contextuales informadas por tus documentos no estructurados en almacenamiento de objetos usando lenguaje natural. Utiliza el Lakehouse Navigator integrado para ayudar a guiar a los LLM a buscar en conjuntos de datos específicos, ayudándote a reducir costos mientras obtienes resultados más precisos más rápido.
HeatWave MySQL es un servicio de base de datos totalmente gestionado y el único servicio en la nube basado en MySQL Enterprise Edition, con funciones avanzadas de seguridad para cifrado, enmascaramiento de datos, autenticación y un firewall de base de datos. HeatWave mejora el rendimiento de consultas de MySQL por órdenes de magnitud y te permite obtener análisis en tiempo real en tus datos transaccionales en MySQL, sin la complejidad, latencia, riesgos y costos de la duplicación de ETL (extracción, transformación y carga) a una base de datos de análisis separada.
Las consultas analíticas acceden a la información más actualizada, ya que las actualizaciones de las transacciones se replican automáticamente en tiempo real al clúster de análisis de HeatWave. No es necesario indexar los datos antes de ejecutar consultas analíticas. Puedes eliminar el proceso de ETL complejo, que consume mucho tiempo y es costoso, y la integración con una base de datos de análisis separada.
HeatWave Lakehouse permite a los usuarios consultar medio petabyte de datos en almacenamiento de objetos en una variedad de formatos de archivo, como CSV, Parquet, Avro, JSON y archivos de exportación de otras bases de datos. El procesamiento de consultas se realiza completamente en el motor de HeatWave, lo que permite a los clientes aprovechar HeatWave para cargas de trabajo no compatibles con MySQL además de las cargas de trabajo compatibles con MySQL.
Los clientes pueden consultar datos en varios formatos en el almacenamiento de objetos, datos transaccionales en bases de datos MySQL o una combinación de ambos utilizando comandos SQL estándar. La consulta de información en almacenamiento de objetos es tan rápida como la consulta de las bases de datos, como lo demuestra una prueba de referencia TPC-H de 10 TB.
Con HeatWave AutoML, los clientes pueden utilizar datos en el almacenamiento de objetos, la base de datos o ambos para construir, entrenar, implementar y explicar automáticamente modelos de machine learning, sin mover los datos a un servicio de nube ML separado.
La arquitectura particionada de HeatWave permite una arquitectura a escala para HeatWave Lakehouse. Las operaciones de procesamiento de consultas y gestión de la información, como carga/recarga, se escalan de acuerdo al tamaño de los datos. Los clientes pueden consultar hasta medio petabyte de datos en almacenamiento de objetos con HeatWave Lakehouse sin copiarlos a la base de datos MySQL. El cluster de HeatWave se escala a 512 nodos.
Las capacidades de HeatWave Autopilot, como el aprovisionamiento automático, la mejora automática del plan de consulta y la carga paralela automática, se han mejorado para HeatWave Lakehouse, reduciendo aún más la sobrecarga de administración de bases de datos y mejorando el rendimiento. También están disponibles nuevas capacidades de HeatWave Autopilot para HeatWave Lakehouse.
HeatWave AutoML incluye todo lo que los usuarios necesitan para construir, entrenar y explicar modelos de aprendizaje automático dentro de HeatWave, sin costo adicional.
Con el aprendizaje automático en la base de datos en HeatWave, los clientes no necesitan mover datos a un servicio de aprendizaje automático separado. Pueden aplicar fácil y seguramente el entrenamiento, la inferencia y la explicación del machine learning a los datos almacenados tanto dentro de MySQL como en el almacén de objetos con HeatWave Lakehouse. Como resultado, pueden acelerar sus iniciativas de aprendizaje automático, aumentar la seguridad y reducir los costos.
HeatWave AutoML automatiza el ciclo de vida del aprendizaje automático, incluidos la selección de algoritmos, el muestreo inteligente de datos para el entrenamiento de modelos, la selección de funciones y la optimización de hiperparámetros, lo que permite ahorrar mucho tiempo y esfuerzo a los analistas y científicos de datos. Se pueden personalizar los aspectos del pipeline de aprendizaje automático, incluida la selección de algoritmos, la selección de funciones y la optimización de hiperparámetros. HeatWave AutoML soporta tareas del sistema de detección, previsión, clasificación, regresión y recomendación de anomalías, incluidas las columnas de texto. Los usuarios pueden proporcionar comentarios sobre los resultados de la detección de anomalías sin supervisión y utilizar estos datos etiquetados para ayudar a mejorar las predicciones posteriores.
Al considerar tanto la retroalimentación implícita (compras pasadas, comportamiento de navegación, etc.) como la retroalimentación explícita (calificaciones, gustos, etc.), el sistema de recomendación HeatWave AutoML puede personalizar las recomendaciones. Los analistas, por ejemplo, pueden predecir los elementos que a un usuario le gustarán, los usuarios a quienes les gustará un elemento específico y las calificaciones que recibirán los elementos. También pueden, dado un usuario, obtener una lista de usuarios similares y, dado un elemento específico, obtener una lista de elementos similares.
La consola interactiva permite a los analistas de negocios crear, entrenar, ejecutar y explicar modelos de machine learning mediante una interfaz visual, sin usar comandos SQL ni programación. La consola también facilita la exploración de escenarios hipotéticos para evaluar suposiciones comerciales, por ejemplo: "¿Cómo afectaría invertir un 30 % más en publicidad pagada en redes sociales tanto a los ingresos como a las ganancias?".
Todos los modelos entrenados por HeatWave AutoML son explicables. HeatWave AutoML ofrece predicciones con una explicación de los resultados, brindando a las organizaciones conformidad normativa, imparcialidad, repetibilidad, causalidad y confianza.
El modelado de temas ayuda a los usuarios a descubrir perspectivas en grandes conjuntos de datos textuales, ayudándoles a comprender los temas clave de los documentos, por ejemplo, para realizar el análisis de sentimientos en datos de redes sociales. La detección de cambios de datos ayuda a los analistas a determinar cuándo volver a entrenar los modelos mediante la detección de las diferencias entre los datos utilizados para el entrenamiento y los nuevos datos entrantes.
Los desarrolladores y analistas de datos pueden crear modelos de aprendizaje automático utilizando comandos SQL conocidos; no necesitan aprender nuevas herramientas y lenguajes. Además, HeatWave AutoML se integra a cuadernos populares, como Jupyter y Apache Zeppelin.
HeatWave Autopilot proporciona automatización impulsada por aprendizaje automático y consciente de la carga de trabajo. Mejora el rendimiento y la escalabilidad sin necesidad de experiencia en el ajuste de la base de datos, aumenta la productividad de los desarrolladores y administradores de bases de datos, y ayuda a eliminar los errores humanos. HeatWave Autopilot automatiza muchos de los aspectos más importantes y a menudo desafiantes para lograr un alto rendimiento de consultas a escala, incluyendo el aprovisionamiento, la carga de datos, la ejecución de consultas y el manejo de fallos. HeatWave Autopilot está disponible sin costo adicional para los clientes de HeatWave MySQL.
HeatWave Autopilot proporciona numerosas capacidades tanto para HeatWave como para OLTP, incluyendo:
La flexibilidad en tiempo real permite a los clientes aumentar o reducir el tamaño de su cluster de HeatWave en cualquier número de nodos sin que ello implique ningún tiempo de inactividad o de solo lectura.
La operación de cambio de tamaño tarda solo unos minutos, durante los cuales HeatWave permanece en línea, disponible para todas las operaciones. Una vez que se cambia el tamaño, los datos se descargan del almacenamiento de objetos, se vuelven a equilibrar automáticamente entre todos los nodos de cluster disponibles y están disponibles inmediatamente para consultas. Como resultado, los clientes disfrutan de un rendimiento siempre elevado, incluso a horas punta, y de menores costos, ya que pueden reducir el tamaño de su cluster de HeatWave cuando corresponda, sin que ello implique ningún tiempo de inactividad o de solo lectura.
Gracias a la eficaz recarga de datos desde el almacenamiento de objetos, los clientes también pueden pausar y reanudar su clúster HeatWave para reducir los costos.
Los clientes pueden ampliar o reducir su cluster de HeatWave a cualquier número de nodos. No tienen por qué aceptar instancias sobreaprovisionadas y costosas obligatorias con los modelos de tamaño rígido de otros proveedores de bases de datos en la nube. Con HeatWave, los clientes solo pagan exactamente por los recursos que utilizan.
Puedes desplegar HeatWave en OCI, AWS o Azure. Puedes replicar datos de aplicaciones OLTP locales a HeatWave para obtener análisis casi en tiempo real y procesar datos de vectores en la nube. También puedes usar HeatWave en tu centro de datos con OCI Dedicated Region.
HeatWave en AWS ofrece una experiencia nativa para los clientes de AWS. La consola, el plano de control y el plano de datos residen en AWS.