Oracle HeatWave GenAI proporciona IA generativa integrada, automatizada y segura con modelos de lenguaje de gran tamaño (LLM) en la base de datos; un almacén de vectores automatizado y en la base de datos; procesamiento de vectores a escala; y la capacidad de mantener conversaciones contextuales en lenguaje natural, lo que le permite aprovechar las ventajas de la IA generativa sin conocimientos de IA, movimiento de datos ni costos adicionales.
Entre las características clave de HeatWave GenAI se incluyen:
Las versiones cuantificadas de los siguientes LLM en la base de datos están disponibles actualmente en HeatWave:
Puedes crear un almacén de vectores para contenido no estructurado de empresa con un único comando SQL. Todos los pasos para crear un almacén de vectores e incrustaciones de vectores se automatizan y ejecutan dentro de la base de datos, incluido el descubrimiento de los documentos en el almacenamiento de objetos, el análisis de ellos, la generación de incrustaciones de una manera altamente paralela y optimizada, y la inserción en el almacén de vectores, lo que hace que HeatWave Vector Store resulte eficiente y fácil de usar.
HeatWave se ejecuta en hardware básico. Los LLM en la base de datos no se ejecutan en GPU; se ejecutan en CPU. De esta forma, puedes reducir costos y no tienes que preocuparte por la disponibilidad de LLM en varios centros de datos.
Cuando se utilizan LLM en la base de datos y un almacén de vectores en la base de datos, la información no debe salir de la base de datos, lo que ayuda a aumentar la seguridad.
Sí, HeatWave GenAI está disponible de forma nativa en AWS, junto con otras funciones de HeatWave, incluidas HeatWave MySQL, HeatWave Lakehouse, HeatWave AutoML y HeatWave Autopilot.
Sí, se pueden generar incrustaciones para datos de texto en 27 idiomas.
Los prompts se pueden emitir en inglés. Los prompts emitidos en otros idiomas, como español o alemán, se pueden traducir al inglés.
No, la búsqueda vectorial se realiza en el clúster de HeatWave.
HeatWave se ejecuta en un nodo MySQL. Recomendamos un nodo MySQL con una unidad MySQL.32, además de nodos HeatWave que utilicen la unidad HeatWave.512 GB para entornos de producción. Para el desarrollo/prueba, se puede utilizar una unidad MySQL más pequeña. Puedes consultar las unidades MySQL admitidas aquí. Para HeatWave GenAI, no se admite la unidad HeatWave.32 GB.
PDF, texto, PowerPoint, Word y HTML son los formatos admitidos.
No hay ningún costo adicional más allá del costo del clúster HeatWave, necesario para utilizar HeatWave GenAI. Puedes invocar LLM en la base de datos e incrustar modelos proporcionados con HeatWave GenAI sin cargo adicional. También puedes invocar LLM externos disponibles a través de OCI Generative AI en Oracle Cloud Infrastructure y Amazon Bedrock en AWS y se cobrará el importe de esos servicios.
No, los LLM son modelos preentrenados. Tus datos no se utilizan para entrenar LLM.
No, los LLM en la base de datos proporcionados con HeatWave no se pueden ajustar.
No, no puedes traer tus propios LLM ni incrustar modelos. Sin embargo, puedes invocar los LLM externos o modelos incrustados disponibles a través de OCI Generative AI al ejecutar HeatWave GenAI en Oracle Cloud Infrastructure y a través de Amazon Bedrock al ejecutar HeatWave GenAI en AWS.
Según nuestras pruebas, los resultados son similares a los que ofrecen los LLM no cuantificados para casos de uso que dependen de HeatWave Vector Store. Puedes comprobar fácilmente los modelos para evaluar el rendimiento y la calidad de los resultados.
Solo necesitas generar incrustaciones una vez y se almacenarán en HeatWave Vector Store. Los cambios en documentos no estructurados en el almacén de objetos activarán automáticamente actualizaciones para las incrustaciones de vectores asociadas.
Sí, el soporte de reconocimiento óptico de caracteres permite a HeatWave Vector Store convertir contenido escaneado guardado como imágenes en datos de texto que se pueden analizar, por ejemplo, para realizar búsquedas de similitudes.