Los modelos disponibles de Cohere y Meta para OCI Generative AI incluyen
Con los clústeres de IA dedicados, puedes alojar modelos básicos en GPU dedicadas privadas. Estos clusters proporcionan un rendimiento estable y de alto rendimiento necesario para los casos de uso de producción y pueden soportar cargas de trabajo de alojamiento y ajuste. OCI Generative AI te permite escalar horizontalmente tu clúster sin tiempo de inactividad para que puedas gestionar con eficacia las variaciones de volumen.
La experiencia de chat proporciona una interfaz lista para usar con los modelos Cohere y Meta, donde los usuarios pueden hacer preguntas y obtener respuestas conversacionales a través de la consola o API de OCI.
OCI Generative AI está integrado con LangChain, un marco de código abierto que se puede utilizar para desarrollar nuevas interfaces para aplicaciones de IA generativa basadas en modelos de lenguaje. LangChain facilita el intercambio de abstracciones y componentes necesarios para trabajar con modelos de lenguaje.
Utiliza LlamaIndex, un marco de código abierto para crear aplicaciones aumentadas por contexto, con OCI Generative AI para crear fácilmente soluciones o agentes de RAG. Lleva tus soluciones desde el prototipo a la producción con fuentes de datos personalizadas y herramientas flexibles.
OCI Generative AI proporciona controles de moderación de contenidos, cambios de modelos de punto final sin tiempo de inactividad y capacidades de desactivación y activación de puntos finales. Para cada punto final de modelo, OCI Generative AI captura una serie de análisis, incluidas estadísticas de llamadas, tokens procesados y recuentos de errores.
Al incorporar funciones creadas con OCI Generative AI directamente en Oracle Cloud Applications, facilitamos a los clientes el acceso instantáneo a ellas sin integraciones complejas.