Servicio de IA generativa | Oracle


Los modelos básicos se pueden consumir bajo demanda, donde se paga por carácter en función de la longitud de la petición de datos y la respuesta del modelo (excepto los modelos de inserción, donde la respuesta del modelo no se contabiliza). En la siguiente tabla, una transacción = un carácter y 10 000 transacciones = 10 000 caracteres.

Además, puede alojar réplicas privadas de modelos fundamentales y crear modelos ajustados en clústeres de IA dedicados. Los clústeres de IA dedicados se presentan en dos tipos: alojamiento y ajuste. Puedes crear un clúster de alojamiento asignándole unidades IA según el modelo que deseas alojar y el volumen de llamadas esperado al modelo. Los clústeres de ajuste necesitan dos unidades IA del modelo específico que desea ajustar. Una vez que hayas creado un modelo ajustado en un clúster de ajuste, puedes alojarlo en el clúster de alojamiento.

Los clústeres de IA dedicados requieren un compromiso mínimo de 744 horas unitarias (por clúster) para los modelos de alojamiento. Los clústeres de ajuste requieren un mínimo de 1 unidad-hora.

  • Una transacción es un carácter. 10.000 transacciones = 10.000 caracteres

IA generativa en OCI

Producto
Precio de comparación (/vCPU) *
Precio unitario
Unidad
Oracle Cloud Infrastructure Generative AI - Large Cohere - 10 000 transacciones


Oracle Cloud Infrastructure Generative AI - Small Cohere - 10 000 transacciones


Oracle Cloud Infrastructure Generative AI - Embed Cohere - 10 000 transacciones


Oracle Cloud Infrastructure Generative AI - Large Meta


10 000 transacciones
Oracle Cloud Infrastructure Generative AI - Meta Llama 3.1 405B


10 000 transacciones
Oracle Cloud Infrastructure Generative AI - Large Cohere - Dedicado - Unidad de IA por hora


Oracle Cloud Infrastructure Generative AI - Small Cohere - Dedicado - Unidad de IA por hora


Oracle Cloud Infrastructure Generative AI - Embed Cohere - Dedicado - Unidad de IA por hora


Oracle Cloud Infrastructure Generative AI - Large Cohere - Dedicado


Unidad de IA por hora

Agentes de IA generativa de OCI

Servicio
Precio de comparación (/vCPU) *
Precio unitario
Unidad
Agentes de Oracle Cloud Infrastructure Generative AI - Generación con recuperación aumentada (RAG)


10 000 transacciones
Agentes de Oracle Cloud Infrastructure Generative AI - Almacenamiento de la base de conocimientos


Almacenamiento a gigabytes por hora
Agentes de Oracle Cloud Infrastructure Generative AI - Ingesta de datos


10 000 transacciones