Preços do Generative AI Service

 

Os modelos básicos podem ser consumidos sob demanda, em que você paga por caractere, dependendo da duração do prompt e da resposta do modelo (exceto para aqueles incorporados, no qual a respectiva resposta não é levada em conta). Na tabela abaixo: uma transação = um caractere e 10.000 transações = 10.000 caracteres.

Além disso, você pode hospedar suas próprias réplicas de modelos básicos e criar modelos com ajuste fino em clusters de IA dedicados. Os clusters de IA dedicados são oferecidos em dois tipos: hospedagem e ajuste fino. Você cria um cluster de hospedagem atribuindo unidades de IA a ele de acordo com o modelo que deseja hospedar e o volume de chamadas esperado do modelo. Os clusters de ajuste fino exigem duas unidades de IA do modelo específico que deseja ajustar. Depois de criar um modelo ajustado em um cluster de ajuste fino, é possível hospedá-lo no cluster de hospedagem.

Os clusters dedicados de IA exigem um mínimo de 744 unidades-hora (por cluster) para hospedar modelos. O ajuste fino dos clusters requer pelo menos 1 unidade-hora.

  • Uma transação é um caractere. 10.000 transações = 10.000 caracteres

IA Generativa da OCI

Produto
Preço de comparação (/vCPU) *
Preço unitário
Unidade
Oracle Cloud Infrastructure Generative AI- Cohere Grande


10.000 transações
Oracle Cloud Infrastructure Generative AI- Cohere Pequeno


10.000 transações
Oracle Cloud Infrastructure Generative AI- Cohere Integrado


10.000 transações
Oracle Cloud Infrastructure Generative AI – Meta Grande


10.000 transações
Oracle Cloud Infrastructure Generative AI - Meta Llama 3.1 405B


10.000 transações
Oracle Cloud Infrastructure Generative AI- Cohere Grande - Dedicado


Unidade de IA por hora
Oracle Cloud Infrastructure Generative AI- Cohere Pequeno - Dedicado


Unidade de IA por hora
Oracle Cloud Infrastructure Generative AI- Cohere Integrado - Dedicado


Unidade de IA por hora
Oracle Cloud Infrastructure Generative AI – Meta Grande – Dedicado


Unidade de IA por hora

OCI Generative AI Agents

Serviço
Preço de comparação (/vCPU) *
Preço unitário
Unidade
Oracle Cloud Infrastructure Generative AI Agents - Geração aumentada de recuperação (RAG)


10.000 transações
Oracle Cloud Infrastructure Generative AI Agents - Armazenamento da base de conhecimento


Armazenamento em gigabytes por hora
Oracle Cloud Infrastructure Generative AI Agents - Ingestão de dados


10.000 transações
Oracle Chatbot
Disconnected