Os modelos básicos podem ser consumidos sob demanda, em que você paga por caractere, dependendo da duração do prompt e da resposta do modelo (exceto para aqueles incorporados, no qual a respectiva resposta não é levada em conta). Na tabela abaixo: uma transação = um caractere e 10.000 transações = 10.000 caracteres.
Além disso, você pode hospedar suas próprias réplicas de modelos básicos e criar modelos com ajuste fino em clusters de IA dedicados. Os clusters de IA dedicados são oferecidos em dois tipos: hospedagem e ajuste fino. Você cria um cluster de hospedagem atribuindo unidades de IA a ele de acordo com o modelo que deseja hospedar e o volume de chamadas esperado do modelo. Os clusters de ajuste fino exigem duas unidades de IA do modelo específico que deseja ajustar. Depois de criar um modelo ajustado em um cluster de ajuste fino, é possível hospedá-lo no cluster de hospedagem.
Os clusters dedicados de IA exigem um mínimo de 744 unidades-hora (por cluster) para hospedar modelos. O ajuste fino dos clusters requer pelo menos 1 unidade-hora.
Produto |
Preço de comparação (/vCPU) * |
Preço unitário |
Unidade |
Oracle Cloud Infrastructure Generative AI- Cohere Grande |
10.000 transações |
||
Oracle Cloud Infrastructure Generative AI- Cohere Pequeno |
10.000 transações |
||
Oracle Cloud Infrastructure Generative AI- Cohere Integrado |
10.000 transações |
||
Oracle Cloud Infrastructure Generative AI – Meta Grande |
10.000 transações |
||
Oracle Cloud Infrastructure Generative AI - Meta Llama 3.1 405B |
10.000 transações |
||
Oracle Cloud Infrastructure Generative AI- Cohere Grande - Dedicado |
Unidade de IA por hora |
||
Oracle Cloud Infrastructure Generative AI- Cohere Pequeno - Dedicado |
Unidade de IA por hora |
||
Oracle Cloud Infrastructure Generative AI- Cohere Integrado - Dedicado |
Unidade de IA por hora |
||
Oracle Cloud Infrastructure Generative AI – Meta Grande – Dedicado |
Unidade de IA por hora |
Serviço |
Preço de comparação (/vCPU) * |
Preço unitário |
Unidade |
Oracle Cloud Infrastructure Generative AI Agents - Geração aumentada de recuperação (RAG) |
10.000 transações |
||
Oracle Cloud Infrastructure Generative AI Agents - Armazenamento da base de conhecimento |
Armazenamento em gigabytes por hora |
||
Oracle Cloud Infrastructure Generative AI Agents - Ingestão de dados |
10.000 transações |