I modelli di base possono essere consumati on demand, pagando per carattere in base alla lunghezza del prompt e alla risposta del modello (ad eccezione dei modelli di incorporamento, in cui la risposta del modello non è contabilizzata). Nella tabella seguente, una transazione = un carattere e 10.000 transazioni = 10.000 caratteri.
Inoltre, puoi ospitare repliche private di modelli fondamentali e creare modelli ottimizzati su cluster AI dedicati. Sono disponibili due tipi di cluster AI dedicati: hosting e fine tuning. Puoi creare un cluster di hosting assegnandogli unità AI in base al modello che si desidera ospitare e al volume di chiamate previsto per il modello. I cluster di fine tuning richiedono due unità AI del modello specifico che si desidera ottimizzare. Dopo aver creato un modello ottimizzato in un cluster di ottimizzazione, è possibile ospitarlo nel cluster di hosting.
I cluster AI dedicati richiedono un impegno minimo di 744 ore/unità (per cluster) per i modelli di hosting. I cluster di fine tuning richiedono un minimo di 1 unità/ora.
Prodotto |
Confronta i prezzi (/vCPU) * |
Prezzo unitario |
Unità |
Oracle Cloud Infrastructure Generative AI - Large Cohere - 10.000 transazioni |
|||
Oracle Cloud Infrastructure Generative AI - Small Cohere - 10.000 transazioni |
|||
Oracle Cloud Infrastructure Generative AI - Embed Cohere - 10.000 transazioni |
|||
Oracle Cloud Infrastructure Generative AI - Large Meta |
10.000 transazioni |
||
Oracle Cloud Infrastructure Generative AI - Meta Llama 3.1 405B |
10.000 transazioni |
||
Oracle Cloud Infrastructure Generative AI - Large Cohere - Dedicated - Unità AI all'ora |
|||
Oracle Cloud Infrastructure Generative AI - Small Cohere - Dedicated - Unità AI all'ora |
|||
Oracle Cloud Infrastructure Generative AI - Embed Cohere - Dedicated - Unità AI all'ora |
|||
Oracle Cloud Infrastructure Generative AI- Large Meta - Dedicated |
Unità AI all'ora |
Servizio |
Confronta i prezzi (/vCPU) * |
Prezzo unitario |
Unità |
Oracle Cloud Infrastructure Generative AI Agents - Retrieval-Augmented Generation (RAG) |
10.000 transazioni |
||
Oracle Cloud Infrastructure Generative AI Agents - Knowledge Base Storage |
Gigabyte di storage all'ora |
||
Oracle Cloud Infrastructure Generative AI Agents - Ingestione dati |
10.000 transazioni |