Les modèles de base peuvent être consommés à la demande. Vous payez alors par caractère en fonction de la longueur de l'invite et de la réponse du modèle (sauf pour les modèles d'intégration, pour lesquels la réponse du modèle n'est pas prise en compte). Dans le tableau ci-dessous, une transaction = un caractère et 10 000 transactions = 10 000 caractères.
En outre, vous pouvez héberger des répliques privées de modèles de base et créer des modèles affinés sur des clusters d'IA dédiés. Il existe deux types de clusters d'IA dédiés : l'hébergement et le réglage fin. Vous créez un cluster d'hébergement en lui affectant des unités d'IA en fonction du modèle que vous souhaitez héberger et du volume d'appels attendu pour le modèle. Les clusters à réglage fin nécessitent deux unités d'IA du modèle spécifique que vous souhaitez affiner. Une fois que vous avez créé un modèle affiné dans un cluster affiné, vous pouvez l'héberger sur votre cluster d'hébergement.
Les clusters d'IA dédiés nécessitent un engagement minimal de 744 unités-heures (par cluster) pour les modèles d'hébergement. Les clusters à réglage fin nécessitent un minimum de 1 unité-heure.
Produit |
Prix pour la comparaison (/vCPU) * |
Prix unitaire |
Unité |
Oracle Cloud Infrastructure Generative AI- Large Cohere |
10 000 transactions |
||
Oracle Cloud Infrastructure Generative AI- Small Cohere |
10 000 transactions |
||
Oracle Cloud Infrastructure Generative AI- Embed Cohere |
10 000 transactions |
||
Oracle Cloud Infrastructure Generative AI - Large Meta |
10 000 transactions |
||
Oracle Cloud Infrastructure Generative AI- Large Cohere - Dédié |
Unité d'IA par heure |
||
Oracle Cloud Infrastructure Generative AI- Small Cohere - Dédié |
Unité d'IA par heure |
||
Oracle Cloud Infrastructure Generative AI- Embed Cohere - Dédié |
Unité d'IA par heure |
||
Oracle Cloud Infrastructure Generative AI- Large Meta - Dédié |
Unité d'IA par heure |