基本モデルはオンデマンドで使用でき、プロンプトの長さとモデルからの応答(モデルからの応答が考慮されない埋込みモデルを除く)に基づく文字単位の支払いになっています。以下の表では、1トランザクションは1文字、10,000トランザクションは10,000文字です。
また、基本モデルのプライベート・レプリカをホストしたり、専用のAIクラスタ上で微調整されたモデルを作成したりすることができます。専用のAIクラスタは、ホスティングとファインチューニングの2つのタイプがあります。ホスティング・クラスタを作成するには、ホストするモデルと、そのモデルに対して想定されるコール量に基づいてAIユニットを割り当てます。ファインチューニング・クラスタには、微調整する特定のモデルのAIユニットが2つ必要です。ファインチューニング・クラスタで微調整されたモデルを作成したら、そのモデルをホスティング・クラスタでホストできます。
専用のAIクラスタでは、モデルをホスティングするために最低744単位時間(クラスタ当たり)のコミットメントが必要です。ファインチューニング・クラスタの場合は、最低1単位時間が必要です。
製品 |
比較価格(/vCPU)* |
単価 |
単位 |
Oracle Cloud Infrastructure生成AI - 大Cohere |
10,000トランザクション |
||
Oracle Cloud Infrastructure生成AI - 小Cohere |
10,000トランザクション |
||
Oracle Cloud Infrastructure生成AI- 埋込みCohere |
10,000トランザクション |
||
Oracle Cloud Infrastructure生成AI - 大Meta |
10,000トランザクション |
||
Oracle Cloud Infrastructure Generative AI - Meta Llama 3.1 405B |
10,000トランザクション |
||
Oracle Cloud Infrastructure生成AI - 大Cohere - 専用 |
AIユニット/時 |
||
Oracle Cloud Infrastructure生成AI - 小Cohere - 専用 |
AIユニット/時 |
||
Oracle Cloud Infrastructure生成AI - 埋込みCohere - 専用 |
AIユニット/時 |
||
Oracle Cloud Infrastructure生成AI - 大Meta - 専用 |
AIユニット/時 |
サービス |
比較価格(/vCPU)* |
単価 |
単位 |
Oracle Cloud Infrastructure Generative AI Agent - Retrieval-Augmented Generation (RAG) |
10,000トランザクション |
||
Oracle Cloud Infrastructure Generative AI Agent - ナレッジ・ベース・ストレージ |
1時間あたりのギガバイトストレージ |
||
Oracle Cloud Infrastructure 生成AI機能エージェント- データの取り込み |
10,000トランザクション |