Instancias de GPU

Oracle Cloud Infrastructure (OCI) Compute ofrece niveles escalabilidad líderes del sector para instancias dedicadas y máquinas virtuales (VM) con tecnología de GPU NVIDIA para gráficos generales, inferencia y entrenamiento de inteligencia artificial (IA), gemelos digitales y HPC.

Modal Labs resuelve los desafíos informáticos de IA para desarrolladores con OCI (1:35)
Investigadores de Stanford recurren a Oracle Cloud para encontrar nuevas formas de tratar la insuficiencia cardíaca

OCI Supercluster ofrece GPU de alto rendimiento a escala para acelerar el entrenamiento de modelos de lenguaje grandes (LLM) utilizados en la investigación cardiotorácica.

¿Por qué utilizar Oracle Cloud Infrastructure para instancias de GPU?

Escalabilidad

131 072

Número máximo de GPU en un OCI Supercluster1

Rendimiento

3.200

Hasta 3.200 Gb/s de ancho de banda de red de clúster RDMA2

Valor

220%

Las GPU para otros CSP pueden ser hasta un 220 % más costosas3

Opciones

VM/BM

Ajustes de tamaño con máquina virtual y rendimiento con instancias con hardware dedicado

1: OCI Supercluster escala hasta 131 072 GPU NVIDIA B200 (previsto); más de 100 000 GPU NVIDIA B200 en Superchips NVIDIA GB200 (previsto); 65 536 GPU H200 (previsto); 32 768 GPU NVIDIA A100; y 16 384 GPU NVIDIA H100.

2: Para instancias con hardware dedicado con GPU NVIDIA H100.

3: Basado en precios bajo demanda a 5 de junio de 2024.

Funciones clave de instancias de GPU

OCI es el único proveedor principal en la nube que ofrece instancias con hardware dedicado con GPU NVIDIA para obtener un alto desempeño sin sobrecarga de virtualización. Para establecer puntos de control durante el entrenamiento de IA, nuestras instancias proporcionan la mayor cantidad de almacenamiento local por nodo (61,44 TB).

Instancias de GPU NVIDIA de alto rendimiento

GPU NVIDIA Tensor Core

Oracle Cloud Infrastructure ofrece el mayor valor y rendimiento para instancias informáticas de máquina virtual y hardware dedicado con tecnología de GPU Tensor Core de NVIDIA H100, GPU L40S, GPU Tensor Core de A100, GPU Tensor Core de A10 y GPU NVIDIA de generaciones anteriores. Oracle Cloud Infrastructure planea ofrecer instancias con las GPU NVIDIA H200 y GPU Blackwell.

Superchips de NVIDIA

Oracle Cloud Infrastructure ofrece el Superchip NVIDIA GH200 Grace Hopper y planea ofrecer el Superchip GB200 Grace Blackwell para la inferencia de LLM.

Redes de cluster de alto rendimiento.

La red de clústeres de latencia ultrabaja de Oracle, basada en el acceso remoto directo a la memoria (RDMA), proporciona una latencia de microsegundos.

Implementa en máquinas virtuales, instancias con hardware dedicado y clústeres de Kubernetes

Instancias de máquina virtual

En el caso de máquinas virtuales, elige entre arquitecturas de GPU Hopper, Ampere y versiones anteriores de NVIDIA de entre uno y cuatro núcleos, 16 a 64 GB de memoria de GPU por máquina virtual y hasta 480 GB de ancho de banda de red.

Instancias de bare metal

Utiliza OCI Supercluster con instancias con hardware dedicado utilizando Blackwell, Hopper o Ampere Superchips y GPU de NVIDIA con 640 GB de memoria de GPU por nodo.

Organización de Kubernetes

Aprovecha las ventajas de Kubernetes gestionado, malla de servicios y registro de contenedores para organizar el entrenamiento y la inferencia de IA y aprendizaje automático (ML) con contenedores.

Accede a software de fácil acceso

Acceda a imágenes de software y disco

Oracle Cloud Marketplace proporciona imágenes de software y disco para modelos de ciencia de datos, análisis, inteligencia artificial (IA), y aprendizaje automático (ML) para que los clientes obtengan rápidamente insights a partir de sus datos.

NVIDIA AI Enterprise

Accede a NVIDIA AI Enterprise, una plataforma de software integral para la ciencia de datos y la IA de producción, que incluye IA generativa, visión informática e IA de voz.

NVIDIA DGX Cloud

NVIDIA DGX Cloud en OCI es una plataforma de entrenamiento de IA como servicio que ofrece a los desarrolladores una experiencia sin servidor optimizada para la IA generativa.

NVIDIA GPU Cloud Machine Image

Utiliza NVIDIA GPU Cloud Machine Image para cientos de aplicaciones optimizadas para GPU destinadas al aprendizaje automático, aprendizaje profundo y computación de alto rendimiento que abarcan una amplia gama de sectores y cargas de trabajo.

NVIDIA RTX Virtual Workstation

Ofrece un alto desempeño de las estaciones de trabajo cuando los colaboradores lo necesiten ejecutando NVIDIA RTX Virtual Workstation en Oracle Cloud.

Controla tu entorno informático de IA y tus datos

Nube distribuida

Cuando se combina con los recursos informáticos de GPU, la nube distribuida de OCI ayuda a las organizaciones a ejecutar servicios de IA y nube donde y cómo se necesiten.

Nube soberana

Admite la residencia de datos en una región o país, incluidos UE, EE.UU, Reino Unido y Australia.

OCI Dedicated Region

Despliega una región de nube completa en tu centro de datos con OCI Dedicated Region para mantener el control total de tus datos y aplicaciones.

Oracle Alloy

Conviértete en socio de Oracle Alloy y ofrece tus servicios en la nube para satisfacer las necesidades específicas del mercado.

Microservicios y contenedores

Container Registry

Los desarrolladores que crean aplicaciones con contenedores utilizan un servicio de registro de contenedores privado y de alta disponibilidad gestionado por Oracle para almacenar y compartir imágenes de contenedores. Inserta o extrae imágenes Docker hacia y desde el registro mediante la API Docker V2 y la interfaz de línea de comandos (CLI) estándar de Docker. Las imágenes se pueden extraer directamente en una implementación de Kubernetes.

Oracle Functions

Functions as a Service (FaaS) permite que los desarrolladores ejecuten aplicaciones sin servidor integrables en Oracle Cloud Infrastructure, Oracle Cloud Applications y servicios de terceros. Impulsa la eficiencia de los desarrolladores junto con la comunidad de Fn Project de código abierto.

Instancias de GPU: casos de uso

Infraestructura de IA para la formación y la inferencia de aprendizaje profundo

Entrena modelos de IA mediante OCI Data Science, instancias de hardware dedicado, redes de clusters basadas en RDMA y GPU de NVIDIA.


Entrenamiento e inferencia de IA En este diagrama se describen dos etapas del desarrollo de modelos de aprendizaje profundo: el entrenamiento y la inferencia de modelos. En el entrenamiento de modelo de la izquierda, la red neuronal no entrenada se introduce en un algoritmo de entrenamiento con tecnología de OCI Data Science, recursos informáticos de hardware dedicado, almacenamiento local y redes de clústeres. La salida del algoritmo de entrenamiento es un modelo entrenado con una nueva funcionalidad. El paso de inferencia del modelo se describe a la derecha. Tomemos un modelo entrenado como DALL-E 2, que puede tomar entradas de texto y generar imágenes. Se introduce una entrada de texto en el modelo entrenado y se proporciona una salida de imagen del modelo.

Infraestructura de escritorio virtual (VDI)

Los recursos informáticos de OCI con GPU NVIDIA proporcionan un alto rendimiento constante para VDI.


Infraestructura de escritorio virtual Infrastructura de escritorio virtual

CFD y recursos informáticos de alto rendimiento con instancias de GPU

OCI permite la ingeniería asistida por computadora y la dinámica de fluidos computacional para predicciones rápidas de las propiedades aerodinámicas de los objetos.


CFD y recursos informáticos de alto rendimiento con instancias de GPU CFD y recursos informáticos de alto rendimiento mediante instancias de GPU
11 de septiembre de 2024

Presentamos la mayor supercomputadora de IA y la primera a zetascala del mundo en la nube

Mahesh Thiagarajan, vicepresidente ejecutivo de Oracle Cloud Infrastructure

Los clientes de Oracle Cloud Infrastructure (OCI) han estado ejecutando algunas de las cargas de trabajo de IA más avanzadas. Su éxito refuerza nuestra estrategia de ofrecer a nuestros clientes la infraestructura de IA de mayor rendimiento, con potentes controles de seguridad y soberanía, al mejor valor en la nube.

Lee el post completo

Introducción a las instancias de GPU

Pruebe Oracle AI y obtén una versión de prueba de 30 días

Oracle ofrece un nivel de precios gratuito para la mayoría de los servicios de IA, así como una cuenta de prueba gratuita con 300 dólares estadounidenses en créditos para probar servicios adicionales en la nube. Los servicios de IA son una recopilación de ofertas, como la IA generativa, con modelos de aprendizaje automático predefinidos que facilitan a los desarrolladores aplicar la IA a las aplicaciones y operaciones empresariales.

  • ¿Qué servicios de IA y ML de Oracle ofrecen un nivel de precios gratuito?

    • OCI Speech
    • OCI Language
    • OCI Vision
    • OCI Document Understanding
    • Aprendizaje automático de Oracle Database
    • Oracle Data Labeling

    También tienes que pagar solo los costos de computación y almacenamiento para OCI Data Science.

Descubre todo lo que puedes ahorrar con OCI

Los precios de Oracle Cloud son sencillos, con tarifas consistentemente bajas en todo el mundo, y con apoyo a una amplia gama de casos de uso. Para hacer una estimación de tu tarifa reducida, da un vistazo a la calculadora de costos y configura los servicios que se adapten mejor a tus necesidades.

Accede a un experto en GPU e IA

Obtén ayuda para crear tu próxima solución de GPU o implementar tu carga de trabajo de IA en la infraestructura de IA de OCI.

  • Pueden responder a preguntas como

    • ¿Cómo puedo empezar a usar Oracle Cloud?
    • ¿Qué tipo de cargas de trabajo de IA puedo ejecutar en OCI?
    • ¿Qué tipos de servicios de IA ofrece OCI?