Ejecute más rápidamente las cargas de trabajo de IA más exigentes, incluidas la IA generativa, la visión informática y el análisis predictivo, en cualquier lugar de nuestra nube distribuida. Utiliza Oracle Cloud Infrastructure (OCI) Supercluster para escalar hasta 65 536 GPU hoy mismo y 131 072 GPU próximamente.*
Impulsa el entrenamiento de IA con las instancias con hardware dedicado de GPU únicas de Oracle Cloud Infrastructure y redes de clústeres RDMA ultrarrápidas que reducen la latencia a tan solo 2,5 microsegundos. Obtén un precio hasta un 220 % mejor en máquinas virtuales con GPU que en otros proveedores en la nube.
Aprovecha los destinos de montaje de alto rendimiento (HPMT) para obtener un rendimiento sostenido hasta de 500 Gb/s. Utiliza 61,44 TB de capacidad de almacenamiento local, la más alta del sector para instancias con GPU NVIDIA H100.
La nube distribuida de Oracle te permite implementar infraestructura de IA en cualquier lugar para cumplir con los requisitos de desempeño, seguridad y soberanía de IA.
Hasta 131 072 GPU, 8 veces más de escalabilidad
Las innovaciones del tejido de red permitirán a OCI Supercluster escalar hasta 131 072 GPU NVIDIA B200 y más de 100 000 GPU Blackwell en NVIDIA Grace Blackwell Superchips. OCI Supercluster escala hasta 65 536 GPU NVIDIA H200 en la actualidad.
Tanto si buscas realizar inferencias, ajustar o entrenar modelos de gran escala para IA generativa, OCI ofrece opciones de clústeres de GPU de máquina virtual y hardware dedicado líderes del sector con tecnología de una red de ancho de banda ultraalto y almacenamiento de alto rendimiento para satisfacer tus necesidades de IA.
Recursos informáticos sobrecargados
• Instancias con hardware dedicado sin sobrecarga del hipervisor
• Aceleradas por GPU NVIDIA H200, H100, L40S y A100
• Opción de uso de GPU AMD MI300X
• Unidad de procesamiento de datos (DPU) para la aceleración de hardware incorporada
Capacidad masiva y almacenamiento de alto rendimiento
• Almacenamiento local: hasta 61,44 TB de capacidad en unidades de estado sólido NVMe
• Almacenamiento de archivos: destino de montaje de alto rendimiento (HPMT) con un rendimiento de hasta 80 Gb/s (actualmente GA) y servicio Lustre totalmente gestionado (próximamente)
• Almacenamiento en bloque: volúmenes equilibrados, de mayor rendimiento y de rendimiento ultraalto con un SLA de rendimiento
• Almacenamiento de objetos: distintos niveles de clase de almacenamiento, replicación de cubos y límites de alta capacidad
Redes ultrarrápidas
• Protocolo RDMA sobre Ethernet convergente de diseño personalizado (RoCE v2)
• Latencia de 2,5 a 9,1 microsegundos para redes de clústeres
• Hasta 3 200 Gb/s de ancho de banda de red de clúster
• Hasta 200 Gb/s de ancho de banda de red front-end
Las instancias con hardware bare metal de Oracle Cloud Infrastructure con tecnología de GPU AMD MI300X, NVIDIA L40S, NVIDIA H100 y NVIDIA A100 permiten a los clientes ejecutar grandes modelos de IA para casos de uso que incluyen aprendizaje profundo, IA conversacional e IA generativa. Con OCI Supercluster, puedes pueden escalar hasta 32 768 GPU A100, 16 384 GPU H100 y 3 840 GPU L40S por clúster.
La red de clústeres RDMA de alta velocidad impulsada por tarjetas de interfaz de red NVIDIA ConnectX con RDMA sobre Ethernet convergente versión 2 le permite crear grandes clústeres de instancias de GPU con la misma red de latencia ultrabaja y escalabilidad de aplicaciones que espera en el entorno local.
No pagas más por la capacidad de RDMA, el almacenamiento de bloques o el ancho de banda de red, y los primeros 10 TB de salida son gratuitos.
A través de OCI Supercluster, los clientes pueden acceder al almacenamiento local, de bloques, de objetos y de archivos para la computación a exascala. Entre los principales proveedores de nube, OCI ofrece la mayor capacidad de almacenamiento NVMe local de alto rendimiento para establecer puntos de control más frecuentes durante las ejecuciones de entrenamiento, lo que resulta en una recuperación más rápida de las fallas.
Los sistemas de archivos de HPC, incluidos BeeGFS, GlusterFS, Lustre y WEKA, se pueden utilizar para el entrenamiento de IA a escala sin comprometer el desempeño.
Mira al arquitecto técnico jefe Pradeep Vincent explicar cómo OCI Supercluster impulsa el entrenamiento y la inferencia de modelos de aprendizaje automático, escalando a decenas de miles de GPU NVIDIA.
Entrena modelos de IA en instancias específicas de OCI basadas en GPU, redes de clústeres de RDMA y OCI Data Science.
Proteger los miles de millones de transacciones financieras que se producen todos los días requiere herramientas de IA que puedan analizar grandes cantidades de datos históricos de clientes. Los modelos de IA que se ejecutan en OCI Compute con tecnología de GPU NVIDIA junto con herramientas de gestión de modelos como OCI Data Science y otros modelos de código abierto ayudan a las instituciones financieras a mitigar el fraude.
La IA se utiliza a menudo para analizar diversos tipos de imágenes médicas (como rayos X y resonancias magnéticas) en un hospital. Los modelos entrenados ayudan a priorizar los casos que necesitan revisión inmediata por parte de un radiólogo e informan resultados concluyentes sobre otros.
El descubrimiento de medicamentos es un proceso lento y costoso que puede tardar muchos años y costar millones de dólares. Al aprovechar la infraestructura y el análisis de IA, los investigadores aceleran dicho proceso. Además, OCI Compute con tecnología de GPU NVIDIA junto con herramientas de gestión de flujos de trabajo de IA como BioNeMo permite a los clientes curar y preprocesar sus datos.
Oracle ofrece un nivel de precios gratuito para la mayoría de los servicios de IA, así como una cuenta de prueba gratuita con 300 dólares estadounidenses en créditos para probar servicios adicionales en la nube. Los servicios de IA son una recopilación de ofertas, como la IA generativa, con modelos de aprendizaje automático predefinidos que facilitan a los desarrolladores aplicar la IA a las aplicaciones y operaciones empresariales.
También tienes que pagar solo los costos de computación y almacenamiento para OCI Data Science.
Obtén más información sobre redes de clúster RDMA, instancias de GPU, servidores con hardware dedicado y mucho más.
Los precios de Oracle Cloud son sencillos, con tarifas consistentemente bajas en todo el mundo, y con apoyo a una amplia gama de casos de uso. Para hacer una estimación de tu tarifa reducida, da un vistazo a la calculadora de costos y configura los servicios que se adapten mejor a tus necesidades.
Obtén ayuda para crear tu próxima solución de IA o implementar tu carga de trabajo en la infraestructura de IA de OCI.