Flujo de datos

Oracle Cloud Infrastructure (OCI) Data Flow es un servicio de Apache Spark completamente gestionado que realiza tareas de procesamiento en conjuntos de datos extremadamente grandes, sin necesidad de implementar o gestionar infraestructuras. Los desarrolladores también pueden utilizar Spark Streaming para ejecutar ETL en la nube con sus datos de transmisión producidos continuamente. Esto permite una entrega rápida de la aplicación porque los desarrolladores pueden centrarse en el desarrollo de aplicaciones, no en la gestión de la infraestructura.

Demostración de OCI Data Flow (1:30)
Ronin Ronin and Oracle improve cancer care and deliver on an AI bill of rights

Discover how Ronin leveraged OCI Data Flow with Apache Spark to build a future where every clinical decision is rooted in data, personalized for a given individual, and rendered efficiently with confidence.

Integración y preparación de datos para data science

Vea el evento Oracle Developer Live y descubra cómo utilizar la integración de datos y el flujo de datos a fin de optimizar el uso de los datos.

Prueba un taller de Oracle Cloud Data Flow

Descubre cómo Data Flow facilita, protege y simplifica la ejecución de aplicaciones Spark.

Funciones de Data Flow

Infraestructura administrada

OCI Data Flow gestiona el aprovisionamiento de infraestructura, la configuración de la red y el desmontaje cuando se completan los trabajos de Spark. El almacenamiento y la seguridad también se administran, lo que significa que se requiere menos trabajo para crear y gestionar aplicaciones de Spark para el análisis de big data.

Gestión de clústeres más sencilla

Con OCI Data Flow, no hay clústeres para instalar, aplicar parches ni actualizar, lo que ahorra tiempo y costos operativos para los proyectos.

Planificación de la capacidad simplificada

OCI Data Flow ejecuta cada trabajo de Spark en recursos privados dedicados, eliminando así la necesidad de planificar la capacidad por adelantado.

Costos más bajos.

Con OCI Data Flow, TI solo necesita pagar por los recursos de infraestructura que los trabajos de Spark usan mientras están en ejecución.


Capacidades avanzadas de soporte de flujo

Spark Streaming sin gestión, tolerancia automática a fallos y aplicación automática de parches.

Activa el procesamiento continuo

Con el soporte de Spark Streaming, obtienes capacidades para la recuperación continua y la disponibilidad continua de datos procesados. OCI Data Flow gestiona el trabajo duro de procesamiento de flujos con Spark, junto con la capacidad de realizar aprendizaje automático en datos de transmisión mediante MLLib. OCI Data Flow soporta Oracle Cloud Infrastructure (OCI) Object Storage y cualquier origen de transmisión compatible con Kafka, incluido Oracle Cloud Infrastructure (OCI) Streaming como orígenes y receptores de datos.

Tolerancia automática a fallos

Spark maneja los datos de última hora debido a interrupciones y puede recuperar los datos atrasados a lo largo del tiempo con marcas de agua, una función de Spark que mantiene, almacena y luego agrega datos de última hora, sin necesidad de reiniciar manualmente el trabajo. OCI Data Flow reinicia automáticamente la aplicación cuando es posible y la aplicación puede continuar desde el último punto de control.

Autentificación nativa en la nube

Las aplicaciones de transmisión de OCI Data Flow pueden utilizar la autenticación nativa en la nube a través de principales de recursos para que las aplicaciones se puedan ejecutar más de 24 horas.


Seguridad y gobernanza nativas de la nube

Aproveche la seguridad inigualable de Oracle Cloud Infrastructure. Se abordan la autenticación, el aislamiento y todos los demás puntos críticos. Proteja los datos críticos para la empresa con los más altos niveles de seguridad.

Seguridad granular

OCI Data Flow hace un uso nativo del sistema de gestión de acceso e identidad de Oracle Cloud para controlar el acceso y los datos, por lo que los datos se mantienen seguros.

Recursos gestionados

Establezca cuotas y límites para gestionar los recursos disponibles para OCI Data Flow y controlar los costos.


Operaciones simplificadas

OCI Data Flow simplifica las tareas operativas comunes como la gestión de registros y el acceso a las IU operativas, lo que libera tiempo para que el desarrollador se centre en la creación de aplicaciones.

Mayor visibilidad

OCI Data Flow facilita ver lo que están haciendo los usuarios de Spark al agregar información operativa en una única interfaz de usuario con capacidad de búsqueda.

Depuración y diagnóstico sencillos

El seguimiento de registros y herramientas para solucionar problemas de un trabajo de Spark puede llevar horas, pero no con una vista consolidada de la salida del registro, el servidor del historial de Spark y más.

Evite costos futuros

Ordene, busque y filtre para investigar aplicaciones históricas con el fin de abordar mejor los trabajos costosos y evitar gastos innecesarios.

Gestionar trabajos de Spark fuera de control

Los administradores pueden descubrir y detener fácilmente los trabajos de Spark que se ejecutan durante demasiado tiempo o que consumen demasiados recursos y aumentan los costos.


Desarrollo simplificado

Los ecosistemas de big data requieren muchas partes móviles e integraciones, pero OCI Data Flow es compatible con las inversiones existentes de Spark y los servicios de big data, lo que facilita la gestión del servicio y la entrega de resultados donde se necesitan.

Compatible con aplicaciones existentes

Migre las aplicaciones de Spark existentes desde Hadoop u otros servicios big data.

Gestión de salida segura

De forma automática y segura, capture y almacene la salida de trabajos de Spark y luego acceda a ellos a través de la interfaz de usuario o las API de REST para que la analítica esté disponible.

Control con las API de REST

Todos los aspectos de OCI Data Flow se pueden administrar mediante API de REST simples, desde la creación de la aplicación hasta la ejecución y el acceso a los resultados de los trabajos de Spark.


Oracle Cloud Infrastructure Data Flow reduce el costo en un 75 %

Con Oracle Cloud Infrastructure Data Flow, cumplimos los SLA de los clientes al reducir el tiempo necesario para el procesamiento de datos en un 75 % y al reducir el costo en más del 300 %.

Arun Nimmala, director de entregas Integración de Servicios Globales y Arquitectura Analítica, Oracle

Ventajas clave de OCI Data Flow

  • Acelera los flujos de trabajo con NVIDIA RAPIDS

    NVIDIA RAPIDS Accelerator for Apache Spark en OCI Data Flow es compatible para ayudar a acelerar la ciencia de datos, el aprendizaje automático y los flujos de trabajo de IA.

    Descarga de ETL

    El flujo de datos gestiona la descarga de ETL mediante la supervisión de los trabajos de Spark, la optimización de los costos y la liberación de capacidad.

  • Archivo activo

    Las capacidades de gestión de salida de Data Flow optimizan la capacidad de consultar datos usando Spark.

  • Cargas de trabajo impredecibles

    Los recursos se pueden cambiar automáticamente para manejar trabajos impredecibles y reducir costos. Un cuadro de mando proporciona una vista del uso y el presupuesto con fines de planificación futura.

  • Formación sobre modelos de aprendizaje automático

    Spark y desarrolladores de aprendizaje automático pueden usar la biblioteca de aprendizaje automático de Spark y ejecutar modelos de forma más eficaz mediante el flujo de datos.

  • Spark Streaming

    Obtén soporte para Spark Streaming con gestión cero y tolerancia automática a fallos con garantías de extremo a extremo, exactamente una vez, y parches automáticos.

    Lee algunos de los casos de uso anteriores

Productos de nube relacionados

Oracle Cloud Infrastructure Data Science

Aprendizaje automático de extremo a extremo

Catálogo de datos de Oracle Cloud Infrastructure

Detección de datos en régimen de autoservicio

Oracle Autonomous Data Warehouse

Servicio de almacén de datos en la nube

Oracle Cloud Infrastructure Object Storage

Cree su lago de datos

Conoce OCI Data Flow


Regístrese para obtener una prueba gratuita

Regístrese para obtener una cuenta en Oracle Cloud y pruebe el servicio Data Flow de forma gratuita.


Obtenga formación

Obtén más información sobre Oracle Cloud Infrastructure Data Flow.


Laboratorio práctico

Experimenta el producto en vivo de forma gratuita.


Ponte en contacto con ventas

Hable con un miembro del equipo sobre Oracle Cloud Infrastructure Data Flow.