Oracle Cloud Infrastructure (OCI) Data Flow es un servicio de Apache Spark completamente gestionado que realiza tareas de procesamiento en conjuntos de datos extremadamente grandes, sin necesidad de implementar o gestionar infraestructuras. Los desarrolladores también pueden utilizar Spark Streaming para ejecutar ETL en la nube con sus datos de transmisión producidos continuamente. Esto permite una entrega rápida de la aplicación porque los desarrolladores pueden centrarse en el desarrollo de aplicaciones, no en la gestión de la infraestructura.
Discover how Ronin leveraged OCI Data Flow with Apache Spark to build a future where every clinical decision is rooted in data, personalized for a given individual, and rendered efficiently with confidence.
Vea el evento Oracle Developer Live y descubra cómo utilizar la integración de datos y el flujo de datos a fin de optimizar el uso de los datos.
Descubre cómo Data Flow facilita, protege y simplifica la ejecución de aplicaciones Spark.
OCI Data Flow gestiona el aprovisionamiento de infraestructura, la configuración de la red y el desmontaje cuando se completan los trabajos de Spark. El almacenamiento y la seguridad también se administran, lo que significa que se requiere menos trabajo para crear y gestionar aplicaciones de Spark para el análisis de big data.
Con OCI Data Flow, no hay clústeres para instalar, aplicar parches ni actualizar, lo que ahorra tiempo y costos operativos para los proyectos.
OCI Data Flow ejecuta cada trabajo de Spark en recursos privados dedicados, eliminando así la necesidad de planificar la capacidad por adelantado.
Con OCI Data Flow, TI solo necesita pagar por los recursos de infraestructura que los trabajos de Spark usan mientras están en ejecución.
Spark Streaming sin gestión, tolerancia automática a fallos y aplicación automática de parches.
Con el soporte de Spark Streaming, obtienes capacidades para la recuperación continua y la disponibilidad continua de datos procesados. OCI Data Flow gestiona el trabajo duro de procesamiento de flujos con Spark, junto con la capacidad de realizar aprendizaje automático en datos de transmisión mediante MLLib. OCI Data Flow soporta Oracle Cloud Infrastructure (OCI) Object Storage y cualquier origen de transmisión compatible con Kafka, incluido Oracle Cloud Infrastructure (OCI) Streaming como orígenes y receptores de datos.
Spark maneja los datos de última hora debido a interrupciones y puede recuperar los datos atrasados a lo largo del tiempo con marcas de agua, una función de Spark que mantiene, almacena y luego agrega datos de última hora, sin necesidad de reiniciar manualmente el trabajo. OCI Data Flow reinicia automáticamente la aplicación cuando es posible y la aplicación puede continuar desde el último punto de control.
Las aplicaciones de transmisión de OCI Data Flow pueden utilizar la autenticación nativa en la nube a través de principales de recursos para que las aplicaciones se puedan ejecutar más de 24 horas.
Aproveche la seguridad inigualable de Oracle Cloud Infrastructure. Se abordan la autenticación, el aislamiento y todos los demás puntos críticos. Proteja los datos críticos para la empresa con los más altos niveles de seguridad.
OCI Data Flow hace un uso nativo del sistema de gestión de acceso e identidad de Oracle Cloud para controlar el acceso y los datos, por lo que los datos se mantienen seguros.
Establezca cuotas y límites para gestionar los recursos disponibles para OCI Data Flow y controlar los costos.
OCI Data Flow simplifica las tareas operativas comunes como la gestión de registros y el acceso a las IU operativas, lo que libera tiempo para que el desarrollador se centre en la creación de aplicaciones.
OCI Data Flow facilita ver lo que están haciendo los usuarios de Spark al agregar información operativa en una única interfaz de usuario con capacidad de búsqueda.
El seguimiento de registros y herramientas para solucionar problemas de un trabajo de Spark puede llevar horas, pero no con una vista consolidada de la salida del registro, el servidor del historial de Spark y más.
Ordene, busque y filtre para investigar aplicaciones históricas con el fin de abordar mejor los trabajos costosos y evitar gastos innecesarios.
Los administradores pueden descubrir y detener fácilmente los trabajos de Spark que se ejecutan durante demasiado tiempo o que consumen demasiados recursos y aumentan los costos.
Los ecosistemas de big data requieren muchas partes móviles e integraciones, pero OCI Data Flow es compatible con las inversiones existentes de Spark y los servicios de big data, lo que facilita la gestión del servicio y la entrega de resultados donde se necesitan.
Migre las aplicaciones de Spark existentes desde Hadoop u otros servicios big data.
De forma automática y segura, capture y almacene la salida de trabajos de Spark y luego acceda a ellos a través de la interfaz de usuario o las API de REST para que la analítica esté disponible.
Todos los aspectos de OCI Data Flow se pueden administrar mediante API de REST simples, desde la creación de la aplicación hasta la ejecución y el acceso a los resultados de los trabajos de Spark.
Con Oracle Cloud Infrastructure Data Flow, cumplimos los SLA de los clientes al reducir el tiempo necesario para el procesamiento de datos en un 75 % y al reducir el costo en más del 300 %.Arun Nimmala, director de entregas Integración de Servicios Globales y Arquitectura Analítica, Oracle
NVIDIA RAPIDS Accelerator for Apache Spark en OCI Data Flow es compatible para ayudar a acelerar la ciencia de datos, el aprendizaje automático y los flujos de trabajo de IA.
El flujo de datos gestiona la descarga de ETL mediante la supervisión de los trabajos de Spark, la optimización de los costos y la liberación de capacidad.
Las capacidades de gestión de salida de Data Flow optimizan la capacidad de consultar datos usando Spark.
Los recursos se pueden cambiar automáticamente para manejar trabajos impredecibles y reducir costos. Un cuadro de mando proporciona una vista del uso y el presupuesto con fines de planificación futura.
Spark y desarrolladores de aprendizaje automático pueden usar la biblioteca de aprendizaje automático de Spark y ejecutar modelos de forma más eficaz mediante el flujo de datos.
Obtén soporte para Spark Streaming con gestión cero y tolerancia automática a fallos con garantías de extremo a extremo, exactamente una vez, y parches automáticos.
Regístrese para obtener una cuenta en Oracle Cloud y pruebe el servicio Data Flow de forma gratuita.
Obtén más información sobre Oracle Cloud Infrastructure Data Flow.
Experimenta el producto en vivo de forma gratuita.
Hable con un miembro del equipo sobre Oracle Cloud Infrastructure Data Flow.