O Oracle Cloud Infrastructure (OCI) Data Flow é um serviço totalmente gerenciado do Apache Spark que executa tarefas de processamento em conjuntos de dados extremamente grandes, sem infraestrutura para implementar ou gerenciar. Os desenvolvedores também podem usar o Spark Streaming para executar ETL na nuvem em seus dados de streaming produzidos continuamente. Isso permite a entrega rápida de aplicações porque os desenvolvedores podem se concentrar no desenvolvimento, não no gerenciamento da infraestrutura.
Discover how Ronin leveraged OCI Data Flow with Apache Spark to build a future where every clinical decision is rooted in data, personalized for a given individual, and rendered efficiently with confidence.
Assista ao Oracle Developer Live Event e veja como utilizar Integração de Dados e Fluxo de Dados para otimizar como os dados são usados.
Saiba como o serviço Data Flow torna a execução de aplicativos Spark fácil, segura e simples.
O OCI Data Flow lida com o provisionamento de infraestrutura, configuração de rede e desmontagem quando as tarefas Spark são concluídas. O armazenamento e a segurança também são gerenciados, o que significa que menos trabalho é necessário para criar e gerenciar aplicativos Spark para análise de big data.
Com o OCI Data Flow, não há clusters para instalar, corrigir ou atualizar, o que economiza tempo e custos operacionais para projetos.
O OCI Data Flow executa cada tarefa Spark em recursos privados dedicados, eliminando a necessidade de planejamento de capacidade com antecedência.
Com o OCI Data Flow, a TI só precisa pagar pelos recursos de infraestrutura que as tarefas Spark usam enquanto estão em execução.
Streaming do Spark com gerenciamento zero, tolerância automática a falhas e aplicação automática de patches.
Com suporte ao Spark Streaming, você obtém recursos para recuperação contínua e disponibilidade contínua de dados processados. O OCI Data Flow lida com o trabalho pesado de processamento de fluxo com o Spark, juntamente com a capacidade de executar aprendizado de máquina no streaming de dados usando MLLib. O OCI Data Flow suporta o OCI (Oracle Cloud Infrastructure) Object Storage e qualquer origem de streaming compatível com Kafka, incluindo o OCI (Oracle Cloud Infrastructure) Streaming como origens e dissipadores de dados.
O Spark lida com dados em atraso devido a interrupções e pode capturar dados em backlog ao longo do tempo com marca d'água - um recurso do Spark que mantém, armazena e depois agrega dados em atraso - sem a necessidade de reiniciar manualmente o job. O OCI Data Flow reinicia automaticamente seu aplicativo quando possível e seu aplicativo pode simplesmente continuar do último checkpoint.
Os aplicativos de streaming do OCI Data Flow podem usar autenticação nativa da nuvem por meio de recursos principais para que os aplicativos possam ser executados mais de 24 horas.
Aproveite a segurança incomparável da Oracle Cloud Infrastructure. Autenticação, isolamento e todos os outros pontos críticos são tratados. Proteja os dados essenciais aos negócios com os mais altos níveis de segurança.
O OCI Data Flow faz uso nativo do sistema Identity and Access Management da Oracle Cloud para dados e acesso controlados, para que os dados permaneçam seguros.
Defina cotas e limites para gerenciar os recursos disponíveis para o OCI Data Flow e controlar os custos.
O OCI Data Flow simplifica tarefas operacionais comuns, como gerenciamento de log e acesso a IUs operacionais, liberando tempo do desenvolvedor para se concentrar na construção de aplicativos.
O OCI Data Flow facilita ver o que os usuários Spark estão fazendo, agregando informações operacionais em uma única IU pesquisável.
Rastrear logs e ferramentas para solucionar problemas de uma tarefa Spark pode levar horas - mas não com uma visão consolidada de saída de log, servidor de histórico Spark e muito mais.
Classifique, pesquise e filtre para investigar aplicativos históricos para atender melhor a trabalhos caros e evitar gastos desnecessários.
Os administradores podem descobrir e interromper facilmente tarefas Spark ao vivo em execução por muito tempo ou consumindo muitos recursos e aumentando os custos.
Ecossistemas de big data requerem muitas partes móveis e integrações - mas o OCI Data Flow é compatível com os investimentos Spark existentes e os serviços de big data, facilitando o gerenciamento do serviço e entregando seus resultados onde são necessários.
Migre os aplicativos Spark existentes do Hadoop ou outros serviços de big data.
Capture e armazene de maneira automática e segura a saída de tarefas Spark e, em seguida, acesse-os por meio da IU ou das APIs REST para disponibilizar análises.
Todos os aspectos do OCI Data Flow podem ser gerenciados usando APIs REST simples, desde a criação do aplicativo até a execução e o acesso aos resultados de tarefas Spark.
Com o Oracle Cloud Infrastructure Data Flow, cumprimos os SLAs do cliente reduzindo o tempo necessário para processamento de dados em 75% e reduzindo o custo em mais de 300%.Arun Nimmala, Diretor de Entrega Global Services Integration and Analytics Architecture, Oracle
O acelerador NVIDIA RAPIDS para Apache Spark no OCI Data Flow é compatível para ajudar a acelerar a ciência de dados, o machine learning e os fluxos de trabalho de IA.
O Data Flow gerencia o descarregamento de ETL, supervisionando os trabalhos do Spark, otimizando custos e liberando capacidade.
Os recursos de gerenciamento de saída do Data Flow otimizam a capacidade de consultar dados usando o Spark.
Os recursos podem ser deslocados automaticamente para lidar com trabalhos imprevisíveis e custos mais baixos. Um painel fornece uma visão de uso e orçamento para fins de planejamento futuro.
Os desenvolvedores podem usar a biblioteca de machine learning do Spark e executar modelos com mais eficiência usando o Data Flow.
Obtenha suporte ao Spark Streaming com gerenciamento zero e tolerância automática a falhas com garantias de ponta a ponta, exatamente uma vez e correção automática.
Inscreva-se na conta da Oracle Cloud e experimente o serviço Data Flow gratuitamente.
Saiba mais sobre o Oracle Cloud Infrastructure Data Flow.
Experimente o produto ao vivo, de graça.
Fale com um membro da equipe sobre o Oracle Cloud Infrastructure Data Flow.