Data Flow

O Oracle Cloud Infrastructure (OCI) Data Flow é um serviço totalmente gerenciado do Apache Spark que executa tarefas de processamento em conjuntos de dados extremamente grandes, sem infraestrutura para implementar ou gerenciar. Os desenvolvedores também podem usar o Spark Streaming para executar ETL na nuvem em seus dados de streaming produzidos continuamente. Isso permite a entrega rápida de aplicações porque os desenvolvedores podem se concentrar no desenvolvimento, não no gerenciamento da infraestrutura.

Demonstração do OCI Data Flow (1:30)
Ronin Ronin and Oracle improve cancer care and deliver on an AI bill of rights

Discover how Ronin leveraged OCI Data Flow with Apache Spark to build a future where every clinical decision is rooted in data, personalized for a given individual, and rendered efficiently with confidence.

Integração e Preparação para Ciência de Dados

Assista ao Oracle Developer Live Event e veja como utilizar Integração de Dados e Fluxo de Dados para otimizar como os dados são usados.

Experimente um workshop do Oracle Cloud Data Flow

Saiba como o serviço Data Flow torna a execução de aplicativos Spark fácil, segura e simples.

Recursos do Data Flow.

Infraestrutura gerenciada

O OCI Data Flow lida com o provisionamento de infraestrutura, configuração de rede e desmontagem quando as tarefas Spark são concluídas. O armazenamento e a segurança também são gerenciados, o que significa que menos trabalho é necessário para criar e gerenciar aplicativos Spark para análise de big data.

Gerenciamento de cluster mais fácil

Com o OCI Data Flow, não há clusters para instalar, corrigir ou atualizar, o que economiza tempo e custos operacionais para projetos.

Planejamento de capacidade simplificado

O OCI Data Flow executa cada tarefa Spark em recursos privados dedicados, eliminando a necessidade de planejamento de capacidade com antecedência.

Custos reduzidos

Com o OCI Data Flow, a TI só precisa pagar pelos recursos de infraestrutura que as tarefas Spark usam enquanto estão em execução.


Recursos avançados de suporte a streaming

Streaming do Spark com gerenciamento zero, tolerância automática a falhas e aplicação automática de patches.

Ativar processamento contínuo

Com suporte ao Spark Streaming, você obtém recursos para recuperação contínua e disponibilidade contínua de dados processados. O OCI Data Flow lida com o trabalho pesado de processamento de fluxo com o Spark, juntamente com a capacidade de executar aprendizado de máquina no streaming de dados usando MLLib. O OCI Data Flow suporta o OCI (Oracle Cloud Infrastructure) Object Storage e qualquer origem de streaming compatível com Kafka, incluindo o OCI (Oracle Cloud Infrastructure) Streaming como origens e dissipadores de dados.

Tolerância automática a falhas

O Spark lida com dados em atraso devido a interrupções e pode capturar dados em backlog ao longo do tempo com marca d'água - um recurso do Spark que mantém, armazena e depois agrega dados em atraso - sem a necessidade de reiniciar manualmente o job. O OCI Data Flow reinicia automaticamente seu aplicativo quando possível e seu aplicativo pode simplesmente continuar do último checkpoint.

Autenticação nativa na nuvem

Os aplicativos de streaming do OCI Data Flow podem usar autenticação nativa da nuvem por meio de recursos principais para que os aplicativos possam ser executados mais de 24 horas.


Segurança e governança nativas em nuvem

Aproveite a segurança incomparável da Oracle Cloud Infrastructure. Autenticação, isolamento e todos os outros pontos críticos são tratados. Proteja os dados essenciais aos negócios com os mais altos níveis de segurança.

Segurança granular

O OCI Data Flow faz uso nativo do sistema Identity and Access Management da Oracle Cloud para dados e acesso controlados, para que os dados permaneçam seguros.

Recursos gerenciados

Defina cotas e limites para gerenciar os recursos disponíveis para o OCI Data Flow e controlar os custos.


Operações simplificadas

O OCI Data Flow simplifica tarefas operacionais comuns, como gerenciamento de log e acesso a IUs operacionais, liberando tempo do desenvolvedor para se concentrar na construção de aplicativos.

Mais visibilidade

O OCI Data Flow facilita ver o que os usuários Spark estão fazendo, agregando informações operacionais em uma única IU pesquisável.

Depuração e diagnóstico simples

Rastrear logs e ferramentas para solucionar problemas de uma tarefa Spark pode levar horas - mas não com uma visão consolidada de saída de log, servidor de histórico Spark e muito mais.

Evite custos futuros

Classifique, pesquise e filtre para investigar aplicativos históricos para atender melhor a trabalhos caros e evitar gastos desnecessários.

Gerenciar tarefas Spark em fuga

Os administradores podem descobrir e interromper facilmente tarefas Spark ao vivo em execução por muito tempo ou consumindo muitos recursos e aumentando os custos.


Desenvolvimento simplificado

Ecossistemas de big data requerem muitas partes móveis e integrações - mas o OCI Data Flow é compatível com os investimentos Spark existentes e os serviços de big data, facilitando o gerenciamento do serviço e entregando seus resultados onde são necessários.

Compatível com aplicativos existentes

Migre os aplicativos Spark existentes do Hadoop ou outros serviços de big data.

Gerenciamento seguro de saída

Capture e armazene de maneira automática e segura a saída de tarefas Spark e, em seguida, acesse-os por meio da IU ou das APIs REST para disponibilizar análises.

Controle com APIs REST

Todos os aspectos do OCI Data Flow podem ser gerenciados usando APIs REST simples, desde a criação do aplicativo até a execução e o acesso aos resultados de tarefas Spark.


O Oracle Cloud Infrastructure Data Flow reduz o custo em 75%

Com o Oracle Cloud Infrastructure Data Flow, cumprimos os SLAs do cliente reduzindo o tempo necessário para processamento de dados em 75% e reduzindo o custo em mais de 300%.

Arun Nimmala, Diretor de Entrega Global Services Integration and Analytics Architecture, Oracle

Principais benefícios do OCI Data Flow

  • Acelere os fluxos de trabalho com NVIDIA RAPIDS

    O acelerador NVIDIA RAPIDS para Apache Spark no OCI Data Flow é compatível para ajudar a acelerar a ciência de dados, o machine learning e os fluxos de trabalho de IA.

    Descarregamento de ETL

    O Data Flow gerencia o descarregamento de ETL, supervisionando os trabalhos do Spark, otimizando custos e liberando capacidade.

  • Arquivo ativo

    Os recursos de gerenciamento de saída do Data Flow otimizam a capacidade de consultar dados usando o Spark.

  • Cargas de trabalho imprevisíveis

    Os recursos podem ser deslocados automaticamente para lidar com trabalhos imprevisíveis e custos mais baixos. Um painel fornece uma visão de uso e orçamento para fins de planejamento futuro.

  • Treinamento de modelo de aprendizado de máquina

    Os desenvolvedores podem usar a biblioteca de machine learning do Spark e executar modelos com mais eficiência usando o Data Flow.

  • Spark Streaming

    Obtenha suporte ao Spark Streaming com gerenciamento zero e tolerância automática a falhas com garantias de ponta a ponta, exatamente uma vez e correção automática.

    Leia sobre alguns dos casos de uso acima

Produtos de nuvem relacionados

Oracle Cloud Infrastructure Data Science

Aprendizado de máquina de ponta a ponta

Catálogo de Dados da Oracle Cloud Infrastructure

Descoberta de dados de autoatendimento

Oracle Autonomous Data Warehouse

Serviço de data warehouse em nuvem

Oracle Cloud Infrastructure Object Storage

Construa seu data lake

Introdução ao OCI Data Flow


Inscreva-se para obter uma avaliação gratuita

Inscreva-se na conta da Oracle Cloud e experimente o serviço Data Flow gratuitamente.


Receba o treinamento

Saiba mais sobre o Oracle Cloud Infrastructure Data Flow.


Laboratórios práticos

Experimente o produto ao vivo, de graça.


Fale com a equipe de vendas

Fale com um membro da equipe sobre o Oracle Cloud Infrastructure Data Flow.