Le service de flux de données pour Oracle Cloud Infrastructure (OCI) est un service Apache Spark entièrement géré qui effectue des tâches de traitement sur des jeux de données extrêmement volumineux, sans infrastructure à déployer ou à gérer. Les développeurs peuvent également utiliser le service de diffusion en continu Spark pour effectuer une extraction, une transformation et un chargement en nuage sur leurs données produites en continu. Cela permet une livraison rapide des applications, car les développeurs peuvent se concentrer sur le développement, plutôt que sur la gestion de l'infrastructure.
Découvrez comment Ronin a tiré parti du flux de données pour OCI avec Apache Spark pour bâtir un avenir où chaque décision clinique est enracinée dans les données, personnalisée pour une personne donnée et rendue efficacement en toute confiance.
Regardez l'événement Oracle Developer Live et découvrez comment utiliser le service d'intégration de données et le service de flux de données pour optimiser l'utilisation des données.
Découvrez comment le service de flux de données simplifie l'exécution des applications Spark.
Le service de flux de données pour OCI gère le provisionnement de l'infrastructure, la configuration du réseau et le démontage lorsque les tâches Spark sont terminées. Le stockage et la sécurité sont également gérés, ce qui signifie que moins de travail est requis pour créer et gérer des applications Spark pour l'analyse de mégadonnées.
Avec le service de flux de données pour OCI, il n'y a aucune grappe à installer ou à mettre à niveau, ni de correctifs à appliquer. Cela permet ainsi d'économiser du temps et des coûts d'exploitation pour les projets.
Le service de flux de données pour OCI exécute chaque tâche Spark dans des ressources dédiées privées, éliminant ainsi la nécessité d'une planification préalable des capacités.
Avec le service de flux de données pour OCI, le service des TI n'a besoin de payer que pour les ressources d'infrastructure que les tâches Spark utilisent pendant leur exécution.
Diffusion en continu Spark sans gestion, tolérance automatique aux pannes et application automatique de correctifs.
Grâce à la prise en charge de la diffusion en continu Spark, vous profitez de capacités pour l'extraction continue et la disponibilité continue des données traitées. Le service de flux de données pour OCI gère le traitement intensif des flux avec Spark, ainsi que la possibilité d'effectuer un apprentissage automatique sur les données en continu à l'aide de MLLib. Le service de flux de données pour OCI prend en charge la solution de stockage d'objets d'Oracle Cloud Infrastructure (OCI) et toute source de diffusion en continu compatible Kafka, notamment le service de diffusion en continu pour Oracle Cloud Infrastructure (OCI) en tant que sources de données et que collecteurs de données.
Spark gère les données arrivant en retard en raison de pannes et peut procéder à un rattrapage des données en attente au fil du temps grâce à la fonctionnalité de filigrane, une fonction Spark qui gère, stocke et agrège les données en retard, sans avoir à redémarrer manuellement la tâche. Le service de flux de données pour OCI redémarre automatiquement votre application lorsque cela est possible, et celle-ci peut simplement reprendre son exécution à partir du dernier point de vérification.
Les applications de flux de données pour OCI peuvent utiliser l'authentification native en nuage au moyen de principaux de ressource afin que les applications puissent s'exécuter pendant des périodes dépassant 24 heures.
Tirez parti d’une sécurité inégalée grâce à Oracle Cloud Infrastructure. L'authentification, l'isolement et tous les autres points critiques sont traités. Protégez les données essentielles avec les niveaux de sécurité les plus élevés.
Le service de flux de données pour OCI utilise de manière native le système de gestion des identités et des accès d'Oracle Cloud pour contrôler les données et les accès, de sorte que les données restent sécurisées.
Définissez des quotas et des limites afin de gérer les ressources disponibles pour le service de flux de données pour OCI et de contrôler les coûts.
Le service de flux de données pour OCI simplifie les tâches opérationnelles courantes, comme la gestion des journaux et l'accès aux interfaces utilisateur opérationnelles, libérant ainsi du temps aux développeurs pour se concentrer sur la création d'applications.
Le flux de données d’Oracle Cloud Infrastructure permet de voir facilement ce que font tous vos utilisateurs Spark en regroupant les informations opérationnelles dans une seule interface utilisateur, à laquelle vous pouvez par la suite appliquer des fonctions de tri et de recherche.
Retrouver des journaux et des outils pour dépanner une tâche Spark peut souvent prendre des heures. Toutefois, la tâche est grandement simplifiée grâce à une vue consolidée de la sortie des journaux, du serveur d'historique Spark, etc.
Appliquez des tris, des recherches et des filtres pour étudier les applications de l'historique afin de mieux traiter les tâches coûteuses et d'éviter les dépenses inutiles.
Les administrateurs peuvent facilement détecter et arrêter les tâches Spark actives exécutées depuis trop longtemps ou qui consomment trop de ressources et augmentent les coûts.
Les écosystèmes de mégadonnées nécessitent de nombreuses pièces mobiles et d'intégrations. Cependant, le service de flux de données pour OCI est compatible avec les investissements Spark existants et les services de mégadonnées, ce qui facilite la gestion du service et fournit des résultats pertinents.
Migrez des applications Spark existantes à partir de Hadoop ou d'autres services de mégadonnées.
Saisissez et stockez automatiquement et en toute sécurité la sortie des tâches Spark pour y accéder ultérieurement au moyen de l'interface utilisateur ou des API REST et rendre les analyses disponibles.
Tous les aspects du service de flux de données pour OCI peuvent être gérés à l'aide de simples API REST, de la création d'application à l'exécution, en passant par l'accès aux résultats des tâches Spark.
Grâce au flux de données d'Oracle Cloud Infrastructure, nous avons respecté les ententes de niveau de service des clients en réduisant le temps nécessaire au traitement des données de 75 % et les coûts de plus de 300 %.Arun Nimmala, directeur de la prestation, architecture globale d'intégration et d'analyse de services, Oracle
L'accélérateur NVIDIA RAPIDS pour Apache Spark dans le service de flux de données pour OCI est pris en charge pour les flux de travail de science des données, d'apprentissage automatique et d'IA.
Le service de flux de données gère le déchargement de type extraction, transformation et chargement en supervisant des tâches Spark, en optimisant les coûts et en libérant de la capacité.
Les fonctions de gestion des sorties du service de flux de données optimisent la possibilité d'interroger des données à l'aide de Spark.
Les ressources peuvent être automatiquement déplacées pour gérer les tâches imprévisibles et réduire les coûts. Un tableau de bord fournit une vue de l'utilisation et du budget à des fins de planification future.
Les développeurs Spark et d'apprentissage automatique peuvent utiliser la bibliothèque d'apprentissage automatique de Spark et exécuter les modèles de manière plus efficace à l'aide du service de flux de données.
Obtenez une prise en charge du service de diffusion en continu Spark sans aucune gestion de votre part et une tolérance automatique aux pannes. Profitez en outre des garanties de bout en bout et d'une application automatique de correctifs.
Inscrivez-vous pour obtenir un compte Oracle Cloud et essayez gratuitement le service de flux de données.
En savoir plus sur le flux de données pour Oracle Cloud Infrastructure.
Essayez gratuitement le produit en direct.
Discutez avec un membre de l'équipe au sujet des flux de données pour Oracle Cloud Infrastructure