Oracle Cloud Infrastructure (OCI) Data Flow ist ein vollständig verwalteter Dienst von Apache Spark, der Verarbeitungsaufgaben für extrem große Datasets ausführt – ohne Infrastruktur, die bereitgestellt oder verwaltet werden muss. Entwickler können Spark Streaming auch verwenden, um Cloud-ETL mit ihren kontinuierlich erstellten Streamingdaten auszuführen. Dies ermöglicht eine schnelle Anwendungsbereitstellung, da sich Entwickler auf die App-Entwicklung und nicht auf die Infrastrukturverwaltung konzentrieren können.
Erfahren Sie, wie Ronin OCI Data Flow mit Apache Spark nutzte, um eine Zukunft zu schaffen, in der jede klinische Entscheidung auf Daten basiert, für eine bestimmte Person personalisiert ist und effizient und zuverlässig getroffen wird.
Sehen Sie sich das Oracle Developer Live-Event an und erfahren Sie, wie Sie mithilfe von Data Integration und Data Flow die Verwendung Ihrer Daten optimieren können.
Erfahren Sie, wie Data Flow die Ausführung von Spark-Anwendungen einfach, sicher und unkompliziert macht.
OCI Data Flow übernimmt die Bereitstellung der Infrastruktur, das Einrichten des Netzwerks und das Abbrechen, wenn die Spark-Jobs abgeschlossen sind. Darüber hinaus werden Speicher und Sicherheit verwaltet. Das bedeutet, dass weniger Arbeit zum Erstellen und Verwalten von Spark-Anwendungen für die Big Data-Analyse erforderlich ist.
Mit OCI Data Flow müssen keine Cluster installiert, gepatcht oder aktualisiert werden. Dadurch werden Zeit und Betriebskosten für Projekte gespart.
OCI Data Flow führt jeden Spark-Job in privaten, dedizierten Ressourcen aus, sodass vorab keine Kapazitätsplanung erforderlich ist.
Mit OCI Data Flow muss die IT nur für die Infrastrukturressourcen bezahlen, die die Spark-Jobs während ihrer Ausführung verwenden.
Spark Streaming ohne Verwaltung, mit automatischer Fehlertoleranz und automatischem Patching.
Mit der Unterstützung von Spark Streaming erhalten Sie Funktionen für den kontinuierlichen Abruf und die kontinuierliche Verfügbarkeit verarbeiteter Daten. OCI Data Flow bewältigt die komplexe Verarbeitung von Streams mit Spark sowie die Möglichkeit, maschinelles Lernen für Streamingdaten mit MLLib auszuführen. OCI Data Flow unterstützt Oracle Cloud Infrastructure (OCI) Object Storage und jede Kafka-kompatible Streamingquelle, einschließlich Oracle Cloud Infrastructure (OCI) Streaming als Datenquellen und -senken.
Spark verarbeitet verspätet eingehende Daten aufgrund von Ausfällen und kann mit Wasserzeichen (ein Spark-Feature, das verspätete Daten verwaltet, speichert und dann aggregiert) rückständige Daten im Zeitverlauf erfassen, ohne den Auftrag manuell neu starten zu müssen. OCI Data Flow startet Ihre Anwendung nach Möglichkeit automatisch neu, und Ihre Anwendung kann einfach vom letzten Checkpoint aus fortgesetzt werden.
OCI Data Flow Streaming-Anwendungen können eine native Cloud-Authentifizierung über Resource Principals verwenden, sodass Anwendungen länger als 24 Stunden ausgeführt werden können.
Profitieren Sie von der unübertroffenen Sicherheit von Oracle Cloud Infrastructure. Authentifizierung, Isolation und alle anderen kritischen Punkte werden behandelt. Schützen Sie unternehmenskritisch Daten mit höchster Sicherheit.
OCI Data Flow nutzt das Identity and Access Management-System von Oracle Cloud nativ für kontrollierte Daten und den Zugriff, damit die Daten sicher bleiben.
Legen Sie Kontingente und Grenzen fest, um die für OCI Data Flow verfügbaren Ressourcen zu verwalten und die Kosten zu steuern.
OCI Data Flow vereinfacht allgemeine Betriebsaufgaben wie die Protokollverwaltung und den Zugriff auf betriebliche Nutzeroberflächen, sodass Entwickler mehr Zeit haben und sich auf das Erstellen von Anwendungen konzentrieren können.
Durch Zusammenfassung der Betriebsinformationen in einer einzigen durchsuchbaren Nutzeroberfläche kann mit OCI Data Flow einfach ermittelt werden, was Spark-Nutzer tun.
Das Auffinden von Protokollen und Tools zur Fehlerbehebung bei einem Spark-Job kann Stunden dauern – jedoch nicht mit einer konsolidierten Ansicht der Protokollausgabe, des Spark-Verlaufsservers und mehr.
Sortieren, suchen und filtern Sie, um historische Anwendungen zu untersuchen, teure Aufträge besser zu bewältigen und unnötige Ausgaben zu vermeiden.
Administratoren können einfach live Spark-Jobs erkennen und stoppen, die zu lange ausgeführt werden oder zu viele Ressourcen verbrauchen und die Kosten erhöhen.
Big Data-Ökosysteme erfordern viele bewegte Teile und Integrationen. OCI Data Flow ist jedoch mit vorhandenen Spark-Investitionen und Big Data-Services kompatibel, sodass der Service einfach verwaltet werden kann und die Ergebnisse dort bereitgestellt werden, wo sie benötigt werden.
Migrieren Sie vorhandene Spark-Anwendungen von Hadoop oder anderen Big Data-Services.
Erfassen und speichern Sie die Ausgabe von Spark-Jobs automatisch – und sicher – und greifen Sie dann über die Nutzeroberfläche oder REST-APIs darauf zu, um Analysen verfügbar zu machen.
Alle Aspekte von OCI Data Flow können mit einfachen REST-APIs verwaltet werden – von der Anwendungserstellung über die Ausführung bis hin zum Zugriff auf die Ergebnisse von Spark-Jobs.
Mit Oracle Cloud Infrastructure Data Flow haben wir die Client-SLAs erfüllt, indem wir den Zeitaufwand für die Datenverarbeitung um 75 % und die Kosten um mehr als 300 % gesenkt haben.Arun Nimmala, Delivery Director Global Services Integration and Analytics Architecture, Oracle
NVIDIA RAPIDS Accelerator für Apache Spark in OCI Data Flow wird unterstützt, um Data Science-, ML- und KI-Workflows zu beschleunigen.
Data Flow verwaltet das ETL-Offloading durch Überwachung von Spark-Jobs, Kostenoptimierung und die Freigabe von Kapazitäten.
Die Ausgabeverwaltungsfunktionen von Data Flow optimieren die Abfrage von Daten mithilfe von Spark.
Ressourcen können automatisch verschoben werden, um unvorhersehbare Jobs zu bewältigen und Kosten zu senken. Für zukünftige Planungszwecke bietet ein Dashboard eine Ansicht der Nutzung und des Budgets.
Entwickler von Spark und maschinellem Lernen können die Machine Learning-Bibliothek von Spark verwenden und Modelle effizienter mit Data Flow ausführen.
Holen Sie sich die Spark-Streaming-Unterstützung ohne Verwaltung und mit automatischer Fehlertoleranz mit End-to-End-Garantien und automatischem Patching.
Lesen Sie mehr über einige der oben genannten Anwendungsfälle
Eröffnen Sie ein Oracle Cloud-Konto, und testen Sie den Data Flow-Dienst kostenlos.
Erfahren Sie mehr über Oracle Cloud Infrastructure Data Flow.
Erleben Sie das Live-Produkt kostenlos in der Praxis.
Wenden Sie sich mit Ihren Fragen zu Oracle Cloud Infrastructure Data Flow an unser Team.