Un data mart è una forma semplice di data warehouse che interessa un singolo argomento o linea di business. Con un data mart, i team possono accedere ai dati e ottenere insight più rapidamente, in quanto non devono dedicare tempo alla ricerca all'interno di un data warehouse più complesso o aggregare in modo manuale i dati da diverse fonti.
Un data mart fornisce un accesso più semplice ai dati richiesti da un team o da una linea di business specifica all'interno della propria organizzazione. Ad esempio, se il team di marketing cerca dei dati per migliorare le performance delle campagne durante le festività, l'analisi e la combinazione di tali dati presenti su più sistemi, potrebbero risultare dispendiosi in termini di tempo, accuratezza e, in ultima analisi, in termini di costi.
I team che hanno la responsabilità di individuare i dati da varie fonti, il più delle volte, si affidano ai fogli di calcolo per condividere questi dati e collaborare. Questo si traduce generalmente in errori umani, confusione, complesse riconciliazioni e molteplici fonti di dati, ossia in un "incubo". I data mart sono utilizzati come un luogo centralizzato in cui i dati necessari vengono raccolti e organizzati prima della creazione di report, dashboard e visualizzazioni.
I data mart, i data lake e i data warehouse soddisfano diversi scopi ed esigenze.
Un data warehouse è un sistema di gestione dei dati progettato per supportare la business intelligence e gli analytics di un'intera organizzazione. I data warehouse spesso contengono grandi quantità di dati, inclusi i dati cronologici. I dati all'interno di un data warehouse derivano generalmente da un'ampia gamma di fonti, come i file di registro delle applicazioni e le applicazioni transazionali. Un data warehouse memorizza i dati strutturati, il cui scopo è in genere ben definito.
Un data lake consente alle organizzazioni di memorizzare grandi quantità di dati strutturati e non strutturati (ad esempio quelli provenienti dai social media o dai dati clickstream) e di renderli immediatamente disponibili per casi d'uso di analytics, Data Science e Machine Learning in tempo reale. Con un data lake, i dati sono inseriti nella loro forma originale, senza alterazioni.
La differenza fondamentale tra un data lake e un data warehouse è che i data lake contengono enormi quantità di dati raw, senza una struttura predefinita. Le organizzazioni non devono sapere a priori come verranno utilizzati i dati.
Un data mart è una forma semplice di un data warehouse che interessa un singolo argomento o linea di business, ad esempio vendite, Finance o marketing. Data la loro specificità, i data mart attingono i dati da meno fonti rispetto ai data warehouse. Le fonti dei data mart possono includere sistemi operativi interni, un data warehouse centrale e dati esterni.
Un data mart dedicato a un team o a una linea di business specifica, offre diversi vantaggi:
I team di business stanno cercando di diventare più agili e basarsi maggiormente sui dati per guidare la strategia e migliorare il processo decisionale giorno per giorno, ma in genere hanno difficoltà a trasformare moli di dati in insight. I CFO spendono in media 2,24 ore al giorno ad analizzare fogli di calcolo. Sebbene i team di business si rivolgano abitualmente all'IT per ricevere assistenza, per i team IT può essere difficile stare al passo con le richieste degli utenti business relative a un accesso maggiore a fonti di dati eterogenee, a volumi di dati più grandi e a tempi di query più rapidi.
L'impostazione dei data mart può inoltre rappresentare una preoccupazione per i team IT già carichi di lavoro, in quanto devono regolarmente gestire questi data mart e garantire la sicurezza dei dati. La migrazione dei data mart al cloud aiuta ad alleviare le preoccupazioni sia dei team di business sia di quelli IT, trasferendo le attività di amministrazione e sicurezza al fornitore di servizi cloud, il quale riduce la necessità di un intervento manuale e i costi operativi.
Oracle offre una soluzione completa e self-service che consente ai team di business di ricavare insight affidabili e basati sui dati, affinché possano prendere decisioni in modo più rapido.
I team di business possono combinare rapidamente tutti i dati necessari da diverse fonti e in diversi formati (inclusi i dati spaziali e quelli a grafo) in un database convergente e collaborare così con maggiore sicurezza su un'unica fonte di dati fornita dai data mart. Gli analisti possono utilizzare agevolmente gli strumenti di dati self-service e il Machine Learning integrato, senza la necessità di scrivere codice e in questo modo accelerare il caricamento, la trasformazione e la preparazione dei dati, trovare in modo automatico modelli e trend, fare previsioni e ricavare insight basati sui dati con una derivazione trasparente.
La soluzione di Oracle permette all'IT di ridurre i rischi in modo sicuro e controllato. I team IT possono inoltre fare affidamento su un approccio semplice, affidabile e ripetibile per tutte le richieste di analisi dei dati da parte dei reparti di business e in questo modo migliorare notevolmente la produttività.
Oracle Autonomous Database per analytics e data warehousing automatizza in modo intelligente il provisioning, la configurazione, la protezione, il tuning, la scalabilità, l'applicazione di patch, il backup e il ripristino. Questa funzionalità elimina quasi tutte le attività manuali e complesse che possono introdurre errori umani. Gli strumenti di dati integrati consentono il caricamento e la trasformazione dei dati, il Business Modeling e insight automatici per data mart in modo semplice e self-service. Invece di preoccuparsi dell'amministrazione ordinaria dei database, i DBA possono dedicarsi alla creazione di nuove applicazioni e aiutare i reparti di business a raggiungere i loro obiettivi. Gli utenti business delle aree Finance, HR e marketing possono fare affidamento su un accesso sicuro ai dati e su performance delle query sempre elevate, senza limiti di utenti simultanei, anche nei periodi di maggiore attività. Autonomous Database si ridimensiona automaticamente in base alle esigenze del carico di lavoro, senza tempi di inattività.