Kevin Bogusch | Senior Competitive Intelligence Analyst | 24 gennaio 2024
I costi associati all'uscita dei dati sono una sorpresa indesiderata che molte organizzazioni devono affrontare all'inizio dei loro percorsi di migrazione al cloud. Sebbene i servizi cloud come le virtual machine e lo storage abbiano prezzi fissi, il costo per spostare i dati dal cloud è variabile e spesso imprevedibile.
Quando le organizzazioni lo scoprono, spesso prendono in considerazione la riprogettazione delle loro applicazioni per ridurre la quantità di dati che viaggiano tra i segmenti di rete, utilizzando tecniche come la compressione e la deduplicazione o aggiungendo un livello di inserimento nella cache per ridurre i bit che viaggiano. Idealmente, le aziende che passano al cloud progettano le proprie applicazioni tenendo presente queste considerazioni per ridurre al minimo i costi di trasferimento dei dati e migliorare le prestazioni.
Con i dati cloud in uscita ci si riferisce a qualsiasi informazione che lascia la rete di un provider cloud per un'altra posizione. Un'altra posizione potrebbe essere un data center on-premise, un altro data center cloud in un'area diversa, un' "availability zone" (data center) nello stesso servizio cloud o anche un'altra rete virtuale all'interno dello stesso data center.
I fornitori di servizi cloud variano, a volte in modo significativo, nelle modalità e nei costi di uscita dei dati, quindi è importante comprendere quali sono i componenti che concorrono ai calcoli di uscita dei dati. Le region, ad esempio, sono location costituite, in genere, da più data center all'interno di un confine geografico ristretto. I servizi cloud in genere forniscono un'ampia connettività di rete tra le regioni per supportare applicazioni cross-regional ad alta disponibilità. I dati che si spostano da un'area all'altra vengono misurati e in genere addebitati in base al numero di gigabyte di dati inviati.
Le availability zone sono l'altro concetto principale di disponibilità del servizio cloud. Sebbene ogni provider cloud abbia un nome leggermente diverso per questa nozione, inclusi gli "availability domains" o semplicemente "zone", il concetto comprende più data center nella stessa area geografica che hanno provider di rete e di alimentazione diversi e, pertanto, è improbabile che falliscano contemporaneamente. I provider di servizi cloud incoraggiano l'esecuzione di servizi in più zone di disponibilità per l'alta disponibilità, ma i dati che si spostano da una zona all'altra vengono sottoposti a misurazione e possono essere addebitati per gigabyte.
Le organizzazioni ottengono diversi vantaggi quando trasferiscono i sistemi IT in un modello di cloud computing. Tra i vantaggi ci sono: lo sblocco del valore aziendale della moderna economia del cloud, miglioramenti dell'IT più rapidi, livelli di disponibilità più elevati e accesso anticipato a nuove tecnologie, come il machine learning e l'intelligenza artificiale.
Tuttavia, un aspetto potenzialmente "nascosto" dell'economia del cloud è l'uscita dei dati, che può assumere più forme. I provider di servizi cloud monitorano e misurano il traffico di rete che passa da una posizione all'altra nel cloud, da una regione all'altra, da una zona all'altra o anche da una rete virtuale all'altra nella stessa area.
Il traffico in entrata, ovvero i dati che entrano nel cloud, ossia il data ingress, è quasi sempre gratuito, indipendentemente dal volume, in tutti i provider cloud. Il traffico in uscita (ovvero il data egress) viene trattato in modo diverso. Indipendentemente dal fatto che i dati siano diretti su Internet, ai data center on-premise, agli uffici o a un'altra cloud region, i costi vengono valutati a tariffe variabili a seconda del fornitore di servizi cloud, del servizio specifico e del percorso di rete. In genere, l'uscita dei dati ha un prezzo fisso per gigabyte fino a una certa soglia, con sconti applicati per la trasmissione dei dati oltre tale livello.
Il traffico in uscita dei dati cloud può essere il traffico di rete standard dalle virtual machine cloud ad altre virtual machine cloud, come i dati che si spostano da un database al foglio di calcolo di un utente business. Un altro esempio, e una preoccupazione più significativa in termini di costi, è il traffico relativo agli asset di storage ospitati su cloud utilizzati sui siti Web o nelle applicazioni mobili. Una pratica abituale per i cloud object stores è quella di ospitare gli asset dei siti Web separatamente dall'applicazione del sito Web; ciò migliora le prestazioni e l'efficienza di sviluppo. In questa architettura, un sito Web caricherebbe le immagini direttamente da un'area di memorizzazione degli oggetti cloud, ad esempio Amazon Web Services (AWS) S3, Azure Blob Storage, Google Cloud Storage oppure Oracle Cloud Infrastructure (OCI) Object Storage, dove tali file esistono come endpoint HTTP, anziché memorizzare tali file in un server Web. Quando le immagini vengono caricate direttamente dallo storage cloud, l'applicazione comporterà costi sia per le operazioni di lettura nello storage sia per i costi di rete associati al trasferimento di tali dati dal cloud a Internet.
Le applicazioni Web occupate possono avere istanze in più aree cloud e la memorizzazione delle immagini in un account cloud in una singola area remota può comportare addebiti elevati per l'uscita dei dati. Sebbene un sito Web o un'applicazione importante utilizzerebbe probabilmente una rete di distribuzione dei contenuti (Content Delivery Network) per ridurre i costi e migliorare le prestazioni, i siti nuovi o in rapida crescita potrebbero non essere progettati per utilizzare le CDN e quindi potrebbero incorrere in costosi costi di uscita.
Questi sono solo alcuni esempi di uscita dei dati nelle applicazioni cloud. Il traffico tra le virtual machine e le istanze di database, il peering della rete virtuale, i collegamenti privati alle offerte Platform-as-a-Service e altre architetture possono comportare costi di uscita significativi.
Concetti chiave
I provider di servizi cloud addebitano l'uscita dei dati per recuperare i costi dell'infrastruttura associati alla creazione di grandi reti che vanno nei loro data center e alla larghezza di banda tra i siti, il che può costare milioni o miliardi di dollari. Investire in reti sottomarine, come ha fatto Microsoft nel 2017 quando ha costruito un cavo sottomarino di 4.104 miglia tra la costa orientale degli Stati Uniti e la Spagna, è un esempio degli investimenti dei fornitori di servizi cloud in infrastrutture di rete su larga scala per collegare i propri data center.
I fornitori di servizi cloud investono costantemente anche per garantire l'affidabilità e le prestazioni di queste reti e i costi di uscita supportano tali investimenti. I clienti traggono vantaggio dal non dover pianificare e lavorare con più fornitori per sviluppare una rete globale. Sebbene i costi di uscita dei dati cloud possano essere frustranti, fanno parte del prezzo che le organizzazioni devono pagare per sfruttare l'infrastruttura cloud pubblica a livello mondiale.
Una differenza significativa tra le distribuzioni di cloud pubblico e on-premise è che nel cloud pubblico tutti gli addebiti sono su un'unica fattura. D'altra parte, le implementazioni on-premise in genere comportano fatture separate per storage, server, componenti di rete e servizi che probabilmente sono stati acquistati da più fornitori e in momenti diversi. Le organizzazioni pagano anche separatamente l'alimentazione e il raffreddamento o l'affitto dei data center per una struttura di colocation, nonché per vari costi di software e supporto. Vedere gli addebiti equivalenti del servizio cloud per tutto ciò su una singola fattura può essere uno shock per i manager IT non preparati.
Inoltre, la maggior parte delle spese associate alle implementazioni on-premise è fissa, mentre i provider di cloud pubblico offrono molte soluzioni di elaborazione a costi variabili. I costi variabili possono essere vantaggiosi perché aumentano e diminuiscono man mano che i requisiti di elaborazione aumentano e diminuiscono, quindi le organizzazioni possono evitare di pagare in eccesso per capacità di cui non hanno bisogno. Sebbene questo modello di costo variabile sia spesso utile per i servizi cloud con modelli di domanda in continua evoluzione, configurazioni errate o progettazione scadente possono portare a fatture cloud di grandi dimensioni.
I costi di uscita dei dati vengono calcolati in diversi modi, a seconda del tipo di servizio e del provider cloud. Tuttavia, il processo di base è lo stesso.
Per avere un'idea di cosa questo potrebbe significare nel mondo reale, considera che la dimensione media di tutte le pagine sul web era di 2.315 kilobyte a giugno 2022, secondo il Web Almanac di HTTP Archive. Supponiamo che un sito web ospitato su cloud comprenda pagine di dimensioni medie e riceva 10.000 visitatori mensili e ognuno visualizzi due pagine. Questo sito Web genererebbe circa 44,2 GB di dati cloud in uscita ogni mese:
10.000 x 2 = 20.000
20.000 x 2.315 KB = 46,3 miliardi di KB
46,3 miliardi di KB / 1 GB (1.048.576 KB) = 44.155 GB
Successivamente, diamo un'occhiata ad alcuni esempi reali dei costi di uscita dei dati cloud. Il primo è un esempio molto semplice basato sui prezzi di Azure a partire da giugno 2023 per il traffico da un server Web in uscita a Internet.
Ora esaminiamo uno scenario leggermente più complesso per un cliente AWS. Gli sviluppatori hanno caricato 1 TB di dati in un bucket di storage S3, quindi hanno trasferito 4 TB in un'area AWS al di fuori degli Stati Uniti e 2 TB su Internet. I costi a partire da giugno 2023 sarebbero i seguenti:
In questo scenario, i costi di storage rappresentano meno del 10% dei costi totali mensili per l'uscita dei dati. Il punto critico da capire è quanto traffico genererà un'applicazione o un servizio e quanto costerà per i tipi di servizi utilizzati. Un sito web ad alto volume potrebbe ridurre la spesa nell'esempio precedente utilizzando una rete di distribuzione dei contenuti (CDN) per ridurre la quantità di traffico che fluisce direttamente su Internet. Le CDN memorizzano i file di dati più vicini agli utenti previsti e nelle reti dei fornitori di CDN, quindi il costo netto dei loro servizi è generalmente molto inferiore ai costi di uscita dei dati per servire ogni volta gli stessi file dal cloud.
Vale la pena notare che Oracle Cloud Infrastructure offre ai clienti fino a 10 TB di dati in uscita ogni mese gratuitamente. Quindi, guardando l'esempio AWS, un cliente OCI pagherebbe solo 25,24 dollari in costi di storage dei dati per la stessa quantità di dati in uscita. Allo stesso modo, gli 882,18 dollari di spese di uscita dalla rete sostenute nell'esempio di Azure sarebbero inclusi nel costo della VM per i clienti OCI.
Come illustrato negli esempi precedenti, i costi di uscita dei dati possono aumentare rapidamente. Questo modello di costo non vincolato significa che potenziali configurazioni errate, come la connessione all'endpoint errato di un account di storage replicato geograficamente, possono portare a fatture cloud fuori controllo. Come fa un team IT a gestire questa realtà?
È fondamentale determinare prima le spese di uscita dei dati cloud anziché in seguito per ridurre al minimo i costi. I seguenti cinque suggerimenti possono aiutarti a:
Il monitoraggio e la gestione delle tariffe di uscita sono una sfida. Abbassarle è un'altra. Per ridurre i costi di uscita, i team IT aziendali devono approfondire lo stack tecnico.
Una rete CDN legge gli asset del sito Web di un'organizzazione una volta e li inserisce nella cache in una posizione edge molto più vicina al cliente. L'utilizzo di una CDN significa che quando un cliente richiede un'immagine o un file dal tuo sito Web, viene servito dalla CDN anziché direttamente dal tuo server Web ospitato su cloud. I costi di una CDN sono molto inferiori ai costi di uscita dei dati e le CDN consentono ai clienti di sperimentare tempi di caricamento migliori. Mentre l'utilizzo di una CDN può richiedere piccole modifiche al codice dell'applicazione, i vantaggi in termini di costi e prestazioni giustificano quasi sempre l'impresa.
Non è sempre possibile comprimere il traffico di rete, ma il traffico dell'infrastruttura, come da VM a VM su una rete virtuale, può comunemente essere compresso per un piccolo trade-off in cicli di CPU aumentati. Il costo incrementale dell'uso della CPU è di dimensioni inferiori alle tariffe di uscita dalla rete.
Molti servizi cloud, anche all'interno dello stesso provider cloud, offrono diversi modi per ottenere funzionalità quasi identiche. Ad esempio, ci sono quasi 20 modi per eseguire un container in AWS. Nell'ambito del processo di pianificazione, le organizzazioni devono valutare ogni approccio, inclusi gli addebiti di rete, che possono variare in modo significativo.
Una connessione di rete dedicata tra il provider cloud e il tuo sito può essere costosa, ma un collegamento privato ti dà un uso illimitato della connessione una volta acquistato. Per le organizzazioni che non possono evitare un volume elevato di dati in uscita dal cloud, questo investimento può effettivamente ridurre il Costo totale di proprietà.
In un modello di cloud ibrido, con una combinazione di sistemi on-premise e hosted, il passaggio a un modello "all-cloud" può ridurre la quantità di dati che escono dal cloud posizionando tutto in un unico punto.
Questi cambiamenti possono essere difficili da implementare, soprattutto per le applicazioni di produzione. In alcuni casi, potrebbero richiedere agli ingegneri delle applicazioni di apportare modifiche significative. Tuttavia, i risparmi sui costi spesso rendono utili questi sforzi. Mentre l'utilizzo di una connessione di rete dedicata, come ExpressRoute e Direct Connect, può richiedere il coordinamento con il provider cloud e di rete dell'organizzazione, sia i dati sui prezzi di Microsoft che Amazon escono su queste connessioni dirette con uno sconto rispetto al tasso di normale uscita.
Non sorprende che diversi fornitori di servizi cloud abbiano strutture di prezzo diverse. Ad esempio, Azure addebita il traffico da una rete virtuale ad altre reti virtuali connesse, anche all'interno della stessa area cloud. Pertanto, vale la pena valutare attentamente i costi di uscita dei dati, soprattutto quando si effettua la prima migrazione al cloud pubblico.
Oracle è ben consapevole degli elevati costi di uscita dei dati addebitati da altri provider cloud e ha lavorato per ridurre questi costi generando un vantaggio importante dei propri servizi cloud. Oracle Cloud Infrastructure (OCI) offre prezzi bassi per le reti che consentono alle aziende di spostare, a basso costo, volumi significativi di dati, inclusi i servizi che consumano spesso la massima quantità di larghezza di banda, come lo streaming video in diretta, servizi di videoconferenza e il gaming. Come con altri cloud, il trasferimento dei dati in entrata è gratuito; tuttavia, OCI offre 10 TB di dati in uscita ogni mese senza costi, notevolmente più dei 100 GB di AWS al mese, consentendo così alle organizzazioni di risparmiare in modo significativo sull'uscita dei dati. Inoltre, i costi della larghezza di banda in uscita di OCI sono fino al 25% inferiori rispetto ad AWS, il che è un grande vantaggio quando utilizzi servizi che richiedono grandi quantità di larghezza di banda.
Una delle principali considerazioni economiche sul cloud affrontate dai clienti cloud è la larghezza di banda per l'uscita dei dati dai servizi e dalle reti cloud. I costi associati possono essere una grande sorpresa nella fattura cloud e gli addebiti possono essere altamente variabili. Uno degli aspetti più importanti dell'architettura cloud è ridurre al minimo i costi di uscita sfruttando tecnologie come la compressione, le reti di distribuzione dei contenuti e i livelli di inserimento nella cache che possono migliorare le prestazioni di un sito o di un'applicazione e allo stesso tempo ridurre i costi.
Scopri tattiche rivoluzionarie, dal trasformare con l'intelligenza artificiale al perfezionare la tua strategia di M&A e all'adottare una leadership collaborativa, per aiutarti a crescere e superare le sfide di oggi, ma anche quelle di domani.
La tariffa di uscita è inclusa nello storage cloud?
No, una serie di fattori contribuisce al costo dello storage cloud. Il primo e più evidente è il volume di dati memorizzati nell'account o nel bucket di storage. Il secondo è il numero di letture e scritture dei dati durante il periodo di fatturazione. Entrambi i fattori sono influenzati dal livello (caldo, freddo, freddo o archivio) dei dati: più caldo è il livello, più basso è il costo associato a tali transazioni di lettura e scrittura, ma maggiore è il costo di storage per volume di dati. Questi addebiti transazionali sono separati dai costi di uscita dei dati sulla rete.
Quali sono i costi del cloud per l'ingresso e l'uscita dei dati?
I costi di entrata e uscita sono costi associati al trasferimento dei dati tra aree e zone cloud, da e verso Internet e da e verso le reti on-premise. L'ingresso dei dati (in entrata nel cloud) in genere è gratuito, ma tutti i provider addebitano l'uscita dei dati (in uscita dal provider cloud). I costi in uscita si basano sul volume di dati e sulla relativa posizione, come Internet, le zone di disponibilità e altre cloud region, e vengono definiti costi non associati o non limitati, il che significa che sono variabili e possono rappresentare una costosa sorpresa per i clienti cloud.
Perché AWS addebita l'uscita?
Come altri fornitori di servizi cloud, AWS addebita l'uscita dei dati nella maggior parte dei suoi servizi per coprire i costi di creazione e manutenzione della sua rete. AWS non include il costo dell'uscita dei dati nel prezzo dei servizi. Ciò consente ad Amazon di addebitare prezzi più bassi su servizi come macchine virtuali e bucket di storage. I clienti le cui applicazioni eseguono elevati livelli di uscita dei dati finiscono per pagare la fattura per quell'infrastruttura di trasmissione di rete, mentre i clienti le cui applicazioni trasferiscono meno dati pagano una percentuale minore.