Che cosa si intende per RPO?
Per obiettivo di punto di ripristino (Recovery Point Objective o RPO) si intende generalmente il calcolo della quantità di dati che è ragionevolmente accettabile perdere in caso di interruzione dell'attività prima che l'azienda subisca danni significativi, nel periodo fra un evento scatenante e l'ultimo backup dei dati.
L'RPO aiuta a stabilire quanti dati può permettersi di perdere un'azienda durante un evento imprevisto.
Che cosa si intende per RTO?
Per obiettivo di tempo di ripristino (Recovery Time Objective o RTO) si intende spesso la durata accettabile di inattività di un'applicazione, di un sistema e di un processo prima che l'azienda subisca danni significativi, e il tempo impiegato per ripristinare l'applicazione e i relativi dati per riprendere le normali attività aziendali dopo un problema significativo.
Il calcolo dell'obiettivo di tempo di ripristino (RTO) è di importanza cruciale per il piano di disaster recovery della tua azienda.
Qual è la differenza tra obiettivo di punto di ripristino e obiettivo di tempo di ripristino?
Benché simili nelle metriche di misurazione, i due obiettivi differiscono perché uno dà la priorità ai dati, e l'altro alle applicazioni:
Finalità
L'obiettivo di punto di ripristino (RPO) riguarda la quantità massima di dati persi, e facilita la messa a punto di una strategia di backup. L'obiettivo di tempo di ripristino (RTO) riguarda il tempo necessario per il ripristino, e facilita la messa a punto di una strategia di disaster recovery.
Priorità
Mentre gli RTO si concentrano sul ripristino delle applicazioni e dei sistemi per consentire la ripresa delle normali attività, gli RPO riguardano esclusivamente la quantità di dati persi in seguito a un guasto dei sistemi. Tuttavia, l'RPO non tiene conto solo dei dati persi; calcola anche il rischio e l'impatto sulle transazioni complessive dei clienti, più che la durata dell'interruzione delle attività aziendali.
Costo
Anche i costi variano tra i due obiettivi. I costi associati al rispetto di un RTO impegnativo possono superare quelli di un RPO granulare, poiché l'RTO calcola il tempo necessario per ripristinare l'intera infrastruttura aziendale, non solo i dati.
Automazione
Dal momento che gli RPO richiedono l'esecuzione di backup programmati a intervalli adeguati, i backup dei dati si possono automatizzare e implementare con facilità. Invece, la cosa è praticamente impossibile nel caso degli RTO, perché coinvolgono tutto il personale IT nel processo di ripristino.
Variabili del calcolo
Poiché prevedono un minor numero di variabili, gli RPO possono essere più facili da calcolare data l'uniformità di utilizzo dei dati. Per calcolare l'RTO, il processo di solito è leggermente più complicato perché i tempi di ripristino dipendono da vari fattori, fra cui intervalli analogici e il giorno in cui si verifica l'evento. Un RPO più breve comporta una minore perdita di dati ma richiede più backup, più capacità di storage e più risorse di elaborazione e di rete per l'esecuzione dei backup. Un RPO più lungo è più conveniente, ma comporta una maggiore perdita di dati.
Le variabili del calcolo possono essere diverse anche a seconda della classificazione dei dati. Per qualunque azienda, è buona norma distinguere i dati separando quelli di livello critico da quelli di livello non critico, stabilendo in anticipo gli RPO e gli RTO in ordine di priorità.
Esempi di RPO e RTO
Per spiegare la differenza tra RTO e RPO, prendiamo come esempio una banca, ma in due situazioni diverse:
Alle 9 di mattina, un'applicazione viene compromessa sul server principale della banca, con un'interruzione di 5 minuti dei servizi locali e online. L'RPO della banca prevede 15 minuti di perdita di dati, mentre l'RTO prevede 10 minuti di tempo per ripristinare il funzionamento dei sistemi e delle applicazioni. La banca ha quindi rispettato i parametri di entrambi gli obiettivi.
Alle 3 di mattina, la stessa banca subisce un arresto di un'ora dei sistemi. Poiché l'RPO prevede solo 15 minuti di perdita di dati e l'obiettivo di tempo di ripristino prevede solo 10 minuti di interruzione operativa, non si è tenuto conto di 50 minuti di arresto dei sistemi. Tuttavia, a causa dell'orario in cui si è verificato l'arresto, la perdita di dati non è stata esponenziale perché la procedura di ripristino è avvenuta in un momento di traffico ridotto per la banca.
Come ridurre RPO e RTO?
I due obiettivi di ripristino devono essere definiti simultaneamente, considerando il tempo, il denaro e la reputazione dell'azienda. Con la collaborazione e il contributo di tutti i reparti si dovrebbe riuscire a formulare un'analisi affidabile dell'impatto sull'azienda. Le informazioni devono riguardare le modalità operative dei reparti, i dati che gestiscono e l'impatto su tutti gli utenti per consentire di stabilire in anticipo l'ordine di priorità degli RPO e degli RTO più critici.
A partire da queste informazioni soltanto, è possibile confrontare i costi delle interruzioni operative con l'impatto sull'azienda, esaminando variabili come perdite in termini di utili, di stipendi, di valore azionario e la spesa per il ripristino, e quindi prevedendo il peggior incidente che potrebbe capitare all'azienda. In questo modo, i dirigenti possono stilare il piano di continuità operativa e implementare protocolli adeguati di protezione e recupero dei dati.
Ottimizzazione a lungo termine di RPO e RTO
Con la crescita dell'azienda, i valori di questi due parametri chiave cambieranno sicuramente. Pertanto, la valutazione, i test e la misurazione costanti degli RTO e degli RPO consentiranno una programmazione adeguata del disaster recovery per sopperire alle eventuali lacune impreviste che potrebbero emergere. I tre aspetti principali per ridurre l'impatto complessivo sull'azienda (e sulle sue casse) sono (l'elenco non è esaustivo):
Frequenza dei backup
Backup più frequenti consentono di disporre di un volume di dati maggiore a cui accedere in caso di emergenza, limitando sia la perdita di dati che il tempo necessario per ripristinarli.
Ripristino di blocchi
Per risparmiare tempo e denaro si possono isolare blocchi chiave di dati mission-critical modificati dopo l'esecuzione dell'ultimo backup. In questo modo i backup dei dati includeranno solo le informazioni che sono state modificate in quel determinato periodo.
Replica
Se si replicano i dati si potrà contare immediatamente su una copia dei dati in caso di emergenza, e questo riduce gli obiettivi di tempo di ripristino. L'RPO sarà determinato dalla frequenza con cui vengono replicati i dati. Secondo una regola generale, a una replica più frequente corrisponde un RPO più basso.
Test degli obiettivi RPO e RTO
Come per qualsiasi elemento dell'attività aziendale, dal marketing ai processi, dall'hardware al software, gli RPO e gli RTO non sostituiscono i test e le misurazioni. Di seguito illustriamo tre modi per mantenere e migliorare gli obiettivi per garantire la continuità operativa a seconda delle minacce e dei rischi potenziali per l'azienda.
Controlli periodici dei backup dei dati
Controlla periodicamente i parametri principali dei backup, esaminando variabili come le regole di conservazione, i punti di ripristino granulare, l'automazione e la protezione, aumentando il numero di snapshot dei dati critici di cui disponi. L'obiettivo è considerare tutte le misure per proteggere i dati se si verifica un'emergenza.
Riesame e miglioramento
Riesamina periodicamente il piano di disaster recovery, valutando i ruoli dei dipendenti chiave, i processi di backup e le modifiche all'hardware. Il piano sarà influenzato dall'RTO e dall'RPO più recenti: dal momento che i due obiettivi vanno di pari passo, aggiorna tutti gli elementi a intervalli regolari durante l'anno.
La regola 3-2-1 vale sempre
Conservare almeno tre copie dei dati in due posizioni di storage indipendenti con una copia archiviata off-site può salvare i tuoi dati se una delle posizioni di storage diventa inaccessibile o viene compromessa da un errore umano, una calamità naturale o un attacco informatico.
Che sviluppo potrebbero avere RTO e RPO nel tempo?
Per stabilire quanto potrebbe costare un'emergenza alla totalità della tua azienda, considera il costo dell'inattività dei sistemi: le conseguenze per la produttività dei dipendenti, le ore fatturabili non lavorate, le vendite online sfumate per l'inaccessibilità di un sito, le sanzioni per il mancato rispetto degli obblighi di conformità, l'impatto sugli ambienti virtuali e così via.
Un altro aspetto che può influire sulla priorità e persino sulla definizione degli RPO e degli RTO è lo sviluppo interno ed esterno dell'azienda. Modifiche sostanziali come la fornitura di nuovi servizi, riorganizzazioni strutturali e del personale, aumento dei volumi di dati, cambi di sede, ecc. possono modificare completamente gli obiettivi. In casi come questi, eseguire test e riesami periodici è una necessità assoluta per garantire l'affidabilità del disaster recovery.
RTO e RPO per il ripristino da qualunque situazione di emergenza
L'RTO e l'RPO mettono a confronto le variabili più critiche con lo scenario più pessimistico e rappresentano una difesa contro i potenziali disastri in cui potrebbe incorrere l'azienda. Mantienili aggiornati e in linea con tutte le metriche aziendali critiche: questo permetterà ai tuoi tecnici IT di stabilire le priorità delle applicazioni e di calcolare la durata massima accettabile di una potenziale interruzione operativa. Questi elementi costituiranno una base attendibile per la valutazione del rischio per implementare servizi di failover adeguati e assicurare quindi un'elevata disponibilità di tutte le applicazioni business-critical, anche in caso di emergenza.
Pianificazione e protezione proattiva con Acronis Disaster Recovery
In qualunque situazione di disaster recovery, ogni secondo è importante. Anche con dei backup completi dell'immagine dei dischi di un intero server, le aziende devono comunque ripristinare il sistema spostando i dati dallo storage di backup all'hardware dell'ambiente di produzione. L'operazione può richiedere ore, per non parlare delle conseguenze per l'azienda in sé.
Con oltre 15 anni di esperienza nel settore, 200.000 attacchi evitati e la gestione di oltre 5000 petabyte di dati in tutto il mondo, Acronis si può definire un'autentica paladina della Cyber Security, senza timore di esagerare.
Acronis Cyber Protection, l'unica soluzione anti-ransomware attiva basata su intelligenza artificiale in commercio, offre un piano di disaster recovery che integra obiettivi RPO e RTO e facilita la protezione di tutti i dati per qualsiasi ambiente, deployment, workload e storage, con qualsiasi metodo di ripristino.
Potenzia subito il tuo piano di continuità operativa con Acronis.