SISTEMI RAID: cosa significa, a cosa serve?
RAID. Il termine sta a significare Redundant Array of Independent Disks, ovvero una serie ridondante di dischi indipendenti che genericamente si identificano in una solo archivio di massa.
A COSA SERVE ?
È un metodo molto comune per proteggere i dati delle applicazioni sia su unità a disco fisso che su storage allo stato solido.
A parlare per la prima volta di questa tecnica sono stati David A. Patterson, Garth A. Gibson e Randy H. Katz in un articolo pubblicato tra gli atti della SIGMOD Conference del 1988 e intitolato “A Case for Redundant Arrays of Inexpensive Disks (RAID)”.
L’obiettivo principale?
Combinare una serie di dischi a basso costo in modo da ottimizzare il sistema in termini di capacità, velocità ed affidabilità rispetto a un disco di ultima generazione.
Ne esistono diversi tipi che bilanciano il livello di protezione in base al loro prezzo: in sintesi, maggiore è la protezione, maggiore è il costo:
- I dischi più economici sono gli IDE (Integrated Drive Electronics), gli ATA (Advanced Technology Attachment), i SATA (Serial Advanced Technology Attachment) e gli M2 SSD (Solid State Drive)
- I dischi più costosi sono gli SCSI (Small Computer System Interface)
COME FUNZIONA UN DISCO ED UN SISTEMA RAID ?
In un computer o server con un disco fisso solamente, il sistema registra direttamente le informazioni nei piatti interni dell’hard disk, con la limitazione di scrittura e lettura alla velocità di bus al canale di collegamento del disco fisso. Nei sistemi invece RAID, collegando le singole unità fisiche (disco fisso singolo) in modo da formare un set, il RAID rappresenta tutte queste unità fisiche come un disco logico sul server. Questo disco logico è chiamato numero di unità logica (Logical Unit Number) o LUN. I dati, dunque, non vengono scritti direttamente ma vengono partizionati in sezioni (in inglese: stripes) di uguale lunghezza e trascritti su dischi differenti utilizzando un algoritmo preposto alla distribuzione dal controller del sistema RAID. Quando si richiede una lettura di dimensione superiore all’unità di sezionamento, il sistema RAID distribuisce il carico di lavoro su più dischi in parallelo, aumentando così le prestazioni.
Ma come collegare i dischi? In quale sequenza? Secondo quali parametri?
Per orientarsi tra le varie tipologie di livelli che caratterizzano le tecniche RAID è necessario capire nel dettaglio l’insieme di caratteristiche (numero minimo di dischi, capacità) e, di ogni livello, capire bene vantaggi e svantaggi.
Tradizionalmente sono stati usati 5 livelli originari di tipologia, ma con l’evolversi dei sistemi di archiviazione, il numero di livelli RAID è aumentato.
Quali sono i vantaggi ?
Il vantaggio principale dell’utilizzo di un sistema RAID è la capacità di conservazione dei dati memorizzati su unità guaste.
I livelli utilizzano:
- Il mirroring dei dati, ovvero quando i dati vengono scritti su più di un disco contemporaneamente
- Lo striping, ovvero quando i dati sono distribuiti su più unità a blocchi
- La parità, ovvero una metodologia che permette di avere la sicurezza che i dati siano stati scritti correttamente quando vengono spostati da un’unità all’altra.
- Una combinazione di queste tecniche
Che cosa è la parità e a cosa serve
Mentre il mirroring dei dati e lo striping sono tecnologie note a tutti, sia tecnici che no, l’indice di parità è un termine per gli addetti al settore. Si tratta, più in dettaglio, di un checksum dei dati che sono stati scritti sui dischi e che viene riportato insieme ai dati originali. Il checksum, infatti, è un valore che rappresenta il numero di bit in un messaggio di trasmissione e che viene utilizzato dai professionisti IT
per rilevare errori di alto livello all’interno delle trasmissioni di dati. Il valore di checksum in sé è in genere una lunga serie di lettere e numeri che agiscono come una sorta di impronta digitale per un file o un set di file per indicare il numero di bit inclusi nella trasmissione. Il server che accede ai dati su un set RAID basato sull’hardware, infatti, non sa se e quale delle unità nel set possa non essere andata a buon fine.
Grazie alla parità il controller ricrea i dati persi quando l’unità si guasta utilizzando le informazioni di parità memorizzate sui dischi sopravviventi nel set.
Livelli standard e non standard
La tipologia di ’ampio numero di livelli RAID può essere suddiviso in tre macrocategorie:
- Standard
- non standard
- nidificati
I livelli standard sono costituiti dai tipi base numerati da 0 a 6.
Un livello non standard è impostato sugli standard di una determinata azienda o associato a un progetto open source. I RAID non standard includono RAID 7, RAID adattativo, RAID S e Linux md RAID 10.
Il RAID nested si riferisce a combinazioni di livelli RAID come, ad esempio, RAID 01 – RAID 0 + 1, RAID 03 – RAID 0 + 3 e RAID 50 – RAID 5 + 0.
Guasti tipici
- Guasto di uno o più dischi membri del raid.
- Guasto o malfunzionamento temporaneo del controller.
- Riconfigurazione accidentale del NAS
- Perdita delle strutture del file system
In caso di perdita di dati da un sistema RAID, si consiglia vivamente di NON TOCCARE NULLA E DI NON FARE TENTATIVI, PENA LA PERDITA DEI VOSTRI DATI PER SEMPRE !.
Se devi recuperare file importanti da un NAS o da un sistema RAID eseguire operazioni del quale non si è del tutto sicuri non è una buona idea!