NAS RAID degradato: emergenza o no? Guida pratica

 

Hai acceso il NAS stamattina e c’è una spia rossa. Oppure hai ricevuto un’email di allerta automatica con scritto “volume degraded” o “array degraded”. O ancora: uno dei dischi non viene più riconosciuto e il sistema ti avvisa che il RAID non è più integro.

La prima reazione di molti è il panico. La seconda, spesso peggiore, è fare qualcosa di fretta senza capire cosa sta succedendo davvero. Entrambe le reazioni sono comprensibili, ma nessuna delle due aiuta.

 

Questo articolo serve a darti un quadro chiaro: cos’è uno stato degradato, cosa succede davvero dentro il NAS quando appare quell’allerta, quando puoi prenderti un po’ di tempo per ragionare, e quando invece ogni minuto conta. Non è un manuale tecnico — è una guida pratica per chi si trova davanti a una situazione che non ha mai gestito prima e deve capire rapidamente cosa fare.

recupero dati NAS

Cos’è un NAS e perché il RAID esiste

 

Prima di parlare di guasti, vale la pena chiarire due concetti di base. Se li conosci già, salta pure al paragrafo successivo.

 

Un NAS (Network Attached Storage) è un dispositivo di archiviazione collegato alla rete locale. Funziona come un piccolo server dedicato ai file: ci colleghi i computer dell’ufficio, i backup automatici, le cartelle condivise. Dentro ha uno o più dischi rigidi, e spesso è configurato con una tecnologia chiamata RAID.

 

Il RAID — acronimo di Redundant Array of Independent Disks — è un sistema che combina più dischi fisici in modo da ottenere vantaggi in termini di prestazioni, sicurezza dei dati, o entrambe le cose. L’idea centrale è che distribuendo i dati su più dischi, il sistema può sopravvivere alla rottura di uno di essi senza perdere nulla. Non è un backup — è ridondanza. La differenza è importante: il RAID ti protegge dal guasto hardware, non dall’errore umano o dal ransomware.

 

Quando uno dei dischi che compongono il RAID smette di funzionare correttamente, il sistema continua a girare ma segnala che la ridondanza è venuta meno. Questo stato si chiama degradato. Il volume è ancora accessibile, i file ci sono, ma il margine di sicurezza è esaurito: se si rompe un altro disco, o se quello rimasto ha qualche problema, i dati potrebbero diventare irrecuperabili.

Non tutti i RAID sono uguali

 

Capire che tipo di RAID hai cambia tutto nella valutazione della situazione. Configurazioni diverse hanno tolleranze diverse ai guasti, e quello che in un caso è gestibile con calma, in un altro è già un’emergenza

RAID 0

i dati vengono distribuiti su due o più dischi per aumentare le prestazioni, ma senza nessuna ridondanza. Se si rompe anche un solo disco, tutto il volume è perso. Tecnicamente un RAID 0 non può “degradarsi” — o funziona o collassa. Se il tuo NAS ha questa configurazione e uno dei dischi mostra problemi, è emergenza immediata.

RAID 1

due dischi che contengono esattamente gli stessi dati, uno come specchio dell’altro. Se uno si rompe, l’altro contiene tutto. Il volume continua a funzionare normalmente finché il disco superstite regge. Margine di tolleranza: un disco. È la configurazione più semplice da gestire in caso di guasto.

RAID 5

minimo tre dischi, con i dati distribuiti insieme a informazioni di parità che permettono di ricostruire il contenuto del disco mancante. Sopporta la perdita di un disco senza perdere dati. Se si rompe il secondo disco mentre il volume è già degradato, i dati sono persi senza possibilità di recupero automatico. Questa è la configurazione più comune nei NAS consumer e delle piccole imprese, ed è anche quella che genera più richieste di recupero dati quando le cose vanno storte.

RAID 6

come il RAID 5 ma con doppia parità, distribuita su almeno quattro dischi. Sopporta la perdita di due dischi contemporaneamente. Offre un margine di sicurezza maggiore, ma il rebuild è più lento e più stressante per i dischi rimasti.

RAID 10

combinazione di mirroring e striping su almeno quattro dischi. Regge bene ai guasti ma dipende da quali dischi si rompono: in certi casi sopporta due guasti, in altri uno solo è sufficiente a compromettere il volume.

Se non sai che tipo di RAID hai configurato, controllalo subito nell’interfaccia web del NAS — di solito si trova nella sezione “Storage Manager” o “Volume Manager” — prima di fare qualsiasi altra cosa. Questa informazione è fondamentale per capire quanto margine hai.

 


 

I segnali che il NAS ti manda

 

I NAS moderni sono abbastanza bravi a comunicare quando qualcosa non va. Il problema è che non sempre chi li gestisce sa interpretare correttamente quei segnali. Ecco i principali e cosa significano.

 

Notifica “volume degraded” o “array degraded” — il sistema ha rilevato che uno o più dischi non sono più attivi nel volume. Il RAID sta girando in modalità ridotta. Se la tua configurazione lo permette, i dati sono ancora accessibili.

 

Spia del disco rossa o arancione — quel disco specifico ha smesso di rispondere o ha superato una soglia di errori interni. Non sempre significa che il disco è fisicamente rotto: a volte è un problema di connessione, di firmware, o un errore temporaneo. Ma va trattato come un guasto finché non si dimostra il contrario.

 

Email di allerta con “disk failure” o “bad sector detected” — il sistema ha trovato settori danneggiati sul disco. Pochi settori in isolamento non sono necessariamente un segnale di crollo imminente, ma è un campanello d’allarme che va monitorato. Se il numero cresce rapidamente, il disco sta cedendo.

 

Il volume non si monta o le cartelle condivise non sono raggiungibili — situazione più grave. Il sistema non riesce più a presentare il volume al sistema operativo. Potrebbe essere un problema temporaneo risolvibile con un riavvio del NAS, ma se persiste è un segnale che qualcosa di più serio è in corso.

 

Rallentamenti anomali nell’accesso ai file — spesso sottovalutati, i rallentamenti improvvisi possono indicare che uno dei dischi sta aumentando i tempi di lettura a causa di settori problematici. Il RAID continua a funzionare, ma fa fatica a leggere quei blocchi e ci mette molto più tempo del solito. In alcuni casi questo è il primo segnale di un guasto che si manifesterà nei giorni successivi.

 


Quando non è un’emergenza immediata

 

Ci sono situazioni in cui lo stato degradato è serio — non va ignorato — ma non richiede di agire nei prossimi dieci minuti.

 

Il disco guasto è uno solo e il tuo RAID lo tollera. Se hai un RAID 5 con un disco in errore, o un RAID 1 con un disco che non risponde, il volume regge ancora. Hai tempo per procurarti un disco sostitutivo compatibile e pianificare la sostituzione in modo ordinato. Non frenetico, ordinato.

 

Il NAS continua a essere accessibile e i file si aprono normalmente. Finché puoi leggere e scrivere senza errori o rallentamenti evidenti, il sistema sta ancora lavorando correttamente sulla ridondanza rimasta. Questo non vuol dire che puoi aspettare settimane — vuol dire che hai qualche giorno per agire con criterio.

 

L’allerta è dovuta a un disco rimosso per errore o a un problema di connessione. Prima di concludere che il disco è morto, controlla i cavi SATA, verifica che il disco sia inserito correttamente nello slot, e prova a riavviare il NAS. A volte un falso allarme si risolve in pochi minuti. Se dopo il riavvio il disco torna online e il volume si ricostruisce automaticamente senza errori, probabilmente era un problema di contatto.

 

Gli errori S.M.A.R.T. sono presenti ma stabili. Il protocollo S.M.A.R.T. monitora continuamente lo stato di salute dei dischi e registra una serie di parametri interni. Alcuni valori fuori soglia — come i reallocated sectors — non indicano un collasso imminente se il numero non cresce nel tempo. Va monitorato, non ignorato ma nemmeno trattato come catastrofe immediata.

 

In tutti questi casi, la cosa più importante è non fare nulla di avventato e prepararsi alla sostituzione in modo informato. Un errore classico è inserire il disco nuovo e far partire il rebuild immediatamente, senza prima verificare lo stato di salute dei dischi rimasti. Se uno di essi è già in difficoltà, il processo di ricostruzione — che è un’operazione molto intensa per i dischi — potrebbe ucciderlo nel mezzo del lavoro, portando il volume al collasso completo.

 


Quando è emergenza vera

 

Ci sono situazioni in cui ogni ora persa aumenta il rischio in modo concreto, e in cui agire male è peggio che non agire affatto.

 

Più di un disco in errore contemporaneamente. Se il tuo RAID 5 mostra due dischi in stato “failed” o “missing”, il volume è a rischio immediato di collasso completo. Non toccare nulla: non inserire dischi nuovi, non avviare rebuild, non riavviare il NAS se non è strettamente necessario. Contatta SOSdati.com prima di fare qualsiasi altra operazione.

 

Il volume non è più montato e i file non sono accessibili. Il sistema sta già mostrando i sintomi di un collasso parziale o totale. In questo stato, continuare a usare il NAS — o anche solo riavviarlo ripetutamente — può sovrascrivere strutture interne e rendere il recupero molto più difficile o impossibile. Spegni il NAS e non riaccenderlo finché non hai parlato con qualcuno che sa cosa sta succedendo.

 

Il rebuild si è avviato automaticamente e si è bloccato a metà. Questa è una delle situazioni più critiche in assoluto. Il volume è in uno stato ibrido: né integro né completamente rotto. I metadati RAID sono parzialmente riscritti, alcuni blocchi del disco nuovo contengono dati ricostruiti mentre altri no. Continuare il rebuild senza capire perché si è bloccato può peggiorare irreversibilmente la situazione. Spegni il NAS e non riavviarlo.

 

Senti rumori anomali da uno dei dischi. Click ripetuti, raschiamenti, cigolii, o il disco che si avvia e si spegne in loop sono segnali di guasto meccanico imminente o in corso. In questo caso il disco sta morendo fisicamente, e ogni operazione di lettura o scrittura — incluso il rebuild — accelera il deterioramento. Con un disco meccanico danneggiato, il tempo è letteralmente il fattore critico.

 

Il NAS ha subito un’interruzione di corrente brusca durante un’operazione di scrittura. Un’interruzione durante la scrittura può corrompere le strutture del filesystem o della configurazione RAID. In questo caso anche un volume apparentemente integro va trattato con cautela: montarlo e accedervi normalmente prima di verificarne l’integrità può sovrascrivere dati parzialmente scritti che sarebbero altrimenti recuperabili.

 

Il NAS è stato colpito da ransomware. Se i file sul volume sono stati cifrati da un ransomware, spegnere immediatamente il NAS è la priorità assoluta — prima che la cifratura si estenda ad altri file o dispositivi collegati alla rete. Non pagare il riscatto senza prima aver consultato chi si occupa di recupero dati: in alcuni casi i file originali non cifrati sono ancora recuperabili dai dischi sottostanti.


Cosa fare nell’attesa (e cosa non fare)

Indipendentemente dal livello di gravità, ci sono alcune azioni che migliorano la situazione e altre che la peggiorano.

Fai subito:

  • Annota lo stato esatto di ogni disco così come lo vedi nell’interfaccia del NAS: online, degraded, failed, missing. Uno screenshot è ancora meglio.
  • Annota il tipo di RAID configurato, il numero di dischi, e la capacità di ciascuno.
  • Smetti di scrivere dati nuovi sul volume degradato: ogni scrittura occupa blocchi che potrebbero servire al recupero, e su un sistema già in difficoltà aumenta il carico sui dischi rimasti.
  • Se hai un backup recente, verificane l’integrità prima di fare affidamento su di esso. Non dare per scontato che funzioni solo perché esiste.
  • Se il NAS invia allerte via email, conserva quei messaggi: contengono informazioni utili su quando è iniziato il problema e quali dischi sono coinvolti.

Non fare:

  • Non avviare un rebuild senza aver prima verificato lo stato S.M.A.R.T. dei dischi rimasti. Un rebuild su un disco già malato è uno dei modi più comuni per trasformare una situazione gestibile in una catastrofe.
  • Non formattare, non reinizializzare il volume, non “resettare” la configurazione RAID anche se il sistema lo suggerisce come soluzione a un errore. Queste operazioni distruggono le strutture che permettono il recupero dei dati.
  • Non rimuovere tutti i dischi e inserirli in un altro NAS sperando che si rimontino automaticamente. Modelli e firmware diversi possono interpretare i metadati RAID in modo incompatibile e sovrascrivere informazioni critiche.
  • Non usare software di recupero dati consumer su un array RAID. Questi strumenti sono pensati per singoli dischi e non capiscono la struttura di un volume RAID: nel migliore dei casi non trovano nulla, nel peggiore riscrivono dati che sarebbero stati recuperabili.
  • Non cercare di “riparare” il filesystem con strumenti come chkdsk o fsck direttamente sul volume degradato. Queste operazioni modificano le strutture del disco e possono rendere il recupero professionale molto più complesso.

Una nota sul rebuild: perché va pianificato, non avviato d’impulso

 

Il rebuild è il processo con cui il NAS ricostruisce i dati del disco mancante sul disco nuovo, usando le informazioni di parità degli altri dischi. In teoria è la soluzione naturale a uno stato degradato. In pratica, è un’operazione che va pianificata con attenzione.

 

Durante il rebuild, tutti i dischi rimasti vengono letti dall’inizio alla fine in modo sequenziale e intensivo. È il momento in cui un disco che stava reggendo silenziosamente con qualche settore problematico può cedere definitivamente, perché la lettura completa mette a nudo tutti i punti deboli. Un rebuild fallito a metà lascia il volume in uno stato ibrido da cui il recupero è molto più complesso.

 

Per questo, prima di inserire il disco sostitutivo e dare il via al rebuild, è sempre meglio eseguire un test S.M.A.R.T. esteso su tutti i dischi ancora attivi nel volume. Il test richiede alcune ore, ma è un investimento di tempo che può evitare un disastro. Se uno dei dischi mostra reallocated sectors in aumento, pending sectors non risolti, o uncorrectable errors, non è il momento di avviare il rebuild: è il momento di chiamare qualcuno che sappia gestire la situazione in modo controllato.

 

Molti NAS avviano il rebuild automaticamente non appena viene inserito un disco nuovo. Se vuoi evitarlo, configura il NAS in modo che ti chieda conferma prima di avviare qualsiasi ricostruzione — la maggior parte dei sistemi lo permette nelle impostazioni avanzate dello storage manager.

 


Quanto tempo ho prima che la situazione peggiori?

 

Non esiste una risposta universale, ma ci sono alcuni fattori che aiutano a stimare la finestra temporale a disposizione.

 

Un RAID 5 con un disco in errore su dischi in buona salute può reggere settimane in stato degradato senza problemi. Ma se i dischi hanno già qualche anno di servizio intensivo, quel margine si riduce in modo significativo. I dischi che lavorano insieme tendono ad avere cicli di vita simili: se uno si è rotto, gli altri potrebbero essere prossimi allo stesso punto. Questo fenomeno è abbastanza comune da avere un nome: “URE” — Unrecoverable Read Error — e si manifesta proprio durante il rebuild, quando il disco superstite incontra un settore che non riesce a leggere.

 

La temperatura è un fattore spesso sottovalutato. Un NAS in un locale mal ventilato, con le temperature estive, accelera il deterioramento dei dischi in modo significativo. Se il NAS è in un armadio chiuso o vicino a fonti di calore, è un rischio aggiuntivo da tenere presente.

 

Anche il carico di lavoro conta: un NAS usato intensamente durante le ore lavorative mette più stress sui dischi rimasti rispetto a uno che viene acceduto raramente.

 

La risposta onesta è: non sai quanto tempo hai. Per questo la cosa più saggia, in presenza di uno stato degradato, è agire prima possibile — anche se non c’è panico.

 


Quando contattare un laboratorio specializzato

 

Se sei in una delle situazioni di emergenza descritte sopra, o se il rebuild è fallito, o se il volume non si monta più, la cosa più sicura è non fare altri tentativi in autonomia e contattare SOSdati.com.

 

Il recupero dati da RAID è un’operazione che richiede competenze specifiche: bisogna lavorare su ogni disco singolarmente, ricostruire la configurazione dell’array — ordine dei dischi, dimensione dei blocchi, algoritmo di parità — e recuperare i dati in modo controllato, spesso senza mai montare il volume originale. Ogni tentativo improvvisato riduce le probabilità di successo.

 

Più la situazione viene portata all’attenzione di un laboratorio nelle prime fasi — prima che ci siano stati rebuild falliti, riavvii ripetuti, o tentativi di riparazione software — maggiori sono le possibilità di recuperare tutto. Non è una questione di allarmismo: è semplicemente che i dati che esistono oggi potrebbero non esistere più dopo un’operazione sbagliata.

 

Se hai dubbi su cosa sta succedendo al tuo NAS, descrivi la situazione a chi lavora su questi casi ogni giorno: puoi contattarci direttamente su sosdati.com.

 

 

 

 

Domande frequenti

Il NAS è degradato ma i file si aprono ancora. Posso continuare a lavorare?
Tecnicamente sì, ma non è una buona idea. Ogni scrittura aumenta il carico sui dischi rimasti e occupa blocchi che potrebbero servire al recupero. Usa il NAS il meno possibile finché non hai risolto il problema, e inizia subito a copiare i file più critici su un supporto esterno.
Ho già sostituito il disco e avviato il rebuild. Si è bloccato al 30%. Cosa faccio?
Spegni il NAS. Non riavviarlo, non riprovare il rebuild. Contatta SOSdati.com e descrivi esattamente cosa è successo, incluso a che percentuale si è bloccato e se c’erano messaggi di errore visibili nell’interfaccia.
Posso copiare i file su un altro disco prima di fare qualsiasi cosa?
Se il volume è ancora accessibile e i dischi rimasti sono in buona salute, fare un backup di emergenza è la prima cosa sensata da fare. Ma fallo con attenzione: un’operazione di copia intensa su un sistema già degradato è comunque un rischio. Inizia dai file più importanti e dai quelli che non puoi permetterti di perdere.
Il mio NAS ha 4 dischi in RAID 5 e ne sono andati 2. I dati sono persi?
Non necessariamente. Con due dischi in errore in un RAID 5, il volume non è più accessibile normalmente, ma i dati fisicamente sui dischi ci sono ancora. Il recupero richiede un lavoro specializzato: è più complesso e costoso rispetto a un singolo disco guasto, ma spesso è possibile recuperare gran parte o tutto il contenuto. La priorità è non fare altri tentativi che possano sovrascrivere quei dati.
Il RAID è un backup?
No. È un errore molto comune pensare che un NAS in RAID sostituisca il backup. Il RAID protegge dalla rottura di un disco, non dalla cancellazione accidentale, dal ransomware, da un guasto dell’alimentatore che danneggia tutti i dischi contemporaneamente, o da un incendio. Un backup vero prevede copie su supporti separati, preferibilmente in luoghi diversi.
Quanto costa il recupero dati da un NAS?
Dipende da molti fattori: il tipo di RAID, il numero di dischi, il tipo di guasto, e quanto la situazione è stata complicata da tentativi precedenti. Non esiste un prezzo fisso. Noi facciamo sempre una diagnosi preliminare prima di procedere, per darti un quadro preciso di cosa è recuperabile e a quale costo.