Symptoms
Quando una snapshot viene eliminata, viene scansionata per liberare i blocchi di cui era proprietaria in modo esclusivo. Questo processo, aka reclaimer
, viene eseguito in background.
Maggiore è la dimensione dell'istantanea, maggiore sarà il tempo necessario per questa operazione. Al termine del processo di recupero, l'intero spazio liberato diventa disponibile per il volume.
Deve essere eseguito prima che sia possibile annullare il mapping dei blocchi utilizzando SCSI unmap
(se abilitata) nei volumi SAN back-end.
Il servizio di recupero si mette in coda per l'esecuzione quando vengono eliminati dati nel pool NAS, inclusi i dati eliminati da condivisioni, volumi NAS ed eliminazioni di snapshot.
Cause
Limitazioni e problemi noti
- Il servizio di recupero non può essere eseguito manualmente o arrestato per un periodo di tempo prolungato; una volta avviato, deve terminare la sua coda prima che lo spazio venga rilasciato nel pool NAS.
- Il recupero delle snapshot richiede un utilizzo intensivo delle risorse. Se si verificano molte attività di recupero contemporaneamente, possono verificarsi problemi di prestazioni in tutto il cluster.
- Le operazioni di recupero con un utilizzo intensivo delle risorse possono influire negativamente sulle prestazioni al punto da compromettere l'accesso dei client al cluster.
- Esiste un limite di creazione e scadenza delle istantanee che varia in base all'appliance in base al carico complessivo del sistema. Ciò potrebbe influire direttamente sul servizio di recupero e sulla funzionalità del sistema.
- Sebbene il servizio di recupero sia stato migliorato nel firmware FluidFS v6 per le eliminazioni di snapshot, è possibile che un servizio di recupero sovraccarico influisca sull'accesso dei client. Questi eventi sono segnalati come "
clients may encounter a long period of partial data access"
"Clients may encounter a long period of partial data access"
Verificare se i problemi di prestazioni si manifestano in prossimità della scadenza di alcune snapshot.
Esistono diversi tipi di snapshot:
- Snapshot manuali: snapshot che scadono quando vengono eliminate dall'amministratore o in base al tempo di scadenza impostato dall'amministratore.
- Snapshot pianificate: snapshot che scadono in base ai dettagli della pianificazione. I nomi dipendono dal nome della pianificazione.
- Snapshot NDMP (Network Data Management Protocol): istantanee che scadono al completamento del backup NDMP. I nomi iniziano con ndmp.
- Snapshot di replica: snapshot che scadono dopo il completamento della replica successiva. (Durante una replica sono presenti due snapshot, la snapshot precedente e quella corrente). I nomi delle snapshot di replica iniziano con rep.
Resolution
Scaglionamento delle attività delle snapshot (snapshot standard, di replica, NDMP)
Se molte snapshot scadono contemporaneamente, possono verificarsi problemi di prestazioni.
Anche meno snapshot, ma di dimensioni maggiori, che scadono contemporaneamente possono causare problemi di prestazioni.
Si consiglia di scaglionare le snapshot orarie nel tempo (a intervalli di 10 minuti) e di scaglionare le snapshot giornaliere nel corso della giornata (preferibilmente con scadenza durante la notte). La scadenza delle snapshot settimanali deve essere impostata preferibilmente nei fine settimana.
Affected Products
FS Series, Dell Compellent FS8600