Symptoms
Quando una snapshot viene eliminata, viene scansionata per liberare i blocchi di cui era proprietaria in modo esclusivo. Questo processo, noto anche come servizio di recupero, viene eseguito in background.
Maggiore è la dimensione della snapshot, maggiore sarà il tempo necessario per questa operazione. Al termine del processo di recupero, l'intero spazio liberato diventa disponibile per il volume.
Deve essere eseguito prima di annullare il mapping dei blocchi utilizzando scsi unmap (se abilitato) nei volumi SAN di back-end.
Il servizio di recupero si mette in coda per l'esecuzione quando vengono eliminati dati nel pool NAS, inclusi i dati eliminati da condivisioni, volumi NAS ed eliminazioni di snapshot.
Cause
Limitazioni e problemi noti
- Il servizio di recupero non può essere eseguito manualmente o arrestato per un periodo di tempo prolungato; una volta avviato, deve terminare la sua coda prima che lo spazio venga rilasciato nel pool NAS.
- Il recupero delle snapshot richiede un utilizzo intensivo delle risorse. Se si verificano molte attività di recupero contemporaneamente, possono verificarsi problemi di prestazioni in tutto il cluster.
- Le operazioni di recupero con un utilizzo intensivo delle risorse possono influire negativamente sulle prestazioni al punto da compromettere l'accesso dei client al cluster.
- Esiste un limite di creazione/scadenza delle snapshot che varia a seconda all'appliance in base al carico complessivo del sistema. Ciò potrebbe influire direttamente sul servizio di recupero e sulla funzionalità del sistema.
- Sebbene il servizio di recupero sia stato migliorato nel firmware FluidFS v6 per le eliminazioni di snapshot, è possibile che un servizio di recupero sovraccarico influisca sull'accesso dei client. Questi eventi vengono segnalati come "clients may encounter a long period of partial data access"
"Clients may encounter a long period of partial data access"
Verificare se i problemi di prestazioni si manifestano in prossimità della scadenza di alcune snapshot.
Esistono diversi tipi di snapshot:
- Snapshot ad hoc: snapshot che scadono quando vengono eliminate dall'amministratore o in base alla scadenza impostata dall'amministratore.
- Snapshot pianificate: snapshot che scadono in base ai dettagli della pianificazione. I nomi dipendono dal nome della pianificazione.
- Snapshot NDMP: snapshot che scadono al termine del backup NDMP. I nomi iniziano con ndmp.
- Snapshot di replica: snapshot che scadono dopo il completamento della replica successiva. (Durante una replica sono presenti due snapshot, la snapshot precedente e quella corrente). I nomi delle snapshot di replica iniziano con rep.
Resolution
Scaglionamento delle attività delle snapshot (snapshot standard, di replica, NDMP)
Se molte snapshot scadono contemporaneamente, possono verificarsi problemi di prestazioni.
Anche meno snapshot, ma di dimensioni maggiori, che scadono contemporaneamente possono causare problemi di prestazioni.
Si consiglia di scaglionare le snapshot orarie nel tempo (a intervalli di 10 minuti) e di scaglionare le snapshot giornaliere nel corso della giornata (preferibilmente con scadenza durante la notte). La scadenza delle snapshot settimanali deve essere impostata preferibilmente nei fine settimana.
Affected Products
Dell Compellent FS8600