Symptoms
스냅샷이 삭제되면 해당 스냅샷이독점 소유한 블록을 비울 수 있도록 스캔이 이루어집니다. 리클레이머라고도 하는 이 프로세스는 백그라운드에서 수행됩니다.
스냅샷이 클수록 작업 시간이 늘어납니다. 리클레이머 프로세스가 완료되면 확보된 전체 여유 공간을 해당 볼륨에서 사용할 수 있게 됩니다.
백엔드 SAN 볼륨에서 scsi unmap(활성화된 경우)을 사용하여 블록을 매핑 해제할 수 있으려면 이 작업을 먼저 실행해야 합니다.
공유, NAS 볼륨 및 스냅샷 삭제에서 삭제된 데이터를 포함하여 NAS 풀에서 데이터가 삭제될 때 리클레이머 대기열이 실행됩니다.
Cause
알려진 제한 사항 및 문제
- 리클레이머 서비스는 수동으로 실행하거나 장시간 멈출 수 없습니다. 일단 시작되면 대기열을 완료해야만 그다음에 NAS 풀에서 공간을 사용할 수 있습니다.
- 스냅샷 재확보 작업은 리소스를 많이 사용합니다. 다수의 재확보 작업이 동시에 발생하는 경우 클러스터 전체에서 성능 문제를 일으킬 수 있습니다.
- 리소스 집약적인 재확보 작업은 성능에 영향을 미쳐 클러스터에 대한 클라이언트 액세스에 영향을 줄 수 있습니다.
- 전체 시스템 로드에 따라 어플라이언스별 스냅샷 생성/만료 제한이 다릅니다. 이는 리클레이머 및 시스템 기능에 직접 영향을 줄 수 있습니다.
- FluidFS 펌웨어 v6에서 스냅샷 삭제를 위해 리클레이머가 개선되었지만, 리클레이머 서비스가 과부하되어 클라이언트 액세스에 영향을 줄 수 있습니다. 이러한 이벤트는 "장기간 클라이언트가 일부 데이터에만 액세스할 수 있음"으로 보고됩니다.
"장기간 클라이언트가 일부 데이터에만 액세스할 수 있음"
일부 스냅샷이 만료되는 시점에 성능 문제가 발생하는지 확인합니다.
스냅샷에는 여러 가지 유형이 있습니다.
- 임시 스냅샷 - 관리자가 삭제할 때 또는 관리자가 설정한 만료 시간에 따라 만료되는 스냅샷입니다.
- 예약 스냅샷 - 예약 세부 정보에 따라 만료되는 스냅샷입니다. 이름은 예약 이름을 기준으로 합니다.
- NDMP 스냅샷 - NDMP 백업이 완료될 때 만료되는 스냅샷입니다. 이름이 NDMP로 시작합니다.
- 복제 스냅샷 - 후속 복제가 성공적으로 완료된 후 만료되는 스냅샷입니다. (복제 중에는 두 개의 스냅샷, 즉 이전 스냅샷과 현재 스냅샷이 있습니다.) 복제 스냅샷 이름은 rep로 시작합니다.
Resolution
스냅샷 작업에 시차 두기(표준 스냅샷, 복제, NDMP)
많은 스냅샷이 동시에 만료되면 성능 문제가 발생할 수 있습니다.
수는 적지만 크기가 큰 스냅샷이 동시에 만료되어도 성능 문제가 발생할 수 있습니다.
시간별 스냅샷의 경우 10분 단위로, 일별 스냅샷의 경우 (가급적 밤에 만료되도록) 시간 차이를 두는 것이 좋습니다. 주간 스냅샷은 주말에 만료되는 것이 좋습니다.
Affected Products
Dell Compellent FS8600