목차
1. 소개
2. 설명
3. 해결 방법
4. 추가 정보
S.M.A.R.T. (Self-Monitoring, Analysis and Reporting Technology, 주로 SMART로 표기)는 국제적으로 표준화된 하드 드라이브 및 솔리드 스테이트 드라이브에 대한 상태 모니터링 시스템입니다.
SMART의 주요 기능은 발생 가능한 하드웨어 결함 예측을 통해 장애가 발생하기 전에 하드웨어를 교체하고 데이터의 무결성을 유지하기 위해 드라이브 신뢰성의 다양한 지표를 감지 및 보고하는 것입니다.
Dell EMC는 이러한 가치를 위해 하드 드라이브 공급업체와 협업하고 있습니다.
일부 엔터프라이즈 하드 드라이브의 SMART 상태를 검토하는 동안 일부 모델에서 높은 읽기 및 ECC(오류 수정 코드) 확인 수정 비율이 확인될 수 있습니다. 이러한 값을 다른 하드 드라이브와 비교하면 일부 특정 하드 드라이브 모델의 오류 비율이 ECC 수정이 없는 것으로 보고될 수 있는 다른 모델보다 훨씬 높다는 것을 의미할 수 있습니다. 경우에 따라 이 오류 비율은 수억 개의 ECC 수정으로 표시되며 더 많은 I/O 트랜잭션이 발생할 때 빠르게 증가할 수 있습니다.
이러한 상황의 예는 다음과 같습니다. 이 예는 Linux OS에서 "smartctl -a /dev/sdX" 명령을 실행하여 수집했습니다.
그림 1: 오류 카운터 로그
참고: Smartctl 애플리케이션은 물리적 디스크의 상태를 쿼리하기 위한 오픈 소스 툴인 smartmontools의 구성 요소입니다.
참고: 엔터프라이즈 하드 드라이브에서 표시되고 smartmontools와 같은 타사 유틸리티로 해석되는 SMART 로그는 디바이스의 실제 ECC 오류 수를 나타내지 않을 수 있습니다.
SMART 사양을 통해 공급업체는 위 정보 목적의 예에 표시된 것과 같은 카운터를 제공할 수 있습니다. 카운터가 항상 ECC 로직 내에서 소프트 또는 하드 오류의 수를 나타내는 것은 아닙니다. 이를 통해 각 드라이브 공급업체는 사용 가능한 SMART 필드에 표시할 내용을 유연하게 선택할 수 있습니다. 일부 공급업체의 경우 ECC 읽기 또는 검증 범주에 오류 데이터가 표시되지 않습니다. 위 예에서 공급업체는 ECC 기능을 모니터링하기 위해 카운터를 사용하도록 선택했습니다. 표시되는 값은 오류 비율을 의미하지 않습니다. 마찬가지로 다른 디스크와 비교하여 일부 디스크의 높은 이벤트 비율은 성능 문제가 있음을 의미하지 않습니다.
참고: 공급업체 또는 모델의 혼합 설치 기반에서 SMART 매개변수를 비교해서는 안 됩니다. 유사한 모델 및 펌웨어만 비교해야 합니다.
특정 Enterprise HDD 모델의 상태 카운터와 관련된 특정 쿼리가 있는 경우 Dell EMC의 엔지니어링팀으로부터 답변을 얻기 위해 작업할 수 있는 기술 지원 담당자에게 문의하십시오.
- SMART 값의 국제 표준화 및 기타 SCSI 스토리지 인터페이스에 대한 자세한 내용은 여기에 있는 T10 기술 위원회 홈페이지를 참조하십시오
- Smartmontools는 최신 ATA, SATA, SCSI/SAS 및 NVMe 하드 드라이브에 내장된 자체 모니터링, 분석 및 보고 기술 시스템을 사용하여 컴퓨터 스토리지 시스템을 제어하고 모니터링하는 유틸리티 프로그램 집합입니다. DellEMC 툴이 아닙니다. Smartmontools에 대한 자세한 내용은 여기에서 찾을 수 있습니다.