PowerEdge: Як виправити подвійні несправності та проколи в RAID масивах
Summary:У цій статті представлена інформація про подвійні несправності та проколи в RAID-масиві, а також радиться, як вирішити проблему.
Please select a product to check article relevancy
This article applies to This article does not apply toThis article is not tied to any specific product.Not all product versions are identified in this article.
Попередження: Виконання цих кроків призводить до втрати всіх даних на масиві, перш ніж виконувати кроки, переконайтеся, що всі дані на масиві резервно збережені, і виконання цих кроків не впливає на будь-які інші масиви.
RAID-масиви не застраховані від помилок даних. Прошивка RAID-контролера та жорсткого диска містять функції для виявлення та виправлення багатьох типів помилок даних перед їх записом на масив/диск.
Помилки даних можуть бути викликані фізичними пошкодженими блоками, такими як «збій голови» або погіршення здатності пластини магнітно зберігати біти в певному місці.
Пошкоджений блок, також відомий як погана адреса логічного блоку (LBA), також може бути спричинений помилками логічних даних, такими як «переворот біта» або неправильний запис даних на диск.
Погані LBA зазвичай реєструються як Sense Code 3/11/0.
Апаратні RAID-контролери Dell пропонують такі функції, як зчитування патрулем і перевірка узгодженості для виправлення багатьох сценаріїв помилок даних.
Виконання регулярних операцій перевірки узгодженості виправить поодинокі несправності, будь то фізичний пошкоджений блок або логічна помилка даних.
Перевірка узгодженості також зменшить ризик подвійної несправності в разі виникнення додаткових помилок.
Малюнок 1 Кілька одиночних несправностей у масиві RAID 5 - оптимальний масив
Малюнок 2 Подвійна несправність з несправним накопичувачем (втрачаються дані в страйпах 1 і 2) - деградований масив.
Малюнок 3 Проколоті смуги (дані в страйпах 1 і 2 втрачаються через подвійну несправність) - Оптимальний масив.
Прокол — це особливість контролерів PERC від Dell, призначена для того, щоб контролер міг відновити резервування масиву, незважаючи на втрату даних, спричинену подвійною несправністю.
Прокол також відомий як «перебудова з помилками».
Прокол може статися в одній з двох ситуацій: подвійна несправність вже існує, або подвійного розлому не існує.
Прокол може статися в трьох місцях: порожньому місці, некритичному просторі даних або просторі даних, до якого здійснюється доступ.
Будь-яка умова, яка призводить до недоступності даних в одній смузі на більш ніж одному диску, є подвійною помилкою
Подвійні несправності призводять до втрати всіх даних у межах смуги, що зазнає впливу
Усі проколи є подвійними помилками, але всі подвійні несправності НЕ є проколами
Проактивне технічне обслуговування може виправити існуючі помилки та запобігти виникненню деяких помилок.
Оновіть драйвери та прошивку на контролерах, жорстких дисках, об'єднувальних платах та інших пристроях.
Виконуйте рутинні операції перевірки узгодженості.
Переглядайте журнали для виявлення проблем.
Примітка: Якщо перевірка узгодженості завершиться без помилок, можна сміливо вважати, що масив тепер здоровий і прокол видалений. Тепер дані можуть бути відновлені в справному масиві.
Обережність: Якщо існує відома або підозрювана подвійна несправність або стан проколу, дотримуйтесь цих кроків, щоб мінімізувати ризик більш серйозних проблем:
Виконайте звичайну перевірку узгодженості (масив повинен бути оптимальним)
Визначте, чи існують проблеми з обладнанням
Перевірте журнал контролера
Проведіть апаратну діагностику
За потреби зверніться до служби технічної підтримки Dell
Примітка: Якщо ці кроки були зроблені, виникають додаткові занепокоєння. Проколи можуть призвести до того, що жорсткі диски з часом перейдуть у стан прогнозованого збою. Помилки даних, які поширюються на диск, реєструються як помилки мультимедіа на диску, навіть якщо жодних проблем з обладнанням не існує.
Примітка: Моніторинг системи дозволяє своєчасно виявляти та виправляти неполадки, що також знижує ризик виникнення більш серйозних проблем.