Как определить, какой диск в прошивке RAID выходит из строя
У меня есть два диска в Intel ICH10 RAID 1. Они не являются накопителями уровня предприятия; просто штатные WD Caviar Black диски.
В последнее время чтение / запись на зеркальный том стал чрезвычайно медленным, а индикатор жесткого диска постоянно горит. Я подозреваю, что это может быть из-за сбоя одного из дисков и попытки переназначения сектора. (См. Также Каков самый быстрый способ заставить hdd перераспределить поврежденные сектора и отбросить данные?). Если бы это был диск предприятия, он бы быстро и чисто вышел из строя, но такое поведение типично для потребительских дисков. Следовательно, не сразу понятно, какой диск плохой.
Ни один из дисков не отображает проблемные данные SMART (это из набора инструментов Intel SSD, который, по-видимому, является одним из немногих вариантов считывания данных SMART с RAID-прошивки Intel):
Первый диск
Второй диск
К сожалению, инструмент диагностики WD Data Lifeguard, который способен выполнять SMART-тесты, полностью сбит с толку Intel ICH10 RAID:
Как я могу определить, какой диск проблемный, и заменить его?
1 ответ
Из того, что вы описываете, первый диск неисправен. Read Error Rate
а также Re-allocated Sector Count
ненулевые Перераспределение секторов - это именно то, что происходит, когда накопитель не может прочитать сектор. Затем он будет перераспределять этот сектор при следующей операции записи.
Вы можете сделать несколько вещей, чтобы подтвердить этот диагноз:
Просто, но неуверенно: используйте такой инструмент, как HDD Scan, чтобы сканировать ваш диск, т. Е. Читать каждый сектор с вашего диска. Вы также можете выполнить эту операцию на вашем массиве RAID 1. Но после этого RAID-микропрограммное обеспечение решает, будет ли оно считывать данные с диска 1 или диска 2. Поэтому этот метод не проверяет каждый сектор на обоих дисках. Но если диск 1 выходит из строя, вполне вероятно (но не гарантировано), что его значения SMART ухудшатся.
Следите за Re-allocated Sector Count
, Reallocation Event Count
а также Current Pending Sector Count
, Если эти значения возрастут, скорее всего, ваш диск скоро выйдет из строя.
Сложно, но дает больше уверенности:
- Монтируйте ваши диски в другой ПК / USB-корпус / другой SATA-порт.
- Загрузитесь с Live CD (например, Ubuntu или Knoppix).
- Выполните тест только для чтения ваших дисков. Вы можете сделать это с помощью команд SMART и / или с помощью таких инструментов, как
dd
или жеbadblocks
- НЕ пытайтесь монтировать файловую систему
- НЕ пишите ничего на диск
- когда вы выполняете операции только для чтения, вы можете повторно собрать RAID, не отмечая его как неисправный / несовместимый.
- Следите за значениями, указанными выше. Теперь вы также должны иметь возможность правильно читать значения SMART. SMART обычно также имеет журнал о предыдущих ошибках, которые произошли. Ведите 1 шляпу как минимум две из них. Временная метка обычно выражается как часы включения. Таким образом, вам придется рассчитывать обратно по текущим часам включения и посмотреть, соответствует ли это времени, когда у вас возникли проблемы.