Отказ диска RAID - один раз в день (3ware 9650SE - Seagate Barracuda 3TB)
У меня есть конфигурация RAID6 с картой 3ware 9650SE-8LPML и 6x Seagate Barracuda 3000 ГБ, работающими с начала 2012 года (май?). Эти HDD были довольно большими для того времени. Они всегда издавали странный шум при поиске данных или включении через некоторое время, но я искал в интернете, и некоторые люди сказали мне, что это нормально для этого жесткого диска.
Месяц назад один контроллер начал уведомлять о проблеме с диском, у которого были повреждены сектора. Я решил извлечь диск и переназначить RAID6 с 6xdrives вместо 7. Вчера другой диск начал издавать непрерывно громкий шум, как будто он сломался внутри. Я удалил диск и заменил его тем диском, который я снял 1 месяц назад, который не был физически поврежден. RAID перестроился, и сегодня вечером все работало нормально.
20 минут назад другой диск (не тот, который я заменил вчера) начал издавать тот же шум, который я получил вчера от сломанного жесткого диска. RAID-контроллер сообщает CONFIG FAILURE на накопитель или просто не показывает его. Оба диска (вчера и сегодня) издают этот шум только с помощью кабеля SATA и без сигнального кабеля.
Возможно ли, что 2 диска действительно сломаны?
Возможно ли, что RAID-контроллер ломает диски?
Должен ли я планировать заменить все эти диски в течение следующих месяцев, потому что они приходят в конце своей жизни? Я уже купил новый 6TB WD Red HDD. Если в течение нескольких месяцев потребуется замена всех дисков объемом 3 ТБ, я буду использовать новые диски WD Red емкостью 6 ТБ в качестве замены старого Seagate емкостью 3 ТБ, используя только половину пространства, пока не будут заменены все диски... В противном случае я создам новый RAID. Опасно ли использовать новый WD RAID с этим контроллером?
Очень интересная статья: ССЫЛКА
1 ответ
Здесь есть несколько факторов.
Это очень большие диски. Есть веская причина, как правило, рекомендуется не использовать RAID5 (или другие RAID-массивы четности) с очень большими массивами: для их восстановления требуется много времени. Процесс восстановления создает большую нагрузку на все оставшиеся диски, чем обычно, оставляя очень высокий шанс спровоцировать еще один сбой. RAID 6 лучше, чем 5, но у него все еще могут быть проблемы, как вы видите здесь.
Эти диски, вероятно, из одной партии. Обычно рекомендуется получать диски разных партий или даже разных возрастов, чтобы избежать возможных сбоев по мере их возникновения.
Эти конкретные накопители известны своей чрезвычайно высокой частотой отказов. Два отказа из семи в последовательные дни не особенно маловероятны в этом возрасте для этих накопителей!
В дальнейшем вам следует сделать следующее:
Поддерживать резервные копии. Помните, что RAID несовершенен; критические данные всегда должны иметь резервные копии за пределами площадки.
Попробуйте купить диски, которые не все из одной партии. Это снижает вероятность последовательных сбоев.
Избегайте очень больших массивов. Лучше разделить на несколько логических томов, если это возможно, и, возможно, использовать меньшие физические диски. В противном случае зеркальный RAID лучше (более быстрая перестройка) за счет более непригодного физического пространства.