Debian/3ware 9500 - сбой RAID?
Вчера вечером я сменил жесткие диски со своего домашнего сервера на новый корпус (новый mobo/CPU/RAM) и перенес с ним его 3ware 9500 PCI-X SATA RAID карту. Машина имеет 4 диска, настроенных на 2 RAID1 - корневой (500 ГБ) и носитель (1 ТБ). Он работает под управлением Debian 7 32-bit.
Машина загрузилась нормально, но только когда она работала и загрузились утилиты 3ware, я заметил, что в массиве отсутствует один из корневых дисков. Я выключил его и покачал диски (я знаю, что этот диск временный, мне нужно купить новый) и в итоге получил карту RAID, чтобы увидеть его. Это означало запуск перестройки RAID, поэтому я позволил машине перезагрузиться в Debian, чтобы я мог следить за ее ходом и позволить начать перестройку.
Он достиг диапазона 90%, прежде чем мне пришлось заняться чем-то другим. Когда я вернулся, катастрофа - на карте RAID не было ни RAID, ни дисков. Debian все еще работал (как-то!), Но я ничего не мог сделать. Громкость носителя исчезла, и корневая FS казалась полностью поврежденной - bash интерпретировал двоичные файлы системы как случайные строки чисел. Больше ничего не оставалось, кроме перезагрузки (и это должна была быть жесткая перезагрузка, команда выключения не работала).
Карта RAID детализировала все 4 присутствующих диска, но этот проблемный диск все еще не использовался, а это означает, что ручная перестройка RAID все еще была необходима. Когда появился Grub, он объявил, что не может распознать файловые системы ни на одном из моих RAID-массивов, поэтому дал мне оболочку восстановления - я понятия не имею, как использовать это (мой интернет тоже не работал вчера вечером), поэтому я понятия не имею в каком состоянии находятся мои диски. Я удалил хороший корневой диск и попытался перевести систему в режим деградации на временном диске, чтобы посмотреть, есть ли на нем какие-либо полезные данные, но карта RAID отказалась разрешить мне использовать его как загрузочный носитель.
При необходимости у меня есть адаптер USB-SATA, но на данном этапе мне интересно, каковы мои шансы на восстановление системы; Я знаю, что RAID не заменит резервное копирование, но на этих дисках много данных, которые мне понадобятся очень много времени для восстановления (то есть они не незаменимы, но я не хочу стереть систему и начать заново), Любые идеи, где я мог бы начать?
Изменить: достигнут некоторый прогресс. Похоже, что "хороший" диск из корневой пары перенес аппаратный сбой в середине восстановления! Я попытался перенести его на новый диск и получил ошибки ввода-вывода, и SpinRite не хочет его трогать. "Плохой" диск находится в каком-то подвешенном состоянии, но один из разделов на нем передал fsck и монтируется на живом диске, поэтому я перенес это на запасной диск. Это не объясняет, почему пропали два других медиа-диска, но спасение раздела / home - отличное начало.
Редактировать 2: здесь происходит нечто очень странное. Два медиа-диска не будут отображаться в BIOS на моем рабочем столе, и через USB на моем ноутбуке они оба будут отображаться без таблицы разделов. Я начинаю задаваться вопросом, умерли ли как-то три из этих четырех дисков одновременно, или они были убиты новым оборудованием - если так, я не могу понять, почему, единственное, о чем я могу думать, скачок напряжения но это должно было сначала поджарить мобо!
Правка 3: в дополнение к моему последнему комментарию проблема с необнаруженными дисками, по-видимому, связана с тем, как карта 3ware использует их; диски мультимедиа отображаются нормально с контроллером 3ware, а их таблицы разделов не повреждены. fsck'ing их сейчас, скрестив пальцы, я могу получить данные...
Редактировать 4: мне удалось спасти все с медиа-дисков, хотя мне пришлось выполнить обширный fsck на разделе перед его монтированием. Было много ошибок с несовпадающими или недействительными индексами и подсчетом свободного места. Странно то, что на самом деле ничто не должно было использовать диски в то время. Хорошо, Plex Media Server работал, но так как я не коснулся какого-либо носителя на диске, я не думаю, что это могло быть связано с состоянием файловой системы, когда RAID отключился. Я собираюсь попытаться войти в действительный корневой диск, посмотреть, что говорят логи. Пока я не определю, что привело к исчезновению RAID, я вернусь к программному RAID.
1 ответ
Мои данные все еще были на дисках. Я понятия не имею, что их уничтожило, но теперь я настороженно отношусь к аппаратным контроллерам. Я восстановил машину с помощью программного RAID и вернул все восстановленные данные на место. Я не знаю, с чего начать, если у кого-то еще есть эта проблема.