Что делать, если из строя вышел RAID-контроллер?
Говоря о резервном копировании, мы всегда подразумеваем, что у нас в любой момент может выйти из строя жёсткий диск, и это вполне оправдано. К сожалению, надёжность современных HDD оставляет желать лучшего, но не только они могут стать виновниками потери данных.
Естественно, я говорю о RAID массивах и конкретно о выходе из строя самого RAID-контроллера. Что же делать в данной ситуации?
На самом деле всё не так страшно, как может показаться на первый взгляд. Информация о конфигурации RAID-массива хранится на самих HDD, входящих в массив. Обычно она расположена в первых или последних секторах каждого диска, а записывает ее туда микропрограмма RAID контроллера при формировании массива. Блок конфигурации практически обязательно продублирован на каждом диске массива. За исключением номера диска, служебные данные на всех дисках должны быть идентичны, и этим можно воспользоваться при восстановлении массива. Соответственно всё что нам нужно — взять новый контроллер и подключить диски в том же порядке, в котором они были подключены к умершему контроллеру.
Но это всё теория, давайте же проверим — так ли это на самом деле.
У меня есть 2 сервера с интегрированными RAID контроллерами:
HP ProLiant DL380 G7 с контроллером P410i
IBM x3650 M4 с контроллером ServeRAID M5110e
И так же у меня есть 2 контроллера:
Adaptec 6405
Итоги проверки в общем то лично меня не удивили:
При замене на DL380 контроллера на Adaptec — контроллер увидел массив и даже попытался запустить с него систему (правда здесь мы получили kernel panic ввиду отсутствия драйвера для контроллера в уже установленной системе), но в любом случае — целостность данных не была нарушена и данные подлежат восстановлению. Испытание было проведено как на RAID1, так и на RAID0. С LSI всё оказалось более просто и печально — контроллер увидел диски, но не увидел массива, ребилд и прочие ухищрения не дали положительных результатов.
С x3650 картина получилась обратная. Так как M5110e построен на чипе производства LSI Logic, при замене контроллера на 9260-8i массив увиделся и точно так же, как и в первом случае — нам удалось получить наши данные в целости и сохранности, а вот с Adaptec массив отказался распознаваться и так же никакие уловки нам не помогли.
Отсюда можно сделать вывод — служебная информация массива «привязана» к определённой марке производителей RAID контроллеров. Лично мои рекомендации следующие — стараться избегать использования встроенных RAID контроллеров, ввиду того, что подбор контроллера, в случае выхода из строя имеющегося, будет достаточно проблематичной задачей, которая может не увенчаться успехом. Другое дело, если вы используете внешний контроллер определённого производителя. Производители дорогих контроллеров (LSI Logic, Adaptec, Intel, Promise) довольно консервативны — одни и те же модели выпускаются достаточно долго, плюс существует практически 100% вероятность того, что на обновлённой версии имеющегося у вас контроллера ваш массив прекрасно увидится и будет полностью работоспособен (в общем то практически таким образом и работают компании, которые предоставляют услуги по восстановлению данных, либо используют сходный контроллер, либо используют его в качестве «донора», чтобы восстановить работоспособность старого контроллера, и как третий вариант — перенос энергонезависимой памяти (CMOS) вышедшего из строя контроллера на новый, дабы сохранить данные о RAID массиве).