В продолжение темы про серверное оборудование HP.
Подопытный пациент - RAID-контроллер HP Smart Array P410. Со встроенной кеш-памятью 512 МБайт и исправной полностью заряженной батарейкой. Сконфигурирован в режиме "1+0", восемь дисков по 1ТБ.
В 23 часа "удалённые ручки" заменили один из жёстких дисков, находившийся в состоянии "Predictive Failure" (по факту - сдохший и тормозивший всю систему). RAID перешел в состояние "Recovering". И находился на отметке "Recovering, 0% complete" всю ночь, пока я утром не пришёл на работу и не остановил тестовый процесс записи потока случайных данных на диск. И только после того, как нагрузка с дисковой подсистемы была полностью снята, наконец-то пошёл реальный процесс ребилда.
Сказать, что я нахожусь в полном @%уе - значит не сказать ничего. То есть ты взял, заменил сбойный диск в надежде на то, что через какое-то время RAID снова встанет в строй. А он даже и не думает этого делать. Потому что, видите-ли, пока идёт запись, он больше ничем другим заниматься не хочет. При этом, если верить iotop-у (а не верить ему у меня причин нет), запись шла со скоростью всего 10...17 МБайт/с, что для 8-дискового массива, мягко говоря, ни о чём. То есть, контроллер реально и ничего не записывал, и массив не перестраивал. У меня появляется логичный вопрос: а чем же эта сука в таком случае всю ночь занималась?!?
Народ, не берите HP. Он есть суть полное говно. Без вариантов.