А) Всё, что умеет RAID5 и не более – просто по определению не может носить гордое название «взрослая СХД».
Б) Всё, что умеет больше, чем RAID5, но не проверяет суммы при каждом чтении каждого блока – не может носить гордое звание «взрослая СХД».
Едем дальше, или очень короткий абзац. Система хранения, как и друг, познаются в беде. А какая беда у системы хранения? Выход из строя железа, конечно. Причем погибнуть может не только диск. Может заглючить матплата, проц, и память кэша. Выход один – дублирование контроллеров. Вывод: система без дублирования контроллеров в продакшене – это рисковая авантюра, а не «взрослая СХД». А кроилово, как известно, всегда ведет к попадалову.
Теперь диски. Ох уж эти диски… Раньше, когда я был молодым и неопытным, я ненавидел маркетологов «взрослых СХД» за вендор-локед диски в этих самых взрослых СХД. Ну какого хрена, вопил я про себя и иногда на форумах, эти пип-пип маркетологи не позволяют пихать во «взрослые» системы купленные по-дешевке Б/У диски?! Потом, понапарывавшись на разваливающиеся, на казалось бы ровном месте массивы и проведя бессонные ночи за софтварным склеиванием развалившихся RAID5, 10, 50 – стал много читать. И однажды наткнулся на
https://habr.com/ru/post/92701/ которая меня весьма просветлила. Коротко – что делает «обычный» диск (пихуемый среднестатистическим админом в коробочку типа кунап или синолоджи), когда напарывается на вполне себе нескрытую ошибку, т.е. контрольная сумма сектора не совпадает с вычисленной? Ну конечно же начинает практически бесконечно «тупить». Пытаться считывать проблемный сектор снова и снова. Особо умные – уводя голову «чуть левее», или «чуть правее» от «дороги», в надежде таки-прочитать несносный сектор. А что делает raid-edition диск? Правильно, пробует сделать это 1, 2, 3 секунды, и честно говорит ERR. Потому что «знает» – он в массиве. Ну не читается сектор, «случилось дерьмо», что поделать? О, так ведь можно же вычислить целостный блок данных из страйпов четности! Что делает серьезная, взрослая СХД, увидев ERR при чтении сектора/блока? Ну, после того как вычислила и отдала блок в сеть? Думаете, тут же зажигает диск красненьким? А вот и не всегда! ) Она-то «знает», что, возможно, просто при записи этого конкретного сектора что-то «моргнуло», и сектор «коряво» записался. И можно тут же (или чуть позже, когда нагрузка спадёт) попытаться перезаписать битый сектор правильной, вычисленной информацией. И он с высокой долей вероятности корректно запишется! И будет корректно писаться/читаться еще несколько лет (а если нет – то красненьким диск зажечь в этой ситуации еще не поздно), ибо remap секторов на HDD никто не отменял. Особенно если это и не HDD вовсе, а SSD, и контроллер носителя уже сделал ремап на резервный блок. Но «ложечки нашлись, а осадочек остался», поэтому «правильная», «взрослая СХД» уже поставила «маленький черный минусик» в свою «записную книжечку» напротив серийного номера носителя. И если таких «минусиков» вдруг начинает копиться на одном из носителей больше заданного уровня – вот тогда СХД зажжёт сначала жёлтую («не хреново было бы заменить…»), а потом и красную («меняй немедленно!») лампочку напротив слота с носителем. А если админ правильный, и позаботился о hot-spare носителях – то автоматически начнёт перестроение на них. И это – только малая толика всего, что может должно происходить между хранилкой и носителями. К примеру,еще она может должна считывать SMART-атрибуты носителей, причем не один-два общих, а еще и кучку специализированных. И т.д. и т.п. Отсюда простой вывод: для обеспечения полноценного, грамотного хранения данных «взрослая СХД» просто обязана уметь общаться с носителями «на одном языке». И пока этот «язык» не выработан и не стандартизован (даже единого стандарта на SMART-атрибуты нет, чего уж говорить об остальном) – вендор-локед диски, разговаривающие с хранилкой на одном языке – единственный способ обеспечить ту надежность, что на полном серьёзе пишут в спецификациях «взрослых СХД». А иногда это пять девяток, а это уже совсем не хухры-мухры.