Size: a a a

2021 March 26

T

The in Ansible
Lamobot
Каким образом рейд защищает от bit rot?
Любой нормальный рейд-контроллер пишет в фоне делает скан, некоторые вдобавок к данным пишут чексуммы, ну и про T10 PI не забываем.
источник

M

Mentat in Ansible
The
Любой нормальный рейд-контроллер пишет в фоне делает скан, некоторые вдобавок к данным пишут чексуммы, ну и про T10 PI не забываем.
В словах "любой нормальный" такая бездна допущений
источник

T

The in Ansible
Это как не знать, зачем чексуммыв памяти, а потом получить фарш в данных из-за битой плашки.
источник

AD

Alex Domoradov in Ansible
The
Это как не знать, зачем чексуммыв памяти, а потом получить фарш в данных из-за битой плашки.
ECC далеко не панацея. Хотя в некоторых случаях может спасти/помочь
источник

T

The in Ansible
Панацеи нет, как и 100% доступности. Данные теряются. Есть лишь механизмы снизить вероятность. Дорого. Если данные того стоят.
источник

TG

Timur Gadiev in Ansible
The
RAID — это повышение доступности хранилища, а также решение проблемы bit rot.
В большинстве случаев никакого повышения доступности нет. Большая часть фейлов затрагивает либо сразу оба диска, либо другое оборудование. Крах операционки, глюк файловой системы, сбойные данные при записи, повреждение данных на программном уровне и т.п. - ни от чего из этого рейд не спасает. Зато занимает значительную часть оборудования.
источник

TG

Timur Gadiev in Ansible
Alex Domoradov
ну почему же, конкретно вылет одного диска - решит
Решение одной очень частной проблемы (при игноре целой кучи остальных) неоправданно высокой ценой.
источник

T

The in Ansible
Timur Gadiev
Решение одной очень частной проблемы (при игноре целой кучи остальных) неоправданно высокой ценой.
> неоправданно высокой ценой
Это вы за бизнес решили?
источник

TG

Timur Gadiev in Ansible
The
Любой нормальный рейд-контроллер пишет в фоне делает скан, некоторые вдобавок к данным пишут чексуммы, ну и про T10 PI не забываем.
Любой "нормальный рейд-контроллер" может вылететь также, как и диск. Со всеми вытекающими.
источник

T

The in Ansible
У вас есть статистика (MTBF) по компонентам?
источник

L

Lamobot in Ansible
Timur Gadiev
Любой "нормальный рейд-контроллер" может вылететь также, как и диск. Со всеми вытекающими.
Там же есть multipath на норм дисках :)
источник

T

The in Ansible
Никто не спорит, что факторов полно. Но почему бы некоторые не исключить, понизив общую вероятность отказа?
источник

TG

Timur Gadiev in Ansible
Alex Domoradov
ECC далеко не панацея. Хотя в некоторых случаях может спасти/помочь
Смотря на каком уровне. Говорю же, если вы клауд-провайдер, то там свой уровень задач. И там рейд может быть полезен как способ управления большими массивами. Но для обычных серверов - нет.
источник

TG

Timur Gadiev in Ansible
The
Никто не спорит, что факторов полно. Но почему бы некоторые не исключить, понизив общую вероятность отказа?
Вероятность, скорее, увеличивается, т.к. возрастает сложность системы.
источник

T

The in Ansible
Timur Gadiev
Вероятность, скорее, увеличивается, т.к. возрастает сложность системы.
По сравнению с чем? С linear JBOD?
источник

TG

Timur Gadiev in Ansible
Рейд не для защиты данных. Он для организации больших массивов данных из отдельных дисков. Для более удобного управления.
источник

TG

Timur Gadiev in Ansible
The
По сравнению с чем? С linear JBOD?
В том числе
источник

T

The in Ansible
Timur Gadiev
Рейд не для защиты данных. Он для организации больших массивов данных из отдельных дисков. Для более удобного управления.
Как вы защитите данные на 100 ТБ оракла/сиквела/постгреса?
источник

GG

George Gaál in Ansible
Timur Gadiev
Смотря на каком уровне. Говорю же, если вы клауд-провайдер, то там свой уровень задач. И там рейд может быть полезен как способ управления большими массивами. Но для обычных серверов - нет.
Не согласен с тобой
источник

AD

Alex Domoradov in Ansible
Timur Gadiev
В большинстве случаев никакого повышения доступности нет. Большая часть фейлов затрагивает либо сразу оба диска, либо другое оборудование. Крах операционки, глюк файловой системы, сбойные данные при записи, повреждение данных на программном уровне и т.п. - ни от чего из этого рейд не спасает. Зато занимает значительную часть оборудования.
полностью не согласен после 5 лет на хецнере ~50 серверов было. mdadm не смотря на то, что он софтовый спасал очень много раз
источник