Коллеги, помогите пожалуйста разобраться с проблемой. Есть хост VMware 6.7 с несколькими отдельными дисками sata ssd и hdd, на hdd стоит veeam который это всё это бэкапит на него и в сетевую шару. Периодически раз в 1-2 месяца рандомно залипает только на одном из ssd на стадии создании снапшотов(возможно диск виноват, но это случалось только ночью, во время создания бэкапов). Вм после этого недоступны(причём все на этом сторадже), но доступ к диску есть и через веб консоль и через ssh. Отмена создания снапшотов не работает - another task in progress. Приходится тушить все остальные машины и перезагружать. При отправке хоста в перезагрузку он подвисает(видимо ждёт реакции по подвисшим операциям) и ребутится только через ресет. После загрузки все ок - вм стартуют/работают, все ок. До следующего раза 😕
Грешил на диск, вчера подключили ещё ssd, перенёс всё с проблемного, его отмонтировал и получил аналогичную проблему, в процессе бэкапа под утро опять залипли вм на стадии создания снапшотов. Пришлось опять ребутать. Физического доступа к хосту нет. В какую сторону ещё можно покопать/посмотреть? Сломал голову.
ЗЫ. Знаю, что архитектура УГ, АМ/КГ и лучше сделать по другому но в текущем моменте приходится работать с тем, что есть - с изменениями большие сложности.