Всем привет. Нужна помощь в решении проблемы с сервером.😱
Имеется:
- арендованный в ДЦ выделенный сервер
- Proxmox 6.3-6
- software linux raid 1 2x6TB hdd
- Asus WS C422 DC motherboard
Инфраструктура: несколько виртуальных машин Mikrotik CHR и Windows Server 20хх.
Периодически пропадает сеть на разных CHR. Помогает только стоп/старт. Бывает такое, что CHR начинают падать постоянно одна за другой и приходится полностью перезагружать хост. После этого может стабильно работать несколько недель/месяцев, а может несколько дней. По началу сервер работал исправно около двух лет. Проблемы начались с того, что на виндовых ВМ сами по себе стали сбиваться сетевые настройки: настроена статика, а само переключалось на dhcp. Эту проблему вылечили установкой свежих virtio драйверов и guest агентов. Теперь все виндовые ВМ работают стабильно, кроме одной: в момент "глюка" она перестает быть доступна даже через консоль, помогает стоп-старт либо ребут хоста. Но основная проблема в падение сети на микротиковских гостях.
В процессе диагностики были обнаружены битые секторы на обоих дисках. Диски поочередно заменили, но проблема не ушла.
В syslog Проксмокса пусто.
Инженеры дата-центра проводили глубокое тестирование железа и ошибок не обнаружили.
Есть подозрение, что проблема софтовая. Может кто-то сталкивался с подобным? На форуме Проксмокса ничего не говорят.
Заранее, спасибо за подсказки и помощь.🤘