Size: a a a

2020 September 24

S

Sergey [BHE3AnHO] in ru_proxmox
Maxim Natyagaev
#вопрос если в corosync.conf изменить ip на новые ip нод,(создать ip только для corosync), и перезапустить его, взлетит нормально??? просто думаю создать новый vlan и на него повестить только corosync. Кластер в работе, поэтому и спрашиваю)
Там файловер можно добавить
источник

R

Roman in ru_proxmox
Maxim Natyagaev
#вопрос если в corosync.conf изменить ip на новые ip нод,(создать ip только для corosync), и перезапустить его, взлетит нормально??? просто думаю создать новый vlan и на него повестить только corosync. Кластер в работе, поэтому и спрашиваю)
Да, в доке есть инструкция.
источник

R

Roman in ru_proxmox
Maxim Natyagaev
доброе утро всем, подскажите куда копать, во вторник вылетела из кластера 1 нода, перезапуск corosync помогает на пару минут, затем опять виснет. Вчера заменили патчкорд(грешили на него) и кластер как подменили))) начали ноды бутаться, и вылетать из кластера как захотят. (мультикаст не режется на коммутаторе)   на всехъ нодах щас коросинк перезапускается кроном))) в логах коросинка пишет что просто потерял всязь с остальными. причем на сети проблем нет. куда копать?
Как выяснил, что проблем с сетью нет?
источник

MN

Maxim Natyagaev in ru_proxmox
omping  флуд  потерь не дает, вчера выскакивали 3%
источник

MN

Maxim Natyagaev in ru_proxmox
Roman
Как выяснил, что проблем с сетью нет?
порты 10G
источник

AB

Aleks B_ in ru_proxmox
Какую диагностику можно провести чтобы понять почему виртуалки дико лагают? например делаешь yum update и она минут 5 его делает хотя там 5 пакетов обновить. нагрузки нет, io delay показывает 10%. Сервера в кластере, хранилище локально на каждом сервере. кэширование raid отключено, cеть 1G нагрузки нет.
источник

I

Ivan in ru_proxmox
Aleks B_
Какую диагностику можно провести чтобы понять почему виртуалки дико лагают? например делаешь yum update и она минут 5 его делает хотя там 5 пакетов обновить. нагрузки нет, io delay показывает 10%. Сервера в кластере, хранилище локально на каждом сервере. кэширование raid отключено, cеть 1G нагрузки нет.
мало памяти, что-то активно пользует swap
источник

D

Dmitry in ru_proxmox
Или ipv6 пытается использовать, которого может не быть. Вообще в выводе должно быть больше информации
источник

AB

Aleks B_ in ru_proxmox
а как ообычно с флагом ballon на памяти поступают ставть 0 же лучше чтобы вм не выходила за свои пределы?
источник

СГ

Сергей Голод... in ru_proxmox
Aleks B_
Какую диагностику можно провести чтобы понять почему виртуалки дико лагают? например делаешь yum update и она минут 5 его делает хотя там 5 пакетов обновить. нагрузки нет, io delay показывает 10%. Сервера в кластере, хранилище локально на каждом сервере. кэширование raid отключено, cеть 1G нагрузки нет.
iotop запустить и посмотреть даёт ли нагрузку эта ВМ на дисковую подсистему хоста
источник

AU

Aleksandr U. in ru_proxmox
Aleks B_
Какую диагностику можно провести чтобы понять почему виртуалки дико лагают? например делаешь yum update и она минут 5 его делает хотя там 5 пакетов обновить. нагрузки нет, io delay показывает 10%. Сервера в кластере, хранилище локально на каждом сервере. кэширование raid отключено, cеть 1G нагрузки нет.
/warn  есть правила оформления вопросов, просьба их соблюдать. https://t.me/ru_proxmox/4274
источник

C

Combot in ru_proxmox
A. U. has warned Aleks B_ (1/3)
Reason: есть правила оформления вопросов, просьба их соблюдать. https://t.me/ru_proxmox/4274
источник

r

riv1329 in ru_proxmox
Maxim Natyagaev
доброе утро всем, подскажите куда копать, во вторник вылетела из кластера 1 нода, перезапуск corosync помогает на пару минут, затем опять виснет. Вчера заменили патчкорд(грешили на него) и кластер как подменили))) начали ноды бутаться, и вылетать из кластера как захотят. (мультикаст не режется на коммутаторе)   на всехъ нодах щас коросинк перезапускается кроном))) в логах коросинка пишет что просто потерял всязь с остальными. причем на сети проблем нет. куда копать?
#совет

Если у вас сеть для передачи больших данных построена на тех же комутаторах что и сеть для corosync, я могу предположить, что проблема в возросшей на сеть нагрузке и увеличении задержек при передачи большого объема данных через интерфейс.

Чтобы не делать вторую сеть, попробуйте сделать вот так в corosync:


root@nn-vm02:~# cat /etc/corosync/corosync.conf
logging {
 debug: off
 to_syslog: yes
}

...

quorum {
 provider: corosync_votequorum
}

totem {
 cluster_name: v-node
 config_version: 4
 interface {
   linknumber: 0
 }
 knet_ping_timeout: 5000
 knet_pong_count: 1
 knet_ping_interval: 200
 ip_version: ipv4-6
 link_mode: passive
 secauth: on
 version: 2
}
источник

r

riv1329 in ru_proxmox
Я имею в виду опции knet_ping_timeout и knet_ping_interval
источник

r

riv1329 in ru_proxmox
Это касается всех постов, где описывались неожиданно нахлынувшие проблемы на corosync-кластер
источник

MN

Maxim Natyagaev in ru_proxmox
riv1329
Это касается всех постов, где описывались неожиданно нахлынувшие проблемы на corosync-кластер
спасибо, щас дождемся ответа от производителя коммутатора, и если внятного не ответят - будем пробовать
источник

AU

Aleksandr U. in ru_proxmox
riv1329
#совет

Если у вас сеть для передачи больших данных построена на тех же комутаторах что и сеть для corosync, я могу предположить, что проблема в возросшей на сеть нагрузке и увеличении задержек при передачи большого объема данных через интерфейс.

Чтобы не делать вторую сеть, попробуйте сделать вот так в corosync:


root@nn-vm02:~# cat /etc/corosync/corosync.conf
logging {
 debug: off
 to_syslog: yes
}

...

quorum {
 provider: corosync_votequorum
}

totem {
 cluster_name: v-node
 config_version: 4
 interface {
   linknumber: 0
 }
 knet_ping_timeout: 5000
 knet_pong_count: 1
 knet_ping_interval: 200
 ip_version: ipv4-6
 link_mode: passive
 secauth: on
 version: 2
}
Повесь сюда #совет или #решение и прочие тэги. Потом проще найти будет
источник

r

riv1329 in ru_proxmox
Aleksandr U.
Повесь сюда #совет или #решение и прочие тэги. Потом проще найти будет
Правильно? Решение пока не подтверждено. Я привел вариант который я использую для того чтобы corosync работал на задержках характерных для интернета.
источник

FK

Fedor Krashnikov in ru_proxmox
riv1329
#совет

Если у вас сеть для передачи больших данных построена на тех же комутаторах что и сеть для corosync, я могу предположить, что проблема в возросшей на сеть нагрузке и увеличении задержек при передачи большого объема данных через интерфейс.

Чтобы не делать вторую сеть, попробуйте сделать вот так в corosync:


root@nn-vm02:~# cat /etc/corosync/corosync.conf
logging {
 debug: off
 to_syslog: yes
}

...

quorum {
 provider: corosync_votequorum
}

totem {
 cluster_name: v-node
 config_version: 4
 interface {
   linknumber: 0
 }
 knet_ping_timeout: 5000
 knet_pong_count: 1
 knet_ping_interval: 200
 ip_version: ipv4-6
 link_mode: passive
 secauth: on
 version: 2
}
Не задержек, а потерь из-за ненастроеного QoS
источник

FK

Fedor Krashnikov in ru_proxmox
Один трафик вытесняет другой
источник