Телеграмм чат группы kubernetes

Коллеги, кто сталкивался и как решал проблему pleg is not healthy?
Периодически проскакивает на разных нодах. Запущенных контейнеров на них в районе 250, большого количества остановленных нет. В момент актуальности проблемы docker на команды отзывается, ps/info/curl сокета отвечают меньше секунды. Перезапуск docker и kubelet помогает на какое-то время.
Все возможные issues на гитхабе перечитал, единого мнения о причине проблемы там не нашел. В версиях старше 1.16 присутствует фикс таймаута при обращении к cni ( https://github.com/kubernetes/kubernetes/issues/45419#issuecomment-525669603 ), кроме этого никаких решений не увидел.

k8s v.1.15.3, flannel 0.11

GitHub

Node flapping between Ready/NotReady with PLEG issues · Issue #45419 · kubernetes/kubernetes

Is this a request for help? No What keywords did you search in Kubernetes issues before filing this one? (If you have found any duplicates, you should instead reply there.): PLEG NotReady kubelet I...

источник

15:21пожаловаться #7

Let Eat Bee in Kubernetes — русскоговорящее сообщество

Флант раздает вредные советы . SIGQUIT nginx будет гонка с лоад балансером. Надо просто sleep 60 делать и всё

источник

15:40пожаловаться #8

Let Eat Bee in Kubernetes — русскоговорящее сообщество

https://habr.com/ru/company/flant/blog/489994/

Хабр

Kubernetes tips & tricks: особенности выполнения graceful shutdown в NGINX и PHP-FPM

Типовое условие при реализации CI/CD в Kubernetes: приложение должно уметь перед полной остановкой не принимать новые клиентские запросы, а самое главное — успеш...

источник

15:40пожаловаться #9

Andrew Radygin in Kubernetes — русскоговорящее сообщество

Let Eat Bee

Флант раздает вредные советы . SIGQUIT nginx будет гонка с лоад балансером. Надо просто sleep 60 делать и всё

Привет!
А можно раскрыть данный тезис?
Что значит гонка и про какой lb речь?

источник

15:57пожаловаться #10

Andrew Radygin in Kubernetes — русскоговорящее сообщество

>Надо просто sleep 60 делать и всё
Но это же прям плохо, не?
Насколько растянется деплой с такой задержкой, если у вас 100 реплик или 200?

источник

16:01пожаловаться #11

ТФ

Темур Фаткулин... in Kubernetes — русскоговорящее сообщество

Всем привет! а кто-нибудь работал со https://spotinst.com/?

Spot

Spot: Continuous Cloud Optimization and Automation for CloudOps | Spot

источник

16:07пожаловаться #12

Let Eat Bee in Kubernetes — русскоговорящее сообщество

Andrew Radygin

Привет!
А можно раскрыть данный тезис?
Что значит гонка и про какой lb речь?

вот тут указан порядок что и как приосходит. если в preStop сделать SIGQUIT или любой другой graceful shutdown, то возникает гонка - лоадбалансеры и ингресы еще не перестали слать всякие запросы в под, но он уже перестал их принимать, от этого возникают разрывы , клиенты звонят и жалуются.

https://kubernetes.io/docs/concepts/workloads/pods/pod/#termination-of-pods

kubernetes.io

Pods

источник

16:21пожаловаться #13

Ilya Andreev in Kubernetes — русскоговорящее сообщество

Let Eat Bee

kubernetes.io

Pods

Как раз в статье мы и затронули эту проблему и расписали про использование sleep в lifecycle (только не 60 секунд, а только 1-2, чтобы не делать деплой слишком долгим) для ее решения

источник

16:33пожаловаться #14

Mr. Freeman in Kubernetes — русскоговорящее сообщество

Мне кажется, что приложение должно корректно обрабатывать коды выхода, а не писать костыль на выброс пода

источник

16:36пожаловаться #15

Let Eat Bee in Kubernetes — русскоговорящее сообщество

Ilya Andreev

я про nginx. про fpm меня удивило:

command: ["/bin/sleep", "1", "kill -QUIT 1"]

такое работать не должно, разве что /bin/sleep какой-то хитрый, который принимает столько аргументов

источник

16:36пожаловаться #16

Georgy in Kubernetes — русскоговорящее сообщество

Всем привет!

Кто нибудь подскажет, как сейчас наиболее популярная альтернатива Apache Benchmarking ab утилите?

Мне нужна какая то утилита, которую просто установить на Ubuntu 16, которая может слать N запросов в M параллельных потоков. Как это делала ab вот так ab -n N -c M http://example.org

ab не подходит, потому что она не поддерживает HTTP 1.1

источник

16:38пожаловаться #17

Let Eat Bee in Kubernetes — русскоговорящее сообщество

Mr. Freeman

Мне кажется, что приложение должно корректно обрабатывать коды выхода, а не писать костыль на выброс пода

приложение само ничего сделать не может, разве что встроить логику "sleep" перед выходом в обработчик сигнала

источник

16:38пожаловаться #18

Andrew Radygin in Kubernetes — русскоговорящее сообщество

Let Eat Bee

приложение само ничего сделать не может, разве что встроить логику "sleep" перед выходом в обработчик сигнала

Не ваша правда.
Приложение как раз нативно должно уметь обрабатывать graceful, если не умеет - приходится мудрить.

источник

16:40пожаловаться #19

Mr. Freeman in Kubernetes — русскоговорящее сообщество

Let Eat Bee

приложение само ничего сделать не может, разве что встроить логику "sleep" перед выходом в обработчик сигнала

некорректно выразился, конечно. имейдж жс приложением должен корректно принимать коды и передавать их приложению

источник

16:40пожаловаться #20