Коллеги, кто сталкивался и как решал проблему
pleg is not healthy?
Периодически проскакивает на разных нодах. Запущенных контейнеров на них в районе 250, большого количества остановленных нет. В момент актуальности проблемы docker на команды отзывается, ps/info/curl сокета отвечают меньше секунды. Перезапуск docker и kubelet помогает на какое-то время.
Все возможные issues на гитхабе перечитал, единого мнения о причине проблемы там не нашел. В версиях старше 1.16 присутствует фикс таймаута при обращении к cni (
https://github.com/kubernetes/kubernetes/issues/45419#issuecomment-525669603 ), кроме этого никаких решений не увидел.
k8s v.1.15.3, flannel 0.11