в логах типа nomad.heartbeat: node '2f3cca2a-3a26-04d2-3b2e-4ddfe8a1f265' TTL expired кажется что нужно увеличивать max_heartbeats_per_second но я хотел проконсултироваться )
Ну из забавного и недавнего: 1. теряется резолвинг внутренних хостов. 2. иногда отказывает внутренний роутинг. Т.е. порт выброшен на все ноды, но на одной из них connection refused. Лечится рестартом сервиса docker.