Делаешь днс сервер, например, 10.1.1.1 ставишь этот адрес на lo0, на нескольких серверах (кратно 2м) и анонсируешь его либо вручную прописываешь на роутере с одинаковыми приоритетами, половина запросов пойдет на 1 сервер половина на второй
хм. так у меня так и вышло, выше писал, только я анонсю разные метрики т.к. сервера не только dns и они друг друга получаются страхую. а нормальной режиме у меня 80,9 dns , а 80.14 web и если уже крах то один сервер выполняет сразу две роли.
Чтобы при падении dns убирался маршрут можно использовать bfd, чтобы мониторить сам named процес - можно взять monit. Если процесс упал - выключаеш bfd сессию, если сервер стал недоступен - bfd и так отвалится и уберет маршрут. В cisco роутерах ip sla - мониторинг маршрутов.
согласен если dns служба упала, просто сообщение в алерт мало, нужно что-то предпринять.
Да и свои ресурсы определять тоже неплохо. У нас вообще при переходе на powerdns получилось 3 процесса, с немного разными бд, т.к. для тех у кого серые, белые и внешка немного разные адреса выдаются.
Вообще есть MST регион с грамотно рассчитанными параметрами mstp согласно к-ва свитчей в одном кольце. В этом MST регионе один IST 0 и два корневых свитча. Все работает хорошо до момента выключения света. После которого при включении света начинаются проблемы срабатывания broadcast/multicast штормов. Сейчас значение с одной стороны 1024pps с другой 2048pps.
storm-control настроен только на двоих корневых свитчах где и срабатывает, сначала с одной стороны а после когда трафик перестраивается то с другой, в результате парализируется весь район