Size: a a a

linkmeup_sysadmins

2020 February 04

S

Sakharova Anna in linkmeup_sysadmins
Анализ системы и не выйдет, пока вы сами в систему не зайдете
источник

A

Alex_5252 in linkmeup_sysadmins
Я в дампе может и не увижу ничего нового. Но как показывает практика есть инженеры, которые видят проблемы в дампах. Те проблемы, которые мы не увидели. Я не увидел :)
источник

MI

Mik I. in linkmeup_sysadmins
Смотрите. Дропы могут быть в сети, могут быть на сетевой карте, на сетевом стеке, в приложении. Где именно у вас дропы - не понятно. Откуда вы снимаете дамп - тоже не понятно.
источник

MI

Mik I. in linkmeup_sysadmins
Где дропы - там и тюнить надо. Обычно.
источник

MI

Mik I. in linkmeup_sysadmins
Статистика дропов собирается и доступна.
источник

A

Alex_5252 in linkmeup_sysadmins
Кстати да. И отсюда и виртуализация и сеть имеют значение.
Поэтому и говорят: "а, так у вас ...? Ой смотрите тогда туда - ..."
источник

MI

Mik I. in linkmeup_sysadmins
Ring buffer, eth flow control, rx/tx очередь и буферы, irq, softirq, буферы сокетов, numa, cpu c state. Это ещё до bind’а не добрались.
источник

AM

Alexander Mamahtehok in linkmeup_sysadmins
Для начала я бы уточнил где Анна дампит реквесты ))) на балансере или на кеше )))
источник

AM

Alexander Mamahtehok in linkmeup_sysadmins
я так понимаю это разные машины
источник

MI

Mik I. in linkmeup_sysadmins
источник

MI

Mik I. in linkmeup_sysadmins
Анна, вот сюда сходите. Может там вас смогут разговорить, вытянуть из вас диагностику, и помогут.
источник

A

Alex_5252 in linkmeup_sysadmins
Ага, или предложат посмотреть лекции HL :)
источник

p

pragus in linkmeup_sysadmins
Sakharova Anna
У меня бинд, нагрузка 10000rps, памяти хватает, но по статистике 8-9% запросов стабильно глотается. Всмысле я вижу в дампе что на 9 запросов бинд отвечает клиентам, на 10й молчит. Не servfail, не подобное. Причем за секунду до этого мог дать другому клиенту ответ на аналогичный запрос из Кеша (судя по скорости ответа). Была мысль сменить бинд, так как он для кеширования особо и не предзначен, но единственное адекватное решение для высоконагруженных систем - это unbound. Но у него своя беда - он не умеет делить юзеров на зоны (VIEW), а мне это надо. И как я не ковыряла конфиги и Гугл, не нашла выхода. Может есть кто опытный, решал подобную задачу?
потому что не надо bind, он плох как рекурсор
источник

p

pragus in linkmeup_sysadmins
vpm
Очень похоже на то что какие-то внутренние блокировки в самом процессе, можно прицепиться к процессу strace и попытаться понять что происходит
strace просто превратит этот bind в тыкву
источник

MI

Mik I. in linkmeup_sysadmins
Стрейс пока рано.
источник

MI

Mik I. in linkmeup_sysadmins
Sakharova Anna
Балансировка keepaliv'om, да на уровне ip, дамп непосредственно на кешах (бинде)
На кешах дамп.
источник

MI

Mik I. in linkmeup_sysadmins
Alexander Mamahtehok
Для начала я бы уточнил где Анна дампит реквесты ))) на балансере или на кеше )))
^^^
источник

AM

Alexander Mamahtehok in linkmeup_sysadmins
Mik I.
На кешах дамп.
пропустил
источник

p

pragus in linkmeup_sysadmins
а как вы на таких графиках изучаете субминутные интервалы?
источник

p

pragus in linkmeup_sysadmins
Sakharova Anna
Есть какие то симптомы, основанные на количестве потерянных пакетов, которые могут указывать на болезнь системы?
источник