Size: a a a

linkmeup_sysadmins

2020 February 04

A

Alex_5252 in linkmeup_sysadmins
Мы никак не изучаем субминутный интервал, т.к. не знаем, что это за слово.
источник

A

Alex_5252 in linkmeup_sysadmins
2006 год...
источник

p

pragus in linkmeup_sysadmins
Mik I.
Ring buffer, eth flow control, rx/tx очередь и буферы, irq, softirq, буферы сокетов, numa, cpu c state. Это ещё до bind’а не добрались.
слишком мелкий rps, чтобы это все играло, если только речь не про очень древний linux
источник

p

pragus in linkmeup_sysadmins
Alex_5252
2006 год...
и? по коду там не так много и поменялось
источник

A

Alex_5252 in linkmeup_sysadmins
Более 10 лет назад bind падал вообще чётко. segfault'ы и assert'ы...
источник

p

pragus in linkmeup_sysadmins
Alex_5252
Мы никак не изучаем субминутный интервал, т.к. не знаем, что это за слово.
ну вот у вас на 10 секундном интервале был всплеск дропов, а на графике вы этого не увидите, потому что фактически это происходило между парой точек.

в лучшем случае у вас там будет просто мелкий всплеск
источник

A

Alex_5252 in linkmeup_sysadmins
По коду там менялось всё "глобально".
Мы отсылали в ISC наши дампы падений, с логами и трейсами gdb, а isc переписывали полностью процедуры. Я так думаю, это можно увидеть внутри кода.
источник

MI

Mik I. in linkmeup_sysadmins
pragus
слишком мелкий rps, чтобы это все играло, если только речь не про очень древний linux
Скорее как пример привёл. С другой стороны, там виртуалки, и непонятно, какого размера.
источник

A

Alex_5252 in linkmeup_sysadmins
Для наших целей достаточно минутных метрик, и при росте негативных показателей уже будем искать узкие места и их расширять.
источник

A

Alex_5252 in linkmeup_sysadmins
Графики приведены, как пример того, что у ТС никаких цифр и метрик вообще не представлено, и она не видит, как вообще изменяется ситуация при разной нагрузке.
источник

A

Alex_5252 in linkmeup_sysadmins
Нет такого, чтобы:
echo 0 > /proc/sys/kernel/slowdown
И всё стало хорошо, а по умолчанию в /proc/sys/kernel/slowdown единица...
источник

A

Alex_5252 in linkmeup_sysadmins
Параметры систем выставлены на небольшую нагрузку и небольшое потребление ресурсов.
Есть потребляющий сервис, - выставляй для него большие параметры в узких местах и пользуй.
источник

p

pragus in linkmeup_sysadmins
Alex_5252
По коду там менялось всё "глобально".
Мы отсылали в ISC наши дампы падений, с логами и трейсами gdb, а isc переписывали полностью процедуры. Я так думаю, это можно увидеть внутри кода.
креши - это другое.
источник

p

pragus in linkmeup_sysadmins
там основная проблема именно в алгоритме cache eviction
источник

p

pragus in linkmeup_sysadmins
в 9.5 они завезли lru-based алгоритм, но из-за остальных проблем bind все так же в несколько раз медленнее unbound/knot
источник

p

pragus in linkmeup_sysadmins
Alex_5252
Параметры систем выставлены на небольшую нагрузку и небольшое потребление ресурсов.
Есть потребляющий сервис, - выставляй для него большие параметры в узких местах и пользуй.
это какая-то софистика
источник

A

Alex_5252 in linkmeup_sysadmins
pragus
это какая-то софистика
К нам пришла Софистка Анна и началось :)))
источник

p

pragus in linkmeup_sysadmins
Alex_5252
К нам пришла Софистка Анна и началось :)))
ну вы какие-то странности показываете, кмк. там слишком небольшой rps, чтобы грешить на систему
источник

A

Alex_5252 in linkmeup_sysadmins
ТЗ - ХЗ...
Это если нормальные виртуалки или серваки.
Мы тут чисто на кофейной гуще гадаем.
источник

A

Alex_5252 in linkmeup_sysadmins
У нас была проблема "на чистом месте". Выделено было 4 гб озу, а в named.conf стояла опция max-cache-size 4500M;
И также были проблемы с резолвингом.
источник