Size: a a a

Обсуждения техдирские

2019 August 31

PD

Phil Delgyado in Обсуждения техдирские
Aleksandr Komlev
devops - это про то что dev еще и про sre, но вы это хотите принципиально разделить
Это про то, что dev должны думать еще и про sre. А не про то, что каждый дев должен быть крутым ops.
Оно про принципы, а не про "уволим всех ops, пусть разработчики сами все настраивают".
источник

AK

Aleksandr Komlev in Обсуждения техдирские
r d
Ой. Так вот вы про что...
Я как-то упустил, что про такое базовое явление надо специально говорить...
Опять же, мы же каким-то образом узнали, что редис пригорюнился...
с мониторинга редиса, штатного и довольно слабого
источник

PD

Phil Delgyado in Обсуждения техдирские
Aleksandr Komlev
в хорошей системе и багов получается нет, нефиг коммитить черте что
Ну, вообще да, смотреть изменение профиля нагрузки на внешние сервисы после коммита перед мерджем - это правильная практика.
Для нагруженных систем - обязательная.
источник

AK

Aleksandr Komlev in Обсуждения техдирские
Phil Delgyado
Это про то, что dev должны думать еще и про sre. А не про то, что каждый дев должен быть крутым ops.
Оно про принципы, а не про "уволим всех ops, пусть разработчики сами все настраивают".
ну то есть думать он должен, но рут ему не нужен при этом?
источник

AK

Aleksandr Komlev in Обсуждения техдирские
Phil Delgyado
Ну, вообще да, смотреть изменение профиля нагрузки на внешние сервисы после коммита перед мерджем - это правильная практика.
Для нагруженных систем - обязательная.
профиль нагрузки где смотреть? на канарейке?
источник

rd

r d in Обсуждения техдирские
Aleksandr Komlev
в хорошей системе и багов получается нет, нефиг коммитить черте что
Падажжи.
Ну ведь стандартно же.
Разраб тестирует свой код, всякие там юнит-тесты. Тестер уже интеграционные тесты. А админы следят за сервачками.
Если на каждом этапе всё норм, то инциденты будут только необычными. Они будут, но рут-то на продакшене чем поможет?
источник

PD

Phil Delgyado in Обсуждения техдирские
Нет, еще на тестах. Насколько в новой версии сервиса изменились тайминги и количество запросов на прочие системы.
И если изменились заметно - то разбираться.
источник

rd

r d in Обсуждения техдирские
Aleksandr Komlev
с мониторинга редиса, штатного и довольно слабого
Ох. Ну базового функционала достаточно для серьезного ограничения дальнейшей стратегии поиска и исправления.
А серьезный функционал нагрузит продакшен ещё чуть-чуть, а ему уже и так дурно.
источник

rd

r d in Обсуждения техдирские
Aleksandr Komlev
ну то есть думать он должен, но рут ему не нужен при этом?
Я знаю людей, которые будучи на руководящих позициях очень нервно реагировали на ущемление их прав доступа на продакшен.
Только это не про девопс и вообще IT. Это где-то рядом с психопаталогией.
источник

СХ

Старый Хрыч in Обсуждения техдирские
Phil Delgyado
Ээ, devops - это не про рутовые права разработчиков, вы что.
Это про общее решение проблем, от разработки до эксплуатации.
В хорошей современной системе вообще ни у кого рута нет, так как нефиг внутрь контейнера лазить.
😓мир поехал головой на контейнерах
источник

PD

Phil Delgyado in Обсуждения техдирские
Aleksandr Komlev
ну то есть думать он должен, но рут ему не нужен при этом?
Более того. Если он думает - то рут ему не нужен.
Так как он заранее думает про отладку проблемных ситуаций и обеспечивает и мониторинг и логгирование.
Собственно, devops как раз про это - про необходимость разработчику _думать_ про эксплуатацию.
источник

rd

r d in Обсуждения техдирские
Aleksandr Komlev
профиль нагрузки где смотреть? на канарейке?
В принципе, если не брать какие-то экстремальные случаи, то график нагрузка/железо растёт не линейно, но достаточно прогнозируемо. А если накатить исторические данные вида «вот у нас на тестировании было так, а на продакшене так, а сейчас на тестировании вот так», то прикинуть ситуацию на проде вполне можно.
Другой вопрос, что можно взять и вылезти за 10гигабит сети, например, и там такой стук из-под земли может полезть...
источник

PD

Phil Delgyado in Обсуждения техдирские
Старый Хрыч
😓мир поехал головой на контейнерах
Нет. Просто контейнеры иногда дают простые решение сложных вопросов. Просто применять их надо по делу, а не "потому что на конференции рассказали".
источник

PD

Phil Delgyado in Обсуждения техдирские
r d
В принципе, если не брать какие-то экстремальные случаи, то график нагрузка/железо растёт не линейно, но достаточно прогнозируемо. А если накатить исторические данные вида «вот у нас на тестировании было так, а на продакшене так, а сейчас на тестировании вот так», то прикинуть ситуацию на проде вполне можно.
Другой вопрос, что можно взять и вылезти за 10гигабит сети, например, и там такой стук из-под земли может полезть...
Но как раз "вылезти из 10гигабит" системный мониторинг должен показывать )
источник

AK

Aleksandr Komlev in Обсуждения техдирские
Phil Delgyado
Нет, еще на тестах. Насколько в новой версии сервиса изменились тайминги и количество запросов на прочие системы.
И если изменились заметно - то разбираться.
сейчас вернемся снова к тому что тесты не всегда покрывают 100% и начнем обсуждать что вот надо было тесты написать.
да, надо. каждый инцидент на проде должен продуцировать коммиты, но инциденты почему-то все равно на ноль не выходят, более того когда их слишком мало это тоже плохо
источник

СХ

Старый Хрыч in Обсуждения техдирские
Phil Delgyado
Нет. Просто контейнеры иногда дают простые решение сложных вопросов. Просто применять их надо по делу, а не "потому что на конференции рассказали".
у меня за эту неделю было 3 заказчика на линке и 2 собеса, никто не мог обьяснить выбор решений\желаний кроме исторически сложилось и кубер решит все наши проблемы.
мне вот сейчас предстоит убедить заказчика, что кластер патрони, без опыта у команды с etcd и кластера etcd отдельного от пг - плохая идея, но увы, пока выигрывает хабр
источник

rd

r d in Обсуждения техдирские
Phil Delgyado
Но как раз "вылезти из 10гигабит" системный мониторинг должен показывать )
Нет, это должен быть разработчик с рутом и тисипидампом.
источник

PD

Phil Delgyado in Обсуждения техдирские
Aleksandr Komlev
сейчас вернемся снова к тому что тесты не всегда покрывают 100% и начнем обсуждать что вот надо было тесты написать.
да, надо. каждый инцидент на проде должен продуцировать коммиты, но инциденты почему-то все равно на ноль не выходят, более того когда их слишком мало это тоже плохо
Конечно инциденты бывают. Но вот у меня потребность пустить разработчика на прод возникает где-то раз в год (да и то можно и без этого, но сесть за спиной отвественного админа и СБшника оказывается быстрее, нежели запрашивать дампы). Но 95% процентов проблем на проде не требуют наличия доступа.
При том, что в финтехе быают сервисы, доступа к которым, по хорошему, даже у сисадминов нет. Только коллективные...
источник

СХ

Старый Хрыч in Обсуждения техдирские
r d
В принципе, если не брать какие-то экстремальные случаи, то график нагрузка/железо растёт не линейно, но достаточно прогнозируемо. А если накатить исторические данные вида «вот у нас на тестировании было так, а на продакшене так, а сейчас на тестировании вот так», то прикинуть ситуацию на проде вполне можно.
Другой вопрос, что можно взять и вылезти за 10гигабит сети, например, и там такой стук из-под земли может полезть...
увы не всегда, например есть такая штука postgresql называется, и например запрос который на 20-40 гб базе не вызывал никаких проблем, на базе в 600 гб кладёт базу
источник

К

Кабак уровня /b/ in Обсуждения техдирские
Старый Хрыч
увы не всегда, например есть такая штука postgresql называется, и например запрос который на 20-40 гб базе не вызывал никаких проблем, на базе в 600 гб кладёт базу
почему заббикс дрисня?
источник