Size: a a a

Пятничный деплой

2019 January 23
Пятничный деплой
​​Статья о том, как в Dropbox автоматизируют конфигурацию своих датацентров

Так как Dropbox одни из первых (по крайней мере первые из громких) переехали из публичного облака на своё железо, там вам никакого Terraform’а — всё по хардкору с валидацией свичей, стресс-тестами и бенчмарками.
источник
Пятничный деплой
Architecting for Reliability

Серия постов про то, какими способами можно улучшить надежность работы приложений.

Part 1 - Concepts:
https://medium.com/becloudy/architecting-for-reliability-part-1-concepts-17028343089

Part 2  -  Resiliency and Availability Design Patterns for the Cloud:
https://medium.com/becloudy/architecting-for-reliability-part-2-resiliency-and-availability-design-patterns-for-the-cloud-cf7aaaed0df2

Part 3 - High Availability Architectures:
https://medium.com/becloudy/architecting-for-reliability-part-3-high-availability-architectures-8dfd0f87d25e
источник
2019 January 24
Пятничный деплой
Пробую .NET Core + Kubernetes + appmetrics + prometheus + grafana + jobs + health checks
https://habr.com/ru/post/437286/
Tags: .NET, DevOps, kubernetes, .net core, prometheus, grafana, блог компании модульбанк, теги никто не читает, серьёзно
Author SanSYS on #habrahabr
источник
2019 January 25
Пятничный деплой
Dapp / Werf

Ребята из Flant переписали Dapp c Ruby на Go и назвали его странным словом Werf. Определенно стоит обратить внимание - ребята настроены серьезно и проделали большую работу.

https://github.com/flant/werf
источник
Пятничный деплой
Google Customer Reliability Engineering только что открыли доступ к HTML-версии SRE Workbook http://amp.gs/VqWB

Теперь обе книги доступны бесплатно, с нормальным поиском, гиперссылками и прочим)

P.S. Спасибо за новость, Дмитрий

И напомню про курс
http://amp.gs/VqWx
источник
2019 January 26
Пятничный деплой
Ищем утечки памяти в наших приложениях на golang #memory #golang #oom https://medium.com/dm03514-tech-blog/sre-debugging-simple-memory-leaks-in-go-e0a9e6d63d4d
источник
Пятничный деплой
Site Reliability Engineering | Технострим

Неплохая лекция из курса «Проектирование высоконагруженных систем» от Mail.ru Group про  SRE

https://youtu.be/4VW4FGYHMPs
источник
Пятничный деплой
Do you have an SRE team yet? How to start and assess your journey https://cloud.google.com/blog/products/devops-sre/how-to-start-and-assess-your-sre-journey/
источник
2019 January 27
Пятничный деплой
Ого, какая прелесть
источник
Пятничный деплой
Prometheus Alert Testing utility

PAT позволяет писать юнит тесты для алертов prometheus.

https://github.com/kevinjqiu/pat
источник
Пятничный деплой
💭 Tumblr Kubernetes Tools.

Почему-то коллеги об этом не пишут, хотя с kubernetes работают точно плотнее меня. 😉

Tumblr не так давно анонсировал открытие исходников своих нескольких утилит, которые они написали и используют сами, ну и приглашают сообщество познакомиться с инструментами. Сама новость, примеры и подробности по ссылке:

https://engineering.tumblr.com/post/182013497734/open-sourcing-our-kubernetes-tools

Утилиты на Github:

https://github.com/tumblr/k8s-config-projector
https://github.com/tumblr/k8s-secret-projector
https://github.com/tumblr/k8s-sidecar-injector

#kubernetes #github #напочитать
источник
Пятничный деплой
Коллеги подсказывают, что в нативный promtool от разрабов прометеуса тоже возможность писать юнит тесты для алертов завезли:

https://www.robustperception.io/unit-testing-rules-with-prometheus
источник
2019 January 28
Пятничный деплой
Утилита от google для  мониторинга сайтов/серверов извне - cloudeprober https://medium.com/dm03514-tech-blog/sre-availability-probing-101-using-googles-cloudprober-8c191173923c #google #monitoring #blackbox
источник
Пятничный деплой
По поводу cloudeprober нужно, наверное, дополнить - это скорее ещё один экспортер, т.е. не standalone, а именно prober
источник
Пятничный деплой
А вот тут обещают рассказать как ставить helm без tiller https://blog.tenx.tech/the-how-and-why-behind-tiller-less-helm-340a071d51c8 #helm #k8s #tiller
источник
Пятничный деплой
Четвёртая и заключительная часть серии про рантаймы контейнеров от Ian Lewis.

Предыдущие части:
- Часть I
- Часть II
- Часть III

#containers #kubernetes
источник
Пятничный деплой
​​Managing reliability with SLOs and Error Budgets

The folks at Kudos in simple language teach us about SLOs, SLIs, and error budgets, as well as talk through their own implementation of them.

#monitoring #sre

And they have pretty useful image about SLI collection points:
источник
Пятничный деплой
Только что зарелизился Prometheus 2.7.0 🎉

Из интересного PromQL теперь поддерживает подзапросы и добавлен экспериментальный флаг storage.tsdb.retention.size для ограничения размера TSDB по месту на диске. Ну и различные улучшения и багфиксы.
http://amp.gs/VJD1

Док про подзапросы http://amp.gs/VJDt

PR про новые флаги http://amp.gs/VJDp

#prometheus #releases
источник
Пятничный деплой
Разбираемся в Agile

Многие испытывают проблемы с пониманием “Agile”, вокруг этого слова даже успел возник карго-культ! Этой проблеме и будет посвящена рубрика “Разбираемся в Agile”. Начнем с принципов, а затем перейдем к самому манифесту.

И так. Принцип первый.

https://aladmit.com/article/2019/01/28/agile-principle-1.html
источник
Пятничный деплой
#advanced #docker

Сегодня в профессиональной разработке стандартом является система контейнеризации Docker. Однако несмотря на все преимущества по сравнению с виртуальными машинами, Docker тоже может тормозить. Давайте разберёмся, какие могут быть причины для этого.

https://bit.ly/2JTjjr2
источник