Онлайн курс Алгоритмы: roadmap для работы и собеседований от Слёрм
Экспресс-курс Артёма Мурадова
Мне было интересно понять эту тему в кратчайшие сроки. Хотелось сэкономить время на прочтении и понимании книги.
Вряд ли получится быстро внедрить SRE в нашей компании целиком, у нас финансовая организация. Но цель посещения достиг: какие-то практики у нас работали до, что-то заставило задуматься. Метрики были рассказаны интересно, я их уже начал использовать.
Посмотреть свежим взглядом на процессы в своей команде, задать вопросы про формирование требований SLO, мониторинг и алертинг по ним. Не ждала особенно нового и прорывного, хотелось понять, как это делают люди с другим опытом и посмотреть немножко со стороны.
Что уже из полученных знаний применила в жизни?
После интенсива договорились с командой о том, за что отвечает лидер инцидента, немного поменяли структуру постмортемов. Раньше некоторые пункты не расписывали. Во время интенсива парень из команды, в которой работали, скинул свой формат постмортема. Когда я заполняла его по прошедшей практике, некоторые проблемы подсветились очень неожиданно именно в тех пунктах, которые мы в команде не писали. Я его утащила в свою рабочую команду. Еще сейчас мы планируем переосмыслить свои SLO и определить новые качественные метрики, отслеживать по ним error budget.
Мне понравилось, как была организована тема с ретраями и сам кейс. Подобное демо проведу у нас в команде, и это пригодится. Теоретическая часть мне была понятна и раньше, но продавливать эту тему тяжело, так как она редко выстреливает на проде.