Описание книги
Книга Site Reliability Engineering спровоцировала бурную дискуссию. Что сегодня понимается под эксплуатацией и почему столь фундаментальную важность имеют вопросы надежности? Теперь инженеры Google, участвовавшие в создании этого бестселлера, предлагают перейти от теории к практике - Site Reliability Workbook покажет, как принципы и практика SRE воплощаются в вашем продакшене.
Опыт специалистов Google дополнен кейсами пользователей Google Cloud Platform. Представители Evernote, The Home Depot, The New York Times и других компаний описывают свой боевой опыт, рассказывают, какие практики у них прижились, а какие - нет.
Эта книга поможет адаптировать SRE к реалиям вашей собственной практики, независимо от размеров вашей компании.
Вы научитесь:
- Обеспечивать надёжность сервисов в облаках и средах, которые вы не полностью контролируете;
- Применять различные методы создания, запуска и мониторинга сервисов, ориентируясь на SLO;
- Трансформировать команды админов в SRE-инженеров;
- Внедрять методы запуска SRE с чистого листа и на базе существующих систем.
Бетси Бейер, Нейл Ричард Мёрфи, Дэвид Рензин, Кент Кавахара и Стивен Торн занимаются обеспечением надежности систем Google .