Эксплуатация · База
Настроить health checks
Сделать проверки состояния сервиса и зависимостей для мониторинга и оркестрации.
Быстро понять за 2 минуты
Сделать проверки состояния сервиса и зависимостей для мониторинга и оркестрации.
Контекст
Сервис должен быть не только написан, но и наблюдаем, диагностируем, безопасно выкатываем и понятен тем, кто будет поддерживать его после релиза.
Что это дает
Health checks помогают балансировщику и команде понять, жив ли сервис и готов ли он принимать трафик.
Как выполнить
- Разделите liveness и readiness.
- Проверяйте критические зависимости осторожно.
- Не делайте health endpoint тяжелым.
Критерии приемки
- Health endpoint работает.
- Readiness учитывает критические зависимости.
- Мониторинг использует checks.
Типичные ошибки
- Делать один health на все случаи.
- Проверять внешние сервисы слишком часто.
- Возвращать 200 при деградации критической зависимости.
Инструменты
Рабочий артефакт
Runbook
Операционная готовность сервиса
Сервис готов к эксплуатации: логи, метрики, алерты, rollback, health checks и инструкция реагирования.
- Logs
- Metrics
- Alerts
- Rollback
Контроль качества
Операционная готовность сервиса
Health endpoint работает.
После изменения контрактов, релизов, инцидентов, роста нагрузки и пересмотра архитектурных решений.
Контракт, ограничения, сценарии отказа, метрики, владельца сервиса и критерии готовности.
Перед отметкой выполнено: Health endpoint работает.
Как применять
Начинайте с границ ответственности и пользовательского сценария, который обслуживает система. Затем проверьте контракт, данные, отказоустойчивость, безопасность и наблюдаемость. Хороший backend-пункт фиксирует, что именно меняется, как это проверить и какие метрики покажут стабильность решения.
Режим обучения
Прочитайте материал, прослушайте аудио и проверьте понимание по коротким вопросам. Ответ раскрывается после попытки сформулировать его самостоятельно.