Назад

Эксплуатация · База

Добавить структурированные логи

Логировать важные события с request id, пользователем, операцией и контекстом ошибки.

Эксплуатация: визуальный контекст этапа
Аудиопересказ пунктаПолная версия материала для прослушивания
Прослушано 0%
Скачать

Быстро понять за 2 минуты

Логировать важные события с request id, пользователем, операцией и контекстом ошибки.

Главная пользаСтруктурированные логи позволяют быстро расследовать инциденты и связывать действия между сервисами.
Первое действиеДобавьте correlation id.
Готово, когдаЛоги можно фильтровать.

Контекст

Сервис должен быть не только написан, но и наблюдаем, диагностируем, безопасно выкатываем и понятен тем, кто будет поддерживать его после релиза.

ЦельСтруктурированные логи позволяют быстро расследовать инциденты и связывать действия между сервисами.
ДействиеДобавьте correlation id.
ПроверкаЛоги можно фильтровать.

Что это дает

Структурированные логи позволяют быстро расследовать инциденты и связывать действия между сервисами.

Как выполнить

  1. Добавьте correlation id.
  2. Логируйте бизнес-события и ошибки.
  3. Исключите персональные данные и секреты.

Критерии приемки

  • Логи можно фильтровать.
  • Есть request/correlation id.
  • Чувствительные данные не попадают в лог.

Типичные ошибки

  • Логировать только текст без полей.
  • Писать слишком много шума.
  • Логировать токены, карты или пароли.

Инструменты

ELKLokiMonolog

Рабочий артефакт

Runbook

Операционная готовность сервиса

Сервис готов к эксплуатации: логи, метрики, алерты, rollback, health checks и инструкция реагирования.

  • Logs
  • Metrics
  • Alerts
  • Rollback

Контроль качества

Артефакт

Операционная готовность сервиса

Метрика проверки

Логи можно фильтровать.

Когда пересматривать

После изменения контрактов, релизов, инцидентов, роста нагрузки и пересмотра архитектурных решений.

Что передать дальше

Контракт, ограничения, сценарии отказа, метрики, владельца сервиса и критерии готовности.

Перед отметкой выполнено: Логи можно фильтровать.

Как применять

Начинайте с границ ответственности и пользовательского сценария, который обслуживает система. Затем проверьте контракт, данные, отказоустойчивость, безопасность и наблюдаемость. Хороший backend-пункт фиксирует, что именно меняется, как это проверить и какие метрики покажут стабильность решения.

Режим обучения

Прочитайте материал, прослушайте аудио и проверьте понимание по коротким вопросам. Ответ раскрывается после попытки сформулировать его самостоятельно.

1. Какую основную пользу должен дать этот пункт?
2. Какой первый практический шаг нужно выполнить?
3. По какому критерию можно понять, что пункт выполнен?