Надёжность PluginHub

Надёжные интеграции: идемпотентность, ретраи, DLQ и алерты

Интеграции «падают» не из‑за одной ошибки, а из‑за цепочки: таймаут → повтор → дубль заказа → ручная правка. Поэтому продакшн‑интеграция требует контроля над ошибками.

Паттерны надёжности

  • Идемпотентность: повтор одного события не создаёт дубликатов.
  • Ретраи: повторяйте только то, что безопасно повторять, и с экспоненциальной задержкой.
  • DLQ (dead letter queue): «сломанные» сообщения не блокируют очередь.
  • Трассировка: correlation_id в логах и событиях.
  • Алерты: всплеск 4xx/5xx, рост времени ответа, переполнение очереди.

Что логировать

Входящее событие (payload), результат валидации, исходящий запрос, код ответа, время выполнения, ключ идемпотентности. Это превращает «не работает» в понятную причину за минуты.

Практический вывод

Надёжность — это функциональность. Если интеграция влияет на оплату, отгрузку и деньги, у неё должны быть метрики и аварийные сценарии.