Надёжность
PluginHub
Надёжные интеграции: идемпотентность, ретраи, DLQ и алерты
Интеграции «падают» не из‑за одной ошибки, а из‑за цепочки: таймаут → повтор → дубль заказа → ручная правка. Поэтому продакшн‑интеграция требует контроля над ошибками.
Паттерны надёжности
- Идемпотентность: повтор одного события не создаёт дубликатов.
- Ретраи: повторяйте только то, что безопасно повторять, и с экспоненциальной задержкой.
- DLQ (dead letter queue): «сломанные» сообщения не блокируют очередь.
- Трассировка: correlation_id в логах и событиях.
- Алерты: всплеск 4xx/5xx, рост времени ответа, переполнение очереди.
Что логировать
Входящее событие (payload), результат валидации, исходящий запрос, код ответа, время выполнения, ключ идемпотентности. Это превращает «не работает» в понятную причину за минуты.
Практический вывод
Надёжность — это функциональность. Если интеграция влияет на оплату, отгрузку и деньги, у неё должны быть метрики и аварийные сценарии.