可靠性 PluginHub

可靠集成:幂等、重试、DLQ 与告警

集成故障往往不是一个 bug,而是链式事故:超时 → 重试 → 订单重复 → 人工清理。生产环境必须系统化处理错误

可靠性模式

  • 幂等:同一事件重复处理不产生重复数据。
  • 重试:只重试安全操作,使用指数退避。
  • DLQ:异常消息进入死信队列,不阻塞主队列。
  • 链路追踪:correlation_id 贯穿日志与事件。
  • 告警:4xx/5xx 激增、延迟升高、队列堆积。

建议记录:事件内容(脱敏)、校验结果、请求/响应、耗时、幂等键。