可靠性
PluginHub
可靠集成:幂等、重试、DLQ 与告警
集成故障往往不是一个 bug,而是链式事故:超时 → 重试 → 订单重复 → 人工清理。生产环境必须系统化处理错误。
可靠性模式
- 幂等:同一事件重复处理不产生重复数据。
- 重试:只重试安全操作,使用指数退避。
- DLQ:异常消息进入死信队列,不阻塞主队列。
- 链路追踪:correlation_id 贯穿日志与事件。
- 告警:4xx/5xx 激增、延迟升高、队列堆积。
建议记录:事件内容(脱敏)、校验结果、请求/响应、耗时、幂等键。