LLM 抽象层中的 Middleware/Callback 系统设计相关主题: [[error-handling-retries]], [[streaming-patterns]], [[observability-telemetry]]