自动扩缩容¶ 建设中 本文档正在建设中,欢迎贡献内容。 概述¶ 基于请求量和资源使用率的推理服务自动扩缩容。 计划内容¶ HPA 配置(基于 CPU/GPU/自定义指标) KEDA 事件驱动扩缩容 Knative Serving 配置 冷启动优化 缩容策略配置 状态: 🚧 待建设