跳转至

自动扩缩容

建设中

本文档正在建设中,欢迎贡献内容。

概述

基于请求量和资源使用率的推理服务自动扩缩容。

计划内容

  • HPA 配置(基于 CPU/GPU/自定义指标)
  • KEDA 事件驱动扩缩容
  • Knative Serving 配置
  • 冷启动优化
  • 缩容策略配置

状态: 🚧 待建设