---
title: "水平自動擴縮器（Horizontal Pod Autoscaler）"
slug: horizontal-pod-autoscaler
language: zh-TW
source: https://aiterms.tw/terms/horizontal-pod-autoscaler
updated_at: 2026-07-04
tags: [模型部署, MLOps, source:ipas]
ipas_term: true
---

# 水平自動擴縮器（Horizontal Pod Autoscaler）

根據資源使用率自動增減 Kubernetes 叢集中 Pod 數量的機制，確保應用效能並最佳化資源配置。

## 完整說明

Horizontal Pod Autoscaler 是一種 Kubernetes 內建資源，用於根據資源使用率自動調整 Pod 副本數量。它能在流量高峰時動態擴容維持服務穩定，低谷時縮容節省成本，常見應用包括微服務、模型推論與高併發服務部署。

## iPAS 考試出題分析

屬於未分類考範圍。

## 常見問題

### Horizontal Pod Autoscaler 是否支援基於自訂指標進行擴縮？

是的，Horizontal Pod Autoscaler 完全支援基於自訂指標與外部指標來執行自動擴縮決策。雖然預設情況下它依賴基礎的資源使用率，但透過部署指標適配器，使用者可以將應用程式特定的業務指標暴露給指標 API，例如每秒的 HTTP 請求數量或是機器學習推論的延遲時間。這種彈性使得開發團隊能夠根據實際影響使用者體驗的業務指標來精確控制運算資源的分配，從而構建出更符合實際業務需求的動態調配系統。

### 在配置 Horizontal Pod Autoscaler 時，為何 Pod 的資源請求設定如此關鍵？

Horizontal Pod Autoscaler 在評估基於百分比的資源指標時，必須有一個計算的基準值，而這個基準值正是來自於配置清單中所定義的資源請求。如果開發者在部署應用程式時遺漏了資源請求宣告，控制平面將無法得知該資源的百分之一百代表多少實體運算能力，進而導致資源使用率的計算無法進行，自動擴縮機制也會因此失效。準確配置每一個容器的資源請求，是確保機制能夠正常運作的最基本前提。

### Horizontal Pod Autoscaler 和 Cluster Autoscaler 應該如何協同運作？

這兩者在系統架構中負責不同層級的資源調度，結合使用能達成極佳的運作效果。Horizontal Pod Autoscaler 專注於應用程式層級，透過增加 Pod 數量來應對流量高峰；然而它的擴展能力受限於叢集現有節點的剩餘資源總量。當叢集資源耗盡時，新建立的 Pod 會處於等待調度狀態。此時 Cluster Autoscaler 會偵測到這些無法運作的 Pod，並自動請求增添新的運算節點以確保系統順利啟動。

---

來源：https://aiterms.tw/terms/horizontal-pod-autoscaler
快查頁：https://aiterms.tw/terms/horizontal-pod-autoscaler
最後更新：2026/07/04
深度解說：https://aiterms.tw/learning/what-is-horizontal-pod-autoscaler