---
title: "時間抽象化（Temporal Abstraction）"
slug: temporal-abstraction
language: zh-TW
source: https://aiterms.tw/terms/temporal-abstraction
updated_at: 2026-07-04
tags: [強化學習, 機器學習, AI基礎, source:arxiv]
ipas_term: false
---

# 時間抽象化（Temporal Abstraction）

時間抽象化將一連串底層動作封裝為高階技能，使強化學習模型能在更長的時間尺度上決策與規劃。

## 完整說明

時間抽象化是一種強化學習中的機制，用於將多個基本動作組合成持續一段時間的高階巨集動作或選項。它能夠縮短長序列決策所需的步數，提升學習效率與探索能力，常見應用包括機器人控制、自動駕駛系統與複雜策略遊戲等領域。

## 常見問題

### 時間抽象化中的「選項 (Options)」和一般的「動作 (Actions)」有什麼不同？

一般的動作是代理程式在單一時間步長內可以執行的最基本微觀操作，例如向左移動一個單位或對關節施加特定大小的力矩，這類動作通常只影響下一瞬間的狀態。選項則是由多個基本動作組成的序列集合，並且明確包含啟動條件和終止條件。選項可以持續多個時間步長，例如「走到會議室門口」或「平穩地拿起水杯」。選項本質上是一種高階技能或巨集動作，使代理程式能夠在更長的時間尺度上進行宏觀規劃，而不必在每一毫秒都重新評估所有底層動作的優劣。

### 為什麼在複雜的強化學習環境中需要使用時間抽象化？

當面對狀態空間龐大且任務目標需要經過長序列動作才能達成的環境時，傳統的強化學習演算法會面臨嚴重的維度災難，學習效率與收斂速度極低，特別是在獎勵信號非常稀疏的環境中。時間抽象化透過將零散的動作封裝成持續一段時間的高階技能，大幅減少了代理程式需要進行高階決策的總步數。這不僅加速了策略的學習過程，還使得代理程式能夠更容易且具備方向性地跨越沒有任何獎勵回饋的狀態區域，同時促進了學到的技能在不同相關任務之間的重複利用。

### 時間抽象化中的高階技能是事先定義好的，還是代理程式自己從環境中學習出來的？

這兩種方式在實務中都有應用。在早期的學術研究和許多特定的工業應用場景中，高階技能通常是由人類專家根據對任務領域的深刻理解，手動編寫並事先定義好的。然而，人工設計這些技能需要耗費大量的領域知識與測試時間。近年來，越來越多的研究致力於開發自動化演算法，讓代理程式能夠在與環境互動的過程中，自行發現並學習有用的高階技能表示。自動發現技能可以減少對人工先驗知識的依賴，並有機會找到人類未曾想到的高效行為模式。

---

來源：https://aiterms.tw/terms/temporal-abstraction
快查頁：https://aiterms.tw/terms/temporal-abstraction
最後更新：2026/07/04
深度解說：https://aiterms.tw/learning/what-is-temporal-abstraction