策略自我 Policy Self
強化學習中代理人用於表示自身行動策略的機制,區分當前被最佳化的策略與環境互動所用的策略。
強化學習策略梯度多代理人系統
瀏覽 AITerms.tw 中標籤為「自我對弈」的 AI 術語,快速找到定義、FAQ 與 iPAS 考試重點。
目前篩選:標籤「自我對弈」,共 1 個術語。
同一術語可隸屬多個主題,因此主題數量會重複計算。
主題標籤
A-Z 快速導覽
目前篩選:標籤「自我對弈」 ,共 1 個術語
清除篩選 同一術語可隸屬多個主題,因此主題數量會重複計算。