---
title: "迭代反向翻譯（Iterative Back-Translation）"
slug: iterative-back-translation
language: zh-TW
source: https://aiterms.tw/terms/iterative-back-translation
updated_at: 2026-07-04
tags: [自然語言處理, 自監督學習, 模型訓練, 資料處理, source:ipas]
ipas_term: true
---

# 迭代反向翻譯（Iterative Back-Translation）

迭代反向翻譯是一種自然語言處理技術，透過將目標語言翻譯回來源語言生成合成平行語料，並反覆交替訓練正反向模型以提升翻譯品質。

## 完整說明

迭代反向翻譯是一種針對神經機器翻譯系統的資料增強與自監督學習技術，用於解決低資源語言缺乏平行語料的困境。此方法能夠利用龐大的單語資料，透過模型將目標語言翻譯回來源語言，生成大量的合成平行語料，進而反覆微調並優化雙向翻譯模型。常見應用包括低資源語言機器翻譯、跨語言文本生成、風格轉換，以及提升大型語言模型在多語境下的翻譯表現與指令追隨能力。

## iPAS 考試出題分析

屬於未分類考範圍。

## 常見問題

### 為什麼反向翻譯訓練時，目標語言必須是真實單語文本？

在訓練翻譯模型時，解碼器負責根據來源句子的特徵生成目標語言的序列。如果目標語言的句子是機器生成的合成文本，這些文本必然包含不自然的語法或結構上的偏誤。解碼器在學習過程中會吸收這些不良特徵，導致最終生成的句子缺乏流暢度與自然感。因此，確保目標端句子為真實的人類單語文本，可以強迫模型學習真實語言的表達方式。來源端的合成文本雖然含有雜訊，但編碼器對於雜訊的容忍度較高，且訓練重點在於建立跨語言的語意對應。

### 迭代反向翻譯會消耗很多計算資源嗎？可以如何優化？

是的，迭代反向翻譯的計算成本極高。在每一輪迭代中，必須使用模型對海量的單語資料進行推論生成，然後再進行模型訓練。這需要大量的運算資源。為了解決運算瓶頸，實務上會採用多種優化策略。例如在生成階段使用較小的束搜尋寬度，或者使用非自迴歸模型來加速。其次，不需要在每一輪重新翻譯所有的單語資料，可以採用抽樣的方式。此外，採用非同步的訓練架構，讓資料生成與模型訓練並行運作，也是縮短實驗週期的有效工程手段。

### 在大型語言模型當道的現在，迭代反向翻譯還有應用價值嗎？

大型語言模型雖然展現了驚人的零樣本翻譯能力，但迭代反向翻譯的核心思想仍然極具價值。對於許多低資源語言或特定專業領域，模型可能缺乏足夠的訓練數據，導致翻譯品質不穩定。在這種情況下，研究人員會利用大型語言模型作為反向模型，對單語資料進行高質量的翻譯生成合成語料，進而對模型本身進行微調。此外，在構建跨語言的指令微調資料集時，迭代反向翻譯的流程常被用來驗證資料的一致性與品質，是增強模型多語能力的重要工具。

---

來源：https://aiterms.tw/terms/iterative-back-translation
快查頁：https://aiterms.tw/terms/iterative-back-translation
最後更新：2026/07/04
深度解說：https://aiterms.tw/learning/what-is-iterative-back-translation