RIVAL - aitoearn

RIVAL

RIVAL: Iterative Adversarial Reinforcement Learning for Machine Translation

RIVAL Framework: Solving Distribution Shift in RLHF for Conversational Subtitle Translation Original AI 2025‑10‑31 12:04 — Shanghai This article introduces the RIVAL framework, designed to address the distribution shift problem in RLHF for conversational subtitle translation via adversarial iterative optimization. --- 1. Overview We present RIVAL (Reinforcement Learning