論文の概要: ReflectMT: Internalizing Reflection for Efficient and High-Quality Machine Translation
- arxiv url: http://arxiv.org/abs/2604.19144v1
- Date: Tue, 21 Apr 2026 06:48:41 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-22 22:41:49.657259
- Title: ReflectMT: Internalizing Reflection for Efficient and High-Quality Machine Translation
- Title(参考訳): ReflectMT: 効率的かつ高品質な機械翻訳のための内部反射
- Authors: Kunquan Li, Yingxue Zhang, Fandong Meng, Jinsong Su,
- Abstract要約: 機械翻訳のための2段階反射内在化アルゴリズムであるReflectMTを提案する。
提案手法は,強化学習を通じて,モデルの「翻訳-反射-精製」機能を開発する。
WMT24のようなデータセットに対する実験結果から、推論時のモデルのファーストパス変換がマルチステップ推論のLRMよりも優れていることが示された。
- 参考スコア(独自算出の注目度): 63.89730738735446
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Recent years have witnessed growing interest in applying Large Reasoning Models (LRMs) to Machine Translation (MT). Existing approaches predominantly adopt a "think-first-then-translate" paradigm. Although explicit reasoning trajectories significantly enhance translation quality, they incur prohibitive inference costs and latency. To address these limitations, we propose ReflectMT, a two-stage reflection internalization algorithm for machine translation that employs a "translate-first-think-later" paradigm. Our approach develops the model's "translate-reflect-refine" capability through reinforcement learning. In the first stage, we cultivate the model's capacity for high-quality reflection and refinement, thereby enhancing its semantic comprehension and task-specific knowledge. In the second stage, we train the model to internalize the knowledge acquired during reflection. As a result, during inference, ReflectMT operates in a direct translation mode, producing high-quality translations on the first attempt without any explicit reasoning steps. Experimental results on datasets such as WMT24 demonstrate that our model's first-pass translations during inference outperform multi-step reasoning LRMs such as DeepSeek-R1 in both automatic metrics and GPT-based evaluation, achieving a 2.16-point improvement in GPT-based translation quality evaluation while reducing token consumption by 94.33%.
- Abstract(参考訳): 近年、機械翻訳(MT)にLRM(Large Reasoning Models)を適用することへの関心が高まっている。
既存のアプローチでは、主に"思想第一の翻訳"パラダイムを採用しています。
明示的な推論トラジェクトリは翻訳品質を著しく向上させるが、それらは推論コストと遅延を禁止している。
このような制約に対処するため,機械翻訳のための2段階のリフレクション内在化アルゴリズムであるReflectMTを提案する。
提案手法は,強化学習を通じて,モデルの「翻訳-反射-精製」機能を開発する。
最初の段階では、高品質なリフレクションとリフレクションのためのモデルの能力を育成し、セマンティック理解とタスク固有の知識を強化する。
第2段階では、リフレクション時に得られた知識を内部化するためにモデルを訓練する。
その結果、推論の間、ReflectionMTは直接翻訳モードで動作し、明示的な推論ステップなしで最初の試みで高品質な翻訳を生成する。
WMT24 などのデータセットを用いた実験結果から,自動測定と GPT に基づく評価の両方において,DepSeek-R1 などのマルチステップ推論におけるモデルのファーストパス翻訳は,トークン消費量を94.33%削減しつつ,GPT ベースの翻訳品質評価において2.16 ポイントの改善を実現していることがわかった。
関連論文リスト
- Unlocking Reasoning Capability on Machine Translation in Large Language Models [57.60641851466707]
推論指向の大規模言語モデル(RLM)は、明示的な中間推論を生成することにより、数学やコーディングといったタスクに強い利益をもたらす。
WMT24++ベンチマークを用いて,オープンおよびクローズドヘビー級のRCMを系統的に評価した。
明示的な推論を可能にすることは、言語やモデル間の翻訳品質を一貫して低下させる。
論文 参考訳(メタデータ) (2026-02-16T14:05:59Z) - Reflective Translation: Improving Low-Resource Machine Translation via Structured Self-Reflection [0.15229257192293197]
isiZuluやisiXhosaのような低リソース言語は、限られた並列データと言語資源のために機械翻訳において永続的な課題に直面している。
大規模言語モデルの最近の進歩は、自己回帰がモデルを批判し、自身の出力を修正させ、推論品質と事実整合性を改善することを示唆している。
本稿では、モデルが初期翻訳を生成し、構造化された自己批判を生成し、このリフレクションを用いて洗練された翻訳を生成するプロンプトベースのフレームワークであるリフレクティブ翻訳を紹介する。
論文 参考訳(メタデータ) (2026-01-27T18:37:09Z) - TasTe: Teaching Large Language Models to Translate through Self-Reflection [82.83958470745381]
大規模言語モデル(LLM)は、様々な自然言語処理タスクにおいて顕著な性能を示した。
本稿では,自己回帰を通した翻訳を行うTasTeフレームワークを提案する。
WMT22ベンチマークにおける4つの言語方向の評価結果から,既存の手法と比較して,提案手法の有効性が示された。
論文 参考訳(メタデータ) (2024-06-12T17:21:21Z) - DUAL-REFLECT: Enhancing Large Language Models for Reflective Translation through Dual Learning Feedback Mechanisms [43.148203559785095]
自己回帰によって強化された大規模言語モデル(LLM)は機械翻訳において有望な性能を達成した。
既存の自己回帰法には効果的なフィードバック情報がなく、翻訳性能が制限されている。
本稿では,翻訳タスクの二重学習を利用して効果的なフィードバックを提供するREFLECTフレームワークを提案する。
論文 参考訳(メタデータ) (2024-06-11T13:10:39Z) - Understanding and Addressing the Under-Translation Problem from the Perspective of Decoding Objective [72.83966378613238]
最新のニューラル・マシン・トランスレーション(NMT)システムでは、アンダー・トランスレーションとオーバー・トランスレーションの2つの課題が残っている。
我々は,NMTにおけるアンダートランスレーションの根本原因を詳細に分析し,デコード目的の観点から解説する。
本研究は,低翻訳の検知器としてEOS(End Of Sentence)予測の信頼性を活用し,低翻訳のリスクが高い候補を罰する信頼性に基づくペナルティを強化することを提案する。
論文 参考訳(メタデータ) (2024-05-29T09:25:49Z) - Thinker-DDM: Modeling Deliberation for Machine Translation with a Drift-Diffusion Process [14.600972421086219]
本稿では,人間翻訳者の動的意思決定を制約リソース下でエミュレートするために,Drift-Diffusion Modelを用いたThinkerを提案する。
WMT22とCommonMTのデータセットを用いて、高リソース、低リソース、コモンセンスの翻訳設定で実験を行う。
また,提案手法の有効性と有効性を示すために,コモンセンス翻訳のさらなる分析と評価を行う。
論文 参考訳(メタデータ) (2024-02-16T14:00:56Z) - Towards Effective Disambiguation for Machine Translation with Large
Language Models [65.80775710657672]
我々は「あいまいな文」を翻訳する大規模言語モデルの能力について研究する。
実験の結果,提案手法はDeepLやNLLBといった最先端システムと5つの言語方向のうち4つで一致し,性能を向上できることがわかった。
論文 参考訳(メタデータ) (2023-09-20T22:22:52Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。