Fugu-MT 論文翻訳(概要): Edit-Based Refinement for Parallel Masked Diffusion Language Models

論文の概要: Edit-Based Refinement for Parallel Masked Diffusion Language Models

arxiv url: http://arxiv.org/abs/2605.09603v1
Date: Sun, 10 May 2026 15:31:22 GMT
ステータス: 翻訳完了
システム内更新日: 2026-05-13 02:24:05.534224
Title: Edit-Based Refinement for Parallel Masked Diffusion Language Models
Title（参考訳）: 並列マスク付き拡散言語モデルのための編集ベース精細化
Authors: Houxing Ren, Mingjie Zhan, Zimu Lu, Ke Wang, Yunqiao Yang, Haotian Hou, Junting Pan, Hongsheng Li,
Abstract要約: マスク付き拡散言語モデルは並列トークン生成を可能にし、復号効率を向上させる。本稿では,軽量な後編集ステップで拡散生成を増強する編集ベース改良フレームワークME-DLMを提案する。本手法は,HumanEvalで11.6点,GSM8Kで33.6点,全拡散ステップの8分の1を用いて一貫したゲインを得る。
参考スコア（独自算出の注目度）: 47.05195944319345
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Masked diffusion language models enable parallel token generation and offer improved decoding efficiency over autoregressive models. However, their performance degrades significantly when generating multiple tokens simultaneously, due to a mismatch between token-level training objectives and joint sequence consistency. In this paper, we propose ME-DLM, an edit-based refinement framework that augments diffusion generation with lightweight post-editing steps. After producing an initial complete response, the model refines it through minimal edit operations, including replacement, deletion, and insertion, conditioned on the full sequence. Training supervision is derived from edit distance, providing a deterministic signal under a fixed canonicalization scheme for learning minimal corrections. This approach encourages sequence-level consistency through globally conditioned edits while preserving the efficiency benefits of parallel diffusion decoding. Extensive experiments demonstrate that ME-DLM improves the quality and robustness of multi-token parallel generation. In particular, when built upon LLaDA, our method achieves consistent gains of 11.6 points on HumanEval and 33.6 points on GSM8K while using one-eighth of the total diffusion steps. Code is available at https://github.com/renhouxing/ME-DLM.
Abstract（参考訳）: マスク付き拡散言語モデルは並列トークン生成を可能にし、自己回帰モデルよりもデコード効率が向上する。しかし、トークンレベルのトレーニング目標とジョイントシーケンス一貫性のミスマッチのため、複数のトークンを同時に生成する場合、パフォーマンスは著しく低下する。本稿では,軽量な後編集ステップで拡散生成を増強する編集ベース改良フレームワークME-DLMを提案する。最初の完全なレスポンスを生成した後、モデルは、置換、削除、挿入を含む最小限の編集操作によって、全シーケンスで条件付きでそれを洗練する。訓練指導は編集距離から導かれ、最小限の補正を学習するための固定正準化スキームの下で決定論的信号を提供する。このアプローチは、並列拡散復号の効率性を維持しながら、グローバルな条件付き編集を通してシーケンスレベルの一貫性を促進する。大規模実験により,ME-DLMはマルチトークン並列生成の品質とロバスト性を向上することが示された。特にLLaDAをベースとした場合,HumanEvalでは11.6点,GSM8Kでは33.6点,全拡散ステップの8分の1を用いて一貫した利得が得られる。コードはhttps://github.com/renhouxing/ME-DLM.comで入手できる。

論文の概要: Edit-Based Refinement for Parallel Masked Diffusion Language Models

関連論文リスト