論文の概要: Targeted Remasking: Replacing Token Editing with Token-to-Mask Refinement in Discrete Diffusion Language Models
- arxiv url: http://arxiv.org/abs/2605.26436v2
- Date: Sun, 31 May 2026 04:33:39 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-15 07:09:36.488582
- Title: Targeted Remasking: Replacing Token Editing with Token-to-Mask Refinement in Discrete Diffusion Language Models
- Title(参考訳): ターゲットリマッシング:離散拡散言語モデルにおける token-to-mask Refinement による token 編集のリプレース
- Authors: Lin Yao,
- Abstract要約: LLaDA2.1は、生成を高速化するToken-to-Token (T2T)編集機構を導入した。
本稿では,T2T編集の学習不要でドロップインの代替品であるToken-to-Mask(T2M)を提案する。
T2Mは、疑わしいトークンをマスク状態にリセットし、拡散過程がよりクリーンなコンテキスト下でそれらを再予測することを可能にする。
- 参考スコア(独自算出の注目度): 0.6916773850242582
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Discrete masked diffusion language models such as LLaDA generate text through iterative denoising, where mask tokens are progressively replaced with predicted tokens. LLaDA2.1 introduced a Token-to-Token (T2T) editing mechanism that accelerates generation by directly replacing committed tokens suspected of being incorrect. However, we identify fundamental limitations of T2T editing: it couples error detection with replacement, pollutes the generation context with potentially incorrect tokens, and introduces a train-inference noise mismatch where systematic model-generated errors differ from the random perturbations seen during training. We propose Token-to-Mask (T2M) remasking, a training-free, drop-in replacement for T2T editing that resets suspected erroneous tokens back to the mask state, allowing the diffusion process to re-predict them under cleaner context. We design and empirically validate three complementary error detection strategies -- probability-based, trigger-mirrored, and temporal-difference-based -- and provide a unified theoretical analysis showing that T2M remasking purifies the generation context, converts systematic inference errors back to the model's native mask noise type, and enables delayed commitment for joint multi-position optimization. Comprehensive experiments across 12 benchmarks spanning knowledge, reasoning, mathematics, coding, and instruction following show that T2M generally improves performance on tasks requiring precise token-level output, with the largest gain on mathematics (+5.92% on CMATH). Error analysis on CMATH reveals that the dominant failure mode is last-mile token corruption -- where correct reasoning produces a corrupted final answer -- and that T2M repairs 59.4% of such cases.
- Abstract(参考訳): LLaDAのような離散的なマスク付き拡散言語モデルでは、マスクトークンを予測トークンに徐々に置き換える反復的復調によってテキストを生成する。
LLaDA2.1はToken-to-Token(T2T)編集機構を導入し、不正と疑われるトークンを直接置き換えることで生成を高速化した。
しかし、T2T編集の基本的な限界は、エラー検出と置換を結合し、生成コンテキストを潜在的に不正なトークンに汚染し、トレーニング中に発生するランダムな摂動と系統的なモデル生成誤差が異なるような列車干渉ノイズミスマッチを導入することである。
本稿では,T2T編集のトレーニング不要でドロップインの代替品であるToken-to-Mask(T2M)のリメイキングを提案する。
我々は、確率ベース、トリガミラー、時間差に基づく3つの相補的エラー検出戦略を設計、実証的に検証し、T2Mリメイキングが生成コンテキストを浄化し、体系的推論誤差をモデル固有のマスクノイズタイプに変換し、連立多重配置最適化のための遅延コミットメントを可能にすることを示す統一理論解析を提供する。
知識、推論、数学、コーディング、命令にまたがる12のベンチマークの総合的な実験により、T2Mは一般に正確なトークンレベルの出力を必要とするタスクのパフォーマンスを改善し、数学における最大の利益(CMATHでは+5.92%)を示している。
CMATHのエラー解析では、主要な障害モードが最後の1マイルのトークンの破損であり、正しい推論によって最終回答が破損し、T2Mが59.4%の修復を行うことが明らかになった。
関連論文リスト
- NAVIRA: Decoupled Stochastic Remasking for Masked Diffusion Language Models [0.0]
PRISMはトークンレベルの品質スコアを学習し、信頼できないトークンを再マスクすることでこの問題に対処する。
この2つの操作を分離する推論時間復号法であるNAVIRAを提案する。
温度制御されたリメイキングは、同じ位置の繰り返し補正を減らす。
論文 参考訳(メタデータ) (2026-06-04T11:24:47Z) - SimSD: Simple Speculative Decoding in Diffusion Language Models [61.33773959352141]
拡散大言語モデル (dLLMs) は、並列またはブロックワイド復号による高速な推論を提供する。
彼らのマスク付き言語モデリングの定式化は、標準的なトークンレベルの投機的復号法とは相容れないままである。
我々は,dLLMに時間的に有効なトークンレベルのコンテキストを付与する,SimSDと呼ばれるdLLMの投機的復号アルゴリズムを提案する。
提案手法は,平均生成品質を維持しつつ,最大7.46倍高い復号スループットを実現する。
論文 参考訳(メタデータ) (2026-06-01T17:46:46Z) - Remask, Don't Replace: Token-to-Mask Refinement in Masked Diffusion Language Models [0.6916773850242582]
LLaDA2.1のような仮設拡散言語モデルは、自身の生成エラーを修正するためにToken-to-Token編集に依存している。
本稿では,その位置をマスク状態にリセットするToken-to-Mask(T2M)再マスクを提案する。
8つのベンチマークで、T2Mは正確なトークンレベルの出力を必要とするタスクの精度を改善する。
論文 参考訳(メタデータ) (2026-04-20T18:43:28Z) - Learn from Your Mistakes: Self-Correcting Masked Diffusion Models [31.536464269884103]
マスク付き拡散モデル(MDM)は自己回帰モデルに代わる有望な代替品として登場している。
本研究では、モデルにアンマキングと修正の両方を行うよう訓練するフレームワークを提案する。
トレーニングとサンプリングの手法をProSeCo(Progressive Self-Correction)と名付けました。
論文 参考訳(メタデータ) (2026-02-12T05:17:31Z) - Residual Context Diffusion Language Models [90.07635240595926]
Residual Context Diffusion (RCD) は、捨てられたトークン表現をコンテキスト残留に変換し、次のデノイングステップでそれらを注入するモジュールである。
RCDは、最小限の計算オーバーヘッドで、5-10ポイントの精度でフロンティアdLLMを一貫して改善する。
論文 参考訳(メタデータ) (2026-01-30T13:16:32Z) - Lookahead Unmasking Elicits Accurate Decoding in Diffusion Language Models [51.12873073612084]
Masked Diffusion Models (MDM) は、反復的にトークンをアンマキングすることで生成される言語モデルであるが、その性能はアンマキングの推測時間順序に依存する。
提案するLookUM(LookUM)は,これらの問題に対処し,サンプリングを可能な全注文に対して経路選択として再構成する。
LookUMはピーク性能を達成するために2~3つの経路しか必要とせず、極めて効率的な経路選択を示す。
論文 参考訳(メタデータ) (2025-11-04T02:37:37Z) - From Denoising to Refining: A Corrective Framework for Vision-Language Diffusion Model [72.73512218682187]
ReDiff(Refining-enhanced diffusion framework)は、モデルに自身のエラーを特定し、修正するように教えるフレームワークである。
まず、合成エラーを修正するためにモデルをトレーニングすることで、基礎的なリビジョン機能を具現化し、次に、新しいオンライン自己補正ループを実装します。
この誤り駆動学習は、モデルに既存の出力を再検討し、洗練する重要な能力を与え、エラーカスケードを効果的に破壊する。
論文 参考訳(メタデータ) (2025-10-22T06:58:55Z) - Finish First, Perfect Later: Test-Time Token-Level Cross-Validation for Diffusion Large Language Models [47.5976588836299]
拡散大言語モデル(dLLM)は、並列デコーディングの高速化や双方向コンテキストモデリングといった利点を提供する。
離散dLLMにおけるバニラデコーディング戦略は、重要な制限に悩まされる。トークンが受け入れられると、後続のステップで修正することはできない。
予測トークン間のクロスバリデーションを利用するトレーニングフリーなデコーディング戦略であるToleratorを提案する。
論文 参考訳(メタデータ) (2025-10-06T17:56:46Z) - Don't Settle Too Early: Self-Reflective Remasking for Diffusion Language Models [40.902681492117786]
RemeDiはマスクベースのDLMで、トークンの分布と各ステップにおけるトークン毎の信頼スコアを予測する。
モデルに不正トークンを検出して再マスクする教師付き微調整を含む、この能力をトレーニングするために、リマスク対応パイプラインをトレーニングします。
実験により、RemeDiは複数のデータセット上のオープンソースのDLMの最先端の結果を達成することが示された。
論文 参考訳(メタデータ) (2025-09-28T05:39:49Z) - Masking as an Efficient Alternative to Finetuning for Pretrained
Language Models [49.64561153284428]
我々は、微調整によって修正する代わりに、事前訓練された重量に対する選択的な二乗マスクを学習する。
内在的評価では、マスキング言語モデルによって計算された表現が、下流タスクの解決に必要な情報を符号化していることを示す。
論文 参考訳(メタデータ) (2020-04-26T15:03:47Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。