論文の概要: When to Plan, When to Polish: Noise Level as a Granularity Axis for Diffusion Language Models
- arxiv url: http://arxiv.org/abs/2606.21802v1
- Date: Fri, 19 Jun 2026 23:49:42 GMT
- ステータス: 情報取得中
- システム内更新日: 2026-06-23 15:11:47.590199
- Title: When to Plan, When to Polish: Noise Level as a Granularity Axis for Diffusion Language Models
- Title(参考訳): 計画時, ポーランド語時:拡散言語モデルにおける粒度軸としての雑音レベル
- Authors: Peihong Li, Yuanjie Shi, Yan Yan,
- Abstract要約: ノイズ依存粒度制御(NDGC)は、ノイズレベルを粒度キューとして用いる単一レベル拡散法である。
高ノイズステップはコヒーレントトークングループを使用して早期の意味のコミットメントをサポートし、低ノイズステップはトークンレベルの改善に戻す。
NDGCは、初期の骨格形成、より良い秩序回復、より健康的な出力を示す。
- 参考スコア(独自算出の注目度): 10.617203351148396
- License:
- Abstract: Standard tokenwise diffusion LMs keep training corruption and inference commitment at token granularity throughout denoising. At high noise, this leaves scattered local fragments rather than coherent evidence, making it hard to form early coarse structure, exactly what planning-sensitive generation requires. Hierarchical planning methods add coarse stages to separate planning from wording, but they need extra planners, block latents, or two stage designs. We propose Noise Dependent Granularity Control (NDGC), a single-level diffusion method that uses the noise level as a granularity cue. NDGC aligns training exposure and inference commitment with denoising progress. High noise steps use coherent token groups to support early meaning commitment, while low noise steps return to token level refinement. This creates planning like coarse to fine denoising without an explicit planner or hierarchical architecture. Across controlled tests, ablations, and WritingPrompts, NDGC shows earlier skeleton formation, better ordered recovery, and healthier outputs.
- Abstract(参考訳): 標準的なトークンワイド拡散LMは、デノナイジング全体を通してトークンの粒度における汚職と推論のコミットメントをトレーニングし続ける。
高騒音下では、これはコヒーレントな証拠ではなく、局所的な断片を散布し、計画に敏感な生成に必要な初期粗い構造を形成するのが困難になる。
階層的な計画手法は、言葉から計画を分離するために粗い段階を追加するが、それらは追加のプランナー、ブロックラテント、または2つのステージ設計を必要とする。
ノイズレベルを粒度キューとして用いる単一レベル拡散法であるノイズ依存粒度制御(NDGC)を提案する。
NDGCは、トレーニングの露出と推論のコミットメントを、進歩を損なうように調整する。
高ノイズステップはコヒーレントトークングループを使用して早期の意味のコミットメントをサポートし、低ノイズステップはトークンレベルの改善に戻る。
これにより、明確なプランナーや階層的アーキテクチャなしに、粗悪できめ細かな装飾を行うような計画が作成されます。
コントロールされたテスト、アブレーション、およびライティングプロンプツ全体において、NDGCは、初期の骨格の形成、より良い順序回復、より健康的な出力を示している。
関連論文リスト
- Plan First, Diffuse Later: Extrinsic Graph Guidance for Long-Horizon Diffusion Planning [44.52185127499181]
構成拡散モデルは、長期計画への有望なルートを提供する。
しかし、長鎖上の局所的な振る舞いを強制することは、コヒーレントなグローバル構造が現れるには不十分であることが多い。
最近の研究は本質的な探索を通じてこの限界に対処し、復調過程において複数の経路を探索している。
論文 参考訳(メタデータ) (2026-05-16T07:53:04Z) - HiAR: Efficient Autoregressive Long Video Generation via Hierarchical Denoising [52.237486207964245]
HiARは階層的なデノベーションフレームワークで、従来の世代順を逆転させる。
発声ステップ毎に全てのブロックを因果生成し、各ブロックが常に同じノイズレベルでコンテキストで条件付けされるようにする。
VBench(20世代)では、HiARは比較したすべての方法の中で最高の総合スコアと最低時間ドリフトを達成する。
論文 参考訳(メタデータ) (2026-03-09T17:58:16Z) - Mitigating the Noise Shift for Denoising Generative Models via Noise Awareness Guidance [54.88271057438763]
ノイズアウェアネスガイダンス (NAG) は、事前に定義された騒音スケジュールと整合性を保つために、サンプリング軌道を明示的に制御する補正手法である。
NAGは一貫してノイズシフトを緩和し、主流拡散モデルの生成品質を大幅に改善する。
論文 参考訳(メタデータ) (2025-10-14T13:31:34Z) - SparseD: Sparse Attention for Diffusion Language Models [98.05780626106555]
拡散言語モデル(DLM)は自己回帰モデル(AR)に代わる有望な代替手段を提供する
既存のオープンソースDLMは、高い推論遅延に悩まされている。
DLMのための新しいスパースアテンション手法であるスパースDを提案する。
論文 参考訳(メタデータ) (2025-09-28T18:10:10Z) - Blind-Spot Guided Diffusion for Self-supervised Real-World Denoising [55.099717395320276]
Blind-Spot Guided Diffusionは、現実のイメージをデノナイズするための新しい自己教師型フレームワークである。
提案手法は,盲点ネットワーク(BSN)の限界と,自己教師型認知への拡散モデルの適用の難しさの2つに対処する。
論文 参考訳(メタデータ) (2025-09-19T15:35:07Z) - Robust Prompt Tuning for Vision-Language Models with Mild Semantic Noise [9.536089523962486]
本稿では弱いセマンティックノイズを積極的に組み込んだ堅牢なプロンプトチューニングフレームワークであるANPromptを提案する。
我々は、ANPromptが既存のプロンプトチューニング手法より一貫して優れていることを示す。
セマンティックノイズに対して優れたロバスト性を提供し、タスク間の一般化を改善している。
論文 参考訳(メタデータ) (2025-08-06T17:42:30Z) - Latent Class-Conditional Noise Model [54.56899309997246]
本稿では,ベイズ的枠組みの下での雑音遷移をパラメータ化するためのLatent Class-Conditional Noise Model (LCCN)を提案する。
次に、Gibs sampler を用いて遅延真のラベルを効率的に推測できる LCCN の動的ラベル回帰法を導出する。
提案手法は,サンプルのミニバッチから事前の任意チューニングを回避するため,ノイズ遷移の安定な更新を保護している。
論文 参考訳(メタデータ) (2023-02-19T15:24:37Z) - Simultaneous Denoising and Dereverberation Using Deep Embedding Features [64.58693911070228]
ディープ埋め込み特徴を用いた同時発声・発声同時学習法を提案する。
ノイズ発生段階では、DCネットワークを利用してノイズのないディープ埋込み特性を抽出する。
残響段階では、教師なしのK平均クラスタリングアルゴリズムの代わりに、別のニューラルネットワークを用いて無響音声を推定する。
論文 参考訳(メタデータ) (2020-04-06T06:34:01Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。