論文の概要: Guided Trajectory Optimization with Sparse Scaling for Test-Time Diffusion
- arxiv url: http://arxiv.org/abs/2605.21907v1
- Date: Thu, 21 May 2026 02:30:01 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-22 20:14:18.509641
- Title: Guided Trajectory Optimization with Sparse Scaling for Test-Time Diffusion
- Title(参考訳): テスト時間拡散のためのスパーススケーリングを用いた誘導軌道最適化
- Authors: Gang Dai, Yining Huang, Yiming Xia, Guohao Chen, Shuaicheng Niu,
- Abstract要約: 拡散モデルの生成ポテンシャルを解放するために,Reward-guided Trajectory Scaling法を提案する。
既存の方法とは異なり、RTSは2つのコア・イノベーションを通じて洗練された高忠実な画像の合成を促進する。
実験では、GenEval Scoreのベースラインが15.6%向上し、ImageRewardスコアが60.4%向上し、新たなSOTAが設定された。
- 参考スコア(独自算出の注目度): 12.576259610691851
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: The efficient Test-Time Scaling (TTS) paradigm offers a promising perspective for enhancing the generation performance of diffusion models. However, current solutions are limited to a static, pre-defined noise pool and suffer from inflexible noise exploration across the denoising trajectory. To bridge this gap, we propose RTS, a novel Reward-guided Trajectory Scaling method to fully unlock the generative potential of diffusion models. Unlike existing methods, RTS facilitates the synthesis of refined, high-fidelity images via two core innovations: 1) a reward-guided noise optimization strategy to actively direct the search towards promising regions; and 2) a sparse test-time scaling framework together with a PCA-driven curvature analysis scheme to prioritize key intermediate steps in the entire denoising space, effectively compressing the search space. Experiments show our approach outperforms baselines by 15.6% across GenEval Score, and a 60.4% enhancement in ImageReward score, setting a new SOTA while providing a practical guideline for more effective test-time scaling across diffusion-specific architectures.
- Abstract(参考訳): 効率的なテスト時間スケーリング(TTS)パラダイムは、拡散モデルの生成性能を高めるための有望な視点を提供する。
しかし、現在の解法は、静的で事前定義されたノイズプールに限られており、騒音を抑える軌道を横断する反射性ノイズ探査に悩まされている。
このギャップを埋めるために、拡散モデルの生成可能性を完全に解放する新しいReward-guided Trajectory Scaling法であるRTSを提案する。
既存の方法とは異なり、RTSは2つのコア・イノベーションを通じて洗練された高忠実な画像の合成を促進する。
1)有望な地域への探索を積極的に指示する報奨誘導雑音最適化戦略
2)PCA駆動の曲率解析手法と併用したスパーステストタイムスケーリングフレームワークにより,デノナイジング空間全体の重要な中間ステップを優先順位付けし,探索空間を効果的に圧縮する。
実験では、GenEval Scoreのベースラインが15.6%向上し、ImageRewardスコアが60.4%向上し、新しいSOTAが設定された。
関連論文リスト
- FAST: Topology-Aware Frequency-Domain Distribution Matching for Coreset Selection [19.148841575715746]
コアセット選択はデータセットをコンパクトで代表的なサブセットに圧縮し、ディープニューラルネットワークをトレーニングする際のエネルギーと計算負担を軽減する。
DNNフリーな分散マッチングコアセット選択フレームワークであるFASTを提案する。
FASTは評価された全てのベンチマークで最先端のコアセット選択法を著しく上回り、平均精度は9.12%向上した。
論文 参考訳(メタデータ) (2025-11-22T09:24:57Z) - Joint Learning of Pose Regression and Denoising Diffusion with Score Scaling Sampling for Category-level 6D Pose Estimation [19.996312940214363]
カテゴリレベルの6次元オブジェクトのポーズ推定のための新しいパイプラインを提案する。
提案手法は, 直接ポーズ回帰ヘッドを用いてエンコーダを事前訓練し, 回帰ヘッドとデノナイジング拡散ヘッドを介してネットワークを共同学習する。
サンプリングガイダンスは、最終段階における高品質なポーズ生成を確保しつつ、初期復調段階における対称物体のマルチモーダル特性を維持する。
論文 参考訳(メタデータ) (2025-10-05T09:58:51Z) - SimpleGVR: A Simple Baseline for Latent-Cascaded Video Super-Resolution [46.311223206965934]
後続の超解像モデルの設計原理について検討し,その設計原理について検討する。
まず、ベースモデルの出力特性をよりよく模倣し、VSRモデルと上流ジェネレータとの整合性を確保するための2つのトレーニングペアを生成する方法を提案する。
第2に,(1)時間ステップサンプリング戦略,(2)低分解能(LR)入力に対する雑音増強効果の系統的解析を通じて,VSRモデル行動に対する批判的洞察を提供する。
論文 参考訳(メタデータ) (2025-06-24T17:57:26Z) - One-Step Diffusion Model for Image Motion-Deblurring [85.76149042561507]
本稿では,脱臭過程を1段階に短縮する新しいフレームワークである脱臭拡散モデル(OSDD)を提案する。
拡散モデルにおける忠実度損失に対処するために,構造復元を改善する改良された変分オートエンコーダ(eVAE)を導入する。
提案手法は,実測値と非参照値の両方で高い性能を達成する。
論文 参考訳(メタデータ) (2025-03-09T09:39:57Z) - Fast T2T: Optimization Consistency Speeds Up Diffusion-Based Training-to-Testing Solving for Combinatorial Optimization [83.65278205301576]
雑音レベルから与えられたインスタンスの最適解への直接写像を学習し、最小限のショットで高品質な生成を容易にすることを提案する。
これは、サンプル間の差を最小限に抑える最適化一貫性トレーニングプロトコルによって達成される。
The Traveling Salesman Problem (TSP) と Maximal Independent Set (MIS) は、ソリューションの品質と効率の両方に関して、Fast T2Tの優位性を実証している。
論文 参考訳(メタデータ) (2025-02-05T07:13:43Z) - Arbitrary-steps Image Super-resolution via Diffusion Inversion [68.78628844966019]
本研究では,拡散インバージョンに基づく新しい画像超解像(SR)手法を提案する。
本研究では,拡散モデルの中間状態を構築するための部分雑音予測戦略を設計する。
トレーニングが完了すると、このノイズ予測器を使用して、拡散軌道に沿ってサンプリングプロセスを部分的に初期化し、望ましい高分解能結果を生成する。
論文 参考訳(メタデータ) (2024-12-12T07:24:13Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。