論文の概要: FreeInv: Free Lunch for Improving DDIM Inversion
- arxiv url: http://arxiv.org/abs/2503.23035v1
- Date: Sat, 29 Mar 2025 10:47:43 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-04-01 14:36:04.805341
- Title: FreeInv: Free Lunch for Improving DDIM Inversion
- Title(参考訳): FreeInv: DDIMのインバージョンを改善するフリーランチ
- Authors: Yuxiang Bao, Huijie Liu, Xun Gao, Huan Fu, Guoliang Kang,
- Abstract要約: DDIMの逆転過程は通常、軌道偏差の問題に悩まされる。
本研究では,この問題をより効果的かつ効率的に解決するための,ほぼフリーランチ手法(FreeInv)を提案する。
FreeInv は従来の DDIM の逆転よりも優れており,従来の最先端の逆転法と競合することを示す。
- 参考スコア(独自算出の注目度): 11.858488956842212
- License:
- Abstract: Naive DDIM inversion process usually suffers from a trajectory deviation issue, i.e., the latent trajectory during reconstruction deviates from the one during inversion. To alleviate this issue, previous methods either learn to mitigate the deviation or design cumbersome compensation strategy to reduce the mismatch error, exhibiting substantial time and computation cost. In this work, we present a nearly free-lunch method (named FreeInv) to address the issue more effectively and efficiently. In FreeInv, we randomly transform the latent representation and keep the transformation the same between the corresponding inversion and reconstruction time-step. It is motivated from a statistical perspective that an ensemble of DDIM inversion processes for multiple trajectories yields a smaller trajectory mismatch error on expectation. Moreover, through theoretical analysis and empirical study, we show that FreeInv performs an efficient ensemble of multiple trajectories. FreeInv can be freely integrated into existing inversion-based image and video editing techniques. Especially for inverting video sequences, it brings more significant fidelity and efficiency improvements. Comprehensive quantitative and qualitative evaluation on PIE benchmark and DAVIS dataset shows that FreeInv remarkably outperforms conventional DDIM inversion, and is competitive among previous state-of-the-art inversion methods, with superior computation efficiency.
- Abstract(参考訳): Naive DDIM の逆転過程は通常、軌道偏差の問題に悩まされる。
この問題を緩和するために、従来の手法はずれを緩和するか、ミスマッチエラーを減らすために面倒な補償戦略を設計することを学び、かなりの時間と計算コストがかかる。
本研究では,この問題をより効果的かつ効率的に解決するための,ほぼフリーランチ手法(FreeInv)を提案する。
FreeInvでは、潜在表現をランダムに変換し、対応する反転と再構成の時間ステップの間に変換を保持する。
複数の軌跡に対するDDIM逆転過程のアンサンブルが期待値よりも小さい軌道ミスマッチ誤差をもたらすという統計的視点から動機付けられている。
さらに,理論解析および実証研究により,FreeInvが複数の軌道の効率的なアンサンブルを行うことを示す。
FreeInvは、既存のインバージョンベースの画像およびビデオ編集技術に自由に統合できる。
特にビデオシーケンスを反転させるためには、より忠実さと効率性が向上する。
PIEベンチマークとDAVISデータセットの総合的定量的定性評価は、FreeInvが従来のDDIMインバージョンよりも著しく優れており、従来の最先端のインバージョン手法と競合し、計算効率が優れていることを示している。
関連論文リスト
- ETS: Efficient Tree Search for Inference-Time Scaling [61.553681244572914]
テストタイムの計算スケーリングにおいて有望なアプローチのひとつは、プロセス報酬モデルに対する検索である。
木探索過程における軌跡の多様性は、多様性の増大がさらなる探索を促進するため、探索の精度に影響を与える。
本稿では,冗長なトラジェクトリを抽出し,必要な多様なトラジェクトリを維持しながら,KVの共有を促進する効率的なツリー探索(ETS)を提案する。
論文 参考訳(メタデータ) (2025-02-19T09:30:38Z) - Improving Decoupled Posterior Sampling for Inverse Problems using Data Consistency Constraint [13.285652967956652]
本稿では,逆問題に対するGDPS ( Guided Decoupled Posterior Smpling) を提案する。
我々はこの手法を潜在拡散モデルとツイーディの公式に拡張する。
GDPSは最先端のパフォーマンスを実現し、既存の手法よりも精度を向上させる。
論文 参考訳(メタデータ) (2024-12-01T03:57:21Z) - Truncating Trajectories in Monte Carlo Policy Evaluation: an Adaptive Approach [51.76826149868971]
モンテカルロシミュレーションによる政策評価は多くのMC強化学習(RL)アルゴリズムの中核にある。
本研究では,異なる長さの軌跡を用いた回帰推定器の平均二乗誤差のサロゲートとして品質指標を提案する。
本稿では,Robust and Iterative Data Collection Strategy Optimization (RIDO) という適応アルゴリズムを提案する。
論文 参考訳(メタデータ) (2024-10-17T11:47:56Z) - Efficient Diffusion as Low Light Enhancer [63.789138528062225]
RATR(Reflectance-Aware Trajectory Refinement)は、イメージの反射成分を用いて教師の軌跡を洗練するための、シンプルで効果的なモジュールである。
textbfReDDiT (textbfDistilled textbfTrajectory) は低照度画像強調(LLIE)に適した効率的で柔軟な蒸留フレームワークである。
論文 参考訳(メタデータ) (2024-10-16T08:07:18Z) - EasyInv: Toward Fast and Better DDIM Inversion [107.52083973660899]
本稿では DDIM インバージョンへの容易かつ斬新なアプローチである EasyInv を紹介する。
EasyInvの中核となるのは、逆ノイズを近似するための洗練された戦略です。
我々は、EasyInvが従来のDDIMインバージョン手法と同等かそれ以上の結果を提供することができることを説明している。
論文 参考訳(メタデータ) (2024-08-09T16:31:02Z) - Contextual Linear Optimization with Bandit Feedback [35.692428244561626]
文脈線形最適化(CLO)は、ランダムコスト係数の不確実性を低減するために予測的文脈特徴を用いる。
我々は,帯域幅フィードバックを用いたCLOのためのオフライン学習アルゴリズムのクラスについて検討する。
IERMに対する高速な後悔境界を示し、不特定モデルクラスと最適化推定の柔軟な選択を可能にする。
論文 参考訳(メタデータ) (2024-05-26T13:27:27Z) - ASPIRE: Iterative Amortized Posterior Inference for Bayesian Inverse Problems [0.974963895316339]
機械学習と変分推論(VI)の新たな進歩は、例から学ぶことによって計算障壁を下げた。
異なるトレードオフを表す2つのVIパラダイムが登場した。
我々は,同じネットワークアーキテクチャとトレーニングデータを用いて,償却後部を反復的に改善するソリューションを提案する。
論文 参考訳(メタデータ) (2024-05-08T20:03:12Z) - Improving Diffusion Models for Inverse Problems using Manifold Constraints [55.91148172752894]
我々は,現在の解法がデータ多様体からサンプルパスを逸脱し,エラーが蓄積することを示す。
この問題に対処するため、多様体の制約に着想を得た追加の補正項を提案する。
本手法は理論上も経験上も従来の方法よりも優れていることを示す。
論文 参考訳(メタデータ) (2022-06-02T09:06:10Z) - Soft-IntroVAE: Analyzing and Improving the Introspective Variational
Autoencoder [23.04222873330133]
Soft-IntroVAEは、生成されたサンプルのスムーズな指数的損失でヒンジ損失項を置き換える修正されたIntroVAEです。
我々は、IntroVAEがデータ分布とエントロピー項からのKL距離の合計を最小化する分布に収束することを示した。
本稿では,非教師なし画像翻訳と分布外検出に対するsoft-introvaeの2つの応用について述べる。
論文 参考訳(メタデータ) (2020-12-24T13:53:29Z) - Learning Low-rank Deep Neural Networks via Singular Vector Orthogonality
Regularization and Singular Value Sparsification [53.50708351813565]
各ステップにSVDを適用することなく、トレーニング中に低ランクDNNを明示的に達成する最初の方法であるSVDトレーニングを提案する。
SVDトレーニングがDNN層のランクを著しく低減し,同じ精度で計算負荷の低減を実現することを実証的に示す。
論文 参考訳(メタデータ) (2020-04-20T02:40:43Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。