論文の概要: Rethinking One-Step Image Editing through ChordEdit: Reproduction, Simplification, and New Insights
- arxiv url: http://arxiv.org/abs/2606.14042v1
- Date: Fri, 12 Jun 2026 02:35:45 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-15 16:00:42.717942
- Title: Rethinking One-Step Image Editing through ChordEdit: Reproduction, Simplification, and New Insights
- Title(参考訳): コード編集によるワンステップ画像編集の再考:再現、単純化、新たな洞察
- Authors: Minghan Li, Jeremy Moebel, Mengyu Wang,
- Abstract要約: 1ステップの画像編集は、テキストガイドによる編集を速く、実用的で、デプロイしやすいものにするために重要である。
再生,アブレーション,単純化を通じて,コード編集を再考する。
- 参考スコア(独自算出の注目度): 3.9337184784112917
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: One-step image editing is important for making text-guided editing fast, practical, and easy to deploy, but its underlying mechanism is still not fully understood. We revisit ChordEdit through reproduction, ablation, and simplification. Our analysis shows that a) the chord window $δ$ largely acts as an effective timestep shift from $t$ to $t - δ$; b) chord transport acts on high-noise images and mainly performs low-frequency semantic editing; and c) proximal alignment acts on low-noise images and complements it by adding high-frequency target details. In this view, ChordEdit naturally decomposes editing into a coarse low-frequency transport stage and a fine high-frequency alignment stage. These findings suggest a path toward prompt-conditioned dynamic timestep selection for adaptive image editing. All code and results can be found at \href{https://github.com/Harvard-AI-and-Robotics-Lab/ChordEdit-Reproduction}{link}.
- Abstract(参考訳): 一段階の画像編集は、テキストガイドによる編集を速く、実用的で、デプロイしやすいものにするために重要であるが、その基盤となるメカニズムはまだ完全には理解されていない。
再生,アブレーション,単純化を通じて,コード編集を再考する。
私たちの分析は
a) コードウィンドウ$δ$は、主に$t$から$t - δ$;への効果的なタイムステップシフトとして機能します。
ロ コード転送が高ノイズ画像に作用し、主に低周波意味編集を行うこと。
c) 近位アライメントは,低ノイズ画像に作用し,高周波ターゲットの詳細を付加することによりそれを補完する。
この視点では、ChordEditは編集を粗い低周波輸送ステージと微細な高周波アライメントステージに自然に分解する。
これらの結果から,適応画像編集における動的時間ステップ選択への道筋が示唆された。
すべてのコードと結果は、 \href{https://github.com/Harvard-AI-and-Robotics-Lab/ChordEdit-Reproduction}{link}で見ることができる。
関連論文リスト
- DirectEdit: Step-Level Accurate Inversion for Flow-Based Image Editing [51.56484100374058]
我々は、事前訓練されたテキスト・ツー・イメージ(T2I)モデルのトレーニング不要な編集方法であるDirectEditを提案する。
DirectEditは、追加の神経機能評価(NFE)を導入することなく、固有の再構成エラーを除去する
実験により、DirectEditは効率よく正確な画像編集を実現し、最先端の手法よりも優れたパフォーマンスを提供することが示された。
論文 参考訳(メタデータ) (2026-05-04T10:09:18Z) - SpotEdit: Selective Region Editing in Diffusion Transformers [66.44912649206553]
SpotEditは、修正されたリージョンのみを選択的に更新する、トレーニング不要な拡散編集フレームワークである。
不要な計算を削減し、未修正領域で高い忠実性を維持することにより、SpotEditは効率よく正確な画像編集を実現する。
論文 参考訳(メタデータ) (2025-12-26T14:59:41Z) - FlowDC: Flow-Based Decoupling-Decay for Complex Image Editing [52.54102743380658]
本稿では,複雑な編集を複数のサブ編集エフェクトに分離し,編集プロセス中に並列に重畳するFlowDCを提案する。
FlowDCは既存の方法に比べて優れた結果を示した。
論文 参考訳(メタデータ) (2025-12-12T09:08:39Z) - Group Relative Attention Guidance for Image Editing [38.299491082179905]
Group Relative Attention Guidance (GRAG) は、編集命令に対する入力画像に対するモデルの焦点を変調するシンプルで効果的な方法である。
私たちのコードはhttps://www.littlemisfit.com/little-misfit/GRAG-Image-Editing.comでリリースされます。
論文 参考訳(メタデータ) (2025-10-28T17:22:44Z) - Visual Autoregressive Modeling for Instruction-Guided Image Editing [97.04821896251681]
画像編集を次世代の予測問題として再編成する視覚的自己回帰フレームワークを提案する。
VarEditは、正確な編集を実現するために、マルチスケールのターゲット機能を生成する。
1.2秒で512times512$編集を完了し、同じサイズのUltraEditよりも2.2$times$高速になった。
論文 参考訳(メタデータ) (2025-08-21T17:59:32Z) - Exploring Iterative Manifold Constraint for Zero-shot Image Editing [38.7483790652481]
我々はZZEditと呼ばれる新しいゼロショット編集パラダイムを提案する。
より優れた編集ピボットとして$z_p$とマークされた適格な中間反転子を見つける。
我々のZZEditは、$M_p$と$M_p-1$の多様体間の反復多様体制約を実行し、忠実度誤差を少なくする。
論文 参考訳(メタデータ) (2025-01-07T09:00:36Z) - TurboEdit: Text-Based Image Editing Using Few-Step Diffusion Models [53.757752110493215]
テキストベースの一般的な編集フレームワーク – 編集フレンドリーなDDPM-noiseインバージョンアプローチ – に注目します。
高速サンプリング法への適用を解析し、その失敗を視覚的アーティファクトの出現と編集強度の不足という2つのクラスに分類する。
そこで我々は,新しいアーティファクトを導入することなく,効率よく編集の規模を拡大する疑似誘導手法を提案する。
論文 参考訳(メタデータ) (2024-08-01T17:27:28Z) - FreeDiff: Progressive Frequency Truncation for Image Editing with Diffusion Models [44.26371926512843]
我々は、プログレッシブな$textbfFre$qu$textbfe$ncy truncationを用いて、ユニバーサル編集タスクのための$textbfDiff$usionモデルのガイダンスを洗練するために、新しいフリーアプローチを導入する。
本手法は,様々な編集タスクや多様な画像に対して,最先端の手法で比較結果を得る。
論文 参考訳(メタデータ) (2024-04-18T04:47:28Z) - EditGAN: High-Precision Semantic Image Editing [120.49401527771067]
EditGANは高品質で高精度なセマンティック画像編集のための新しい手法である。
EditGANは前例のない細部と自由度で画像を操作可能であることを示す。
また、複数の編集を組み合わせることも簡単で、EditGANのトレーニングデータ以外の編集も可能になります。
論文 参考訳(メタデータ) (2021-11-04T22:36:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。