Fugu-MT 論文翻訳(概要): Semantic Image Inversion and Editing using Rectified Stochastic Differential Equations

論文の概要: Semantic Image Inversion and Editing using Rectified Stochastic Differential Equations

arxiv url: http://arxiv.org/abs/2410.10792v1
Date: Mon, 14 Oct 2024 17:56:24 GMT
ステータス: 翻訳完了
システム内更新日: 2024-10-29 19:34:54.148906
Title: Semantic Image Inversion and Editing using Rectified Stochastic Differential Equations
Title（参考訳）: 確率微分方程式を用いた意味的画像インバージョンと編集
Authors: Litu Rout, Yujia Chen, Nataniel Ruiz, Constantine Caramanis, Sanjay Shakkottai, Wen-Sheng Chu,
Abstract要約: 本稿では, (i) 逆転と (ii) 修正フローモデル(Flux など)を用いた実画像の編集という2つの重要な課題に対処する。本手法は,ゼロショット・インバージョン・編集における最先端性能を実現し,ストローク・ツー・イメージ合成やセマンティック・イメージ編集における先行技術よりも優れていた。
参考スコア（独自算出の注目度）: 41.87051958934507
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Generative models transform random noise into images; their inversion aims to transform images back to structured noise for recovery and editing. This paper addresses two key tasks: (i) inversion and (ii) editing of a real image using stochastic equivalents of rectified flow models (such as Flux). Although Diffusion Models (DMs) have recently dominated the field of generative modeling for images, their inversion presents faithfulness and editability challenges due to nonlinearities in drift and diffusion. Existing state-of-the-art DM inversion approaches rely on training of additional parameters or test-time optimization of latent variables; both are expensive in practice. Rectified Flows (RFs) offer a promising alternative to diffusion models, yet their inversion has been underexplored. We propose RF inversion using dynamic optimal control derived via a linear quadratic regulator. We prove that the resulting vector field is equivalent to a rectified stochastic differential equation. Additionally, we extend our framework to design a stochastic sampler for Flux. Our inversion method allows for state-of-the-art performance in zero-shot inversion and editing, outperforming prior works in stroke-to-image synthesis and semantic image editing, with large-scale human evaluations confirming user preference.
Abstract（参考訳）: 生成モデルはランダムノイズを画像に変換する。本稿では,2つの課題に対処する。 (i)逆転・逆転 (II) 整流モデル(Flux など)の確率的等価値を用いた実画像の編集。近年,拡散モデル (DM) は画像生成モデリングの分野を支配しているが,その逆転はドリフトや拡散の非線形性による忠実さや編集可能性の課題を呈している。既存の最先端のDMインバージョンアプローチは、追加パラメータのトレーニングや潜伏変数のテスト時間最適化に依存している。 Rectified Flows (RF) は拡散モデルに代わる有望な代替手段を提供するが、その逆転は過小評価されている。線形2次レギュレータによる動的最適制御を用いたRFインバージョンを提案する。得られたベクトル場が正則確率微分方程式と等価であることを証明する。さらに、フレームワークを拡張して、Fluxの確率的なサンプルを設計する。インバージョン法では、ゼロショットのインバージョンと編集における最先端のパフォーマンスを実現し、ストローク・ツー・イメージの合成やセマンティック・イメージの編集において、人間の大規模な評価によりユーザの好みを確認する。

関連論文リスト

EditInfinity: Image Editing with Binary-Quantized Generative Models [64.05135380710749]
画像編集のためのバイナリ量子化生成モデルのパラメータ効率適応について検討する。具体的には、画像編集のためのバイナリ量子化生成モデルであるEmphInfinityを適応させるEditInfinityを提案する。テキストの修正と画像スタイルの保存を促進させる,効率的かつ効果的な画像反転機構を提案する。
論文参考訳（メタデータ） (2025-10-23T05:06:24Z)
Accurate Latent Inversion for Generative Image Steganography via Rectified Flow [5.404219831398271]
拡散モデルに基づくステレオグラフィーは、高品質な画像を生成し、強靭性を示す能力によって注目されている。我々は,新しい画像ステガノグラフィー手法である textbfRF-Stego を提案する。 RF-Stegoは, 抽出精度, 画質, 堅牢性, セキュリティ, 生成効率において, 最先端の手法よりも優れていた。
論文参考訳（メタデータ） (2025-08-01T08:46:32Z)
Acoustic Waveform Inversion with Image-to-Image Schrödinger Bridges [0.0]
我々は高解像度のサンプルを生成するための条件付き画像共有型Schr"odinger Bridge (c$textI2textSB$) フレームワークを導入する。実験の結果,提案手法は条件付き拡散モデルの再実装よりも優れていることがわかった。
論文参考訳（メタデータ） (2025-06-18T10:55:26Z)
Solving Inverse Problems with FLAIR [59.02385492199431]
フローベースの潜在生成モデルは、驚くべき品質の画像を生成でき、テキスト・ツー・イメージ生成も可能である。本稿では,フローベース生成モデルを逆問題の前兆として活用する新しい学習自由変分フレームワークFLAIRを提案する。標準画像ベンチマークの結果、FLAIRは再現性やサンプルの多様性の観点から、既存の拡散法や流れ法よりも一貫して優れていることが示された。
論文参考訳（メタデータ） (2025-06-03T09:29:47Z)
An Ordinary Differential Equation Sampler with Stochastic Start for Diffusion Bridge Models [13.00429687431982]
拡散ブリッジモデルは、純粋なガウスノイズではなく、劣化した画像から生成過程を初期化する。既存の拡散ブリッジモデルは、しばしば微分方程式のサンプリングに頼り、推論速度が遅くなる。拡散ブリッジモデルの開始点を有する高次ODEサンプリング器を提案する。本手法は, 既訓練拡散ブリッジモデルと完全に互換性があり, 追加の訓練は不要である。
論文参考訳（メタデータ） (2024-12-28T03:32:26Z)
Steering Rectified Flow Models in the Vector Field for Controlled Image Generation [53.965218831845995]
拡散モデル(DM)は、フォトリアリズム、画像編集、逆問題解決に優れ、分類器なしのガイダンスと画像反転技術によって支援される。既存のDMベースの手法は、しばしば追加のトレーニングを必要とし、事前訓練された潜在モデルへの一般化が欠如し、ODEソルバと反転プロセスによる広範なバックプロパゲーションにより、計算資源が要求される。本研究では,ベクトル場を利用した画像生成タスクのデノイング軌道の制御を行うFlowChefを提案する。 FlowChefは、パフォーマンス、メモリ、時間要件の点でベースラインを大幅に上回り、新しい状態を達成する。
論文参考訳（メタデータ） (2024-11-27T19:04:40Z)
Oscillation Inversion: Understand the structure of Large Flow Model through the Lens of Inversion Method [60.88467353578118]
実世界のイメージを逆転させる固定点インスパイアされた反復的アプローチは収束を達成せず、異なるクラスタ間で振動することを示す。本稿では,画像強調,ストロークベースのリカラー化,および視覚的プロンプト誘導画像編集を容易にする,シンプルで高速な分布転送手法を提案する。
論文参考訳（メタデータ） (2024-11-17T17:45:37Z)
Sequential Posterior Sampling with Diffusion Models [15.028061496012924]
条件付き画像合成における逐次拡散後サンプリングの効率を向上させるため,遷移力学をモデル化する新しい手法を提案する。本研究では,高フレームレート心エコー画像の現実的データセットに対するアプローチの有効性を実証する。提案手法は,画像の拡散モデルとリアルタイム推論を必要とする他の領域における拡散モデルのリアルタイム適用の可能性を開く。
論文参考訳（メタデータ） (2024-09-09T07:55:59Z)
ReNoise: Real Image Inversion Through Iterative Noising [62.96073631599749]
本研究では,操作数を増やすことなく,高い品質と操作率の逆転法を導入し,再現精度を向上する。我々は,近年の高速化拡散モデルを含む様々なサンプリングアルゴリズムとモデルを用いて,Renoise手法の性能を評価する。
論文参考訳（メタデータ） (2024-03-21T17:52:08Z)
Effective Real Image Editing with Accelerated Iterative Diffusion Inversion [6.335245465042035]
現代の生成モデルで自然画像を編集し、操作することは依然として困難である。逆安定性の問題に対処した既存のアプローチは、しばしば計算効率において大きなトレードオフをもたらす。本稿では,空間および時間的複雑さの最小限のオーバーヘッドで再構成精度を大幅に向上させる,AIDIと呼ばれる高速化反復拡散インバージョン法を提案する。
論文参考訳（メタデータ） (2023-09-10T01:23:05Z)
Hierarchical Integration Diffusion Model for Realistic Image Deblurring [71.76410266003917]
拡散モデル (DM) は画像劣化に導入され, 有望な性能を示した。本稿では,階層型統合拡散モデル(HI-Diff)を提案する。人工的および実世界のぼかしデータセットの実験は、HI-Diffが最先端の手法より優れていることを示した。
論文参考訳（メタデータ） (2023-05-22T12:18:20Z)
A Variational Perspective on Solving Inverse Problems with Diffusion Models [101.831766524264]
逆タスクは、データ上の後続分布を推測するものとして定式化することができる。しかし、拡散過程の非線形的かつ反復的な性質が後部を引き付けるため、拡散モデルではこれは困難である。そこで我々は,真の後続分布を近似する設計手法を提案する。
論文参考訳（メタデータ） (2023-05-07T23:00:47Z)
Reflected Diffusion Models [93.26107023470979]
本稿では,データのサポートに基づいて進化する反射微分方程式を逆転する反射拡散モデルを提案する。提案手法は,一般化されたスコアマッチング損失を用いてスコア関数を学習し,標準拡散モデルの主要成分を拡張する。
論文参考訳（メタデータ） (2023-04-10T17:54:38Z)
EDICT: Exact Diffusion Inversion via Coupled Transformations [13.996171129586731]
拡散過程(反転と呼ばれる)に入力画像を生成する初期ノイズベクトルを見つけることは重要な問題である。本稿では,アフィン結合層からインスピレーションを得るための逆変換法であるEDICT(Exact Diffusion Inversion)を提案する。 EDICTは、2つの結合ノイズベクトルを維持することにより、実画像とモデル生成画像の数学的に正確な逆変換を可能にする。
論文参考訳（メタデータ） (2022-11-22T18:02:49Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。