論文の概要: Identity-preserving Distillation Sampling by Fixed-Point Iterator
- arxiv url: http://arxiv.org/abs/2502.19930v1
- Date: Thu, 27 Feb 2025 09:59:38 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-02-28 14:57:29.962972
- Title: Identity-preserving Distillation Sampling by Fixed-Point Iterator
- Title(参考訳): 固定点イテレータによるアイデンティティ保存蒸留サンプリング
- Authors: SeonHwa Kim, Jiwon Kim, Soobin Park, Donghoon Ahn, Jiwon Kang, Seungryong Kim, Kyong Hwan Jin, Eunju Cha,
- Abstract要約: アイデンティティ保存蒸留サンプリング(IDS)は、結果に望ましくない変化をもたらす勾配を補正する。
IDSはスコア自体を変更するために提案されており、ポーズや構造を含むアイデンティティの保存を促進する。
提案手法は、FPRによる自己補正により、画像間編集および編集可能なニューラル放射場(NeRF)において、与えられたプロンプトに対応する明確で曖昧な表現を提供する。
- 参考スコア(独自算出の注目度): 39.405536448895084
- License:
- Abstract: Score distillation sampling (SDS) demonstrates a powerful capability for text-conditioned 2D image and 3D object generation by distilling the knowledge from learned score functions. However, SDS often suffers from blurriness caused by noisy gradients. When SDS meets the image editing, such degradations can be reduced by adjusting bias shifts using reference pairs, but the de-biasing techniques are still corrupted by erroneous gradients. To this end, we introduce Identity-preserving Distillation Sampling (IDS), which compensates for the gradient leading to undesired changes in the results. Based on the analysis that these errors come from the text-conditioned scores, a new regularization technique, called fixed-point iterative regularization (FPR), is proposed to modify the score itself, driving the preservation of the identity even including poses and structures. Thanks to a self-correction by FPR, the proposed method provides clear and unambiguous representations corresponding to the given prompts in image-to-image editing and editable neural radiance field (NeRF). The structural consistency between the source and the edited data is obviously maintained compared to other state-of-the-art methods.
- Abstract(参考訳): スコア蒸留サンプリング(SDS)は,学習したスコア関数から知識を抽出することにより,テキスト条件付き2次元画像と3次元オブジェクト生成の強力な能力を示す。
しかし、SDSはノイズ勾配によって引き起こされるぼかしに悩まされることが多い。
SDSが画像編集に適合すると、参照ペアを使用してバイアスシフトを調整することで、そのような劣化を低減できるが、非バイアス化技術はいまだに誤った勾配によって破損している。
この目的のためにIDS(Identity-serving Distillation Smpling)を導入する。
これらの誤りがテキスト条件付きスコアから生じるという分析に基づいて、固定点反復正規化(FPR)と呼ばれる新しい正規化手法が提案され、ポーズや構造を含むアイデンティティの保存を促進する。
提案手法は、FPRによる自己補正により、画像間編集および編集可能なニューラル放射場(NeRF)において、与えられたプロンプトに対応する明確で曖昧な表現を提供する。
ソースと編集されたデータの間の構造的一貫性は、他の最先端の方法と比較して明らかに維持される。
関連論文リスト
- VividDreamer: Invariant Score Distillation For Hyper-Realistic Text-to-3D Generation [33.05759961083337]
Invariant Score Distillation (ISD) を提案する。
ISDは、スコア蒸留サンプリング(SDS)における過飽和および過平滑化問題に対処することを目的としている。
論文 参考訳(メタデータ) (2024-07-13T09:33:16Z) - Fine-grained Image-to-LiDAR Contrastive Distillation with Visual Foundation Models [55.99654128127689]
Visual Foundation Models (VFM) は、弱い教師付きピクセル対ポイントのコントラスト蒸留のためのセマンティックラベルを生成するために使用される。
我々は,空間分布とカテゴリー周波数の不均衡に対応するために,点のサンプリング確率を適応させる。
我々の手法は、下流タスクにおける既存の画像からLiDARへのコントラスト蒸留法を一貫して超越している。
論文 参考訳(メタデータ) (2024-05-23T07:48:19Z) - Score Distillation Sampling with Learned Manifold Corrective [36.963929141091455]
損失を異なる要因に分解し,ノイズ勾配の原因となる成分を分離する。
オリジナルの定式化では、ノイズを考慮に入れた高いテキストガイダンスが使用され、過飽和や繰り返し詳細といった不要な副作用が生じる。
我々は,画像拡散モデルの時間依存性周波数バイアスを模倣した浅層ネットワークを訓練し,これを効果的に導出する。
論文 参考訳(メタデータ) (2024-01-10T17:51:46Z) - Spatial-Contextual Discrepancy Information Compensation for GAN
Inversion [67.21442893265973]
空間的不一致情報補償に基づく新しいGAN-inversion法(SDIC)を提案する。
SDICは、オリジナルの画像と再構成/編集された画像との間の画像詳細のギャップを埋める。
提案手法は,画像インバージョンと編集作業の両方において,高速な推論速度で優れた歪み適応性トレードオフを実現する。
論文 参考訳(メタデータ) (2023-12-12T08:58:56Z) - Contrastive Denoising Score for Text-guided Latent Diffusion Image Editing [58.48890547818074]
潜在拡散モデル(LDM)に対するコントラストデノナイジングスコア(CUT)の強力な修正を提案する。
提案手法により,ゼロショット画像から画像への変換とニューラルフィールド(NeRF)の編集が可能となり,入力と出力の間の構造的対応が達成される。
論文 参考訳(メタデータ) (2023-11-30T15:06:10Z) - Noise-Free Score Distillation [78.79226724549456]
ノイズフリースコア蒸留(NFSD)プロセスは、オリジナルのSDSフレームワークに最小限の変更を必要とする。
我々は,CFG尺度を用いて,事前学習したテキスト・画像拡散モデルのより効果的な蒸留を行う。
論文 参考訳(メタデータ) (2023-10-26T17:12:26Z) - Anomaly Detection with Conditioned Denoising Diffusion Models [32.37548329437798]
対象画像に条件付けされた画像再構成のための新しいデノナイズプロセスであるDAD(Denoising Diffusion Anomaly Detection)を導入する。
我々の異常検出フレームワークは条件付け機構を用いており、ターゲット画像が入力画像として設定され、復調過程を導出する。
DDADは、それぞれ(99.8%)および(98.9%)画像レベルのAUROCの最先端結果を達成する。
論文 参考訳(メタデータ) (2023-05-25T11:54:58Z) - Editing Out-of-domain GAN Inversion via Differential Activations [56.62964029959131]
本稿では,構成分解パラダイムを用いて,ドメイン外反転問題に対処する新しいGAN事前編集フレームワークを提案する。
生成されたDiff-CAMマスクの助けを借りて、粗い再構成を直感的に元の画像と編集された画像で合成することができる。
また, 分解段階において, 粗い再構成から最終微編集画像を切り離すための, GAN 以前のデゴーストネットワークを提示する。
論文 参考訳(メタデータ) (2022-07-17T10:34:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。