論文の概要: Fuzzy-Conditioned Diffusion and Diffusion Projection Attention Applied
to Facial Image Correction
- arxiv url: http://arxiv.org/abs/2306.14891v2
- Date: Sat, 1 Jul 2023 22:22:14 GMT
- ステータス: 処理完了
- システム内更新日: 2023-07-04 12:16:11.100409
- Title: Fuzzy-Conditioned Diffusion and Diffusion Projection Attention Applied
to Facial Image Correction
- Title(参考訳): ファジィコンディション拡散と拡散射影の注意が顔画像補正への応用
- Authors: Majed El Helou
- Abstract要約: 我々は、暗黙の拡散先行を制御可能な強度で活用できるファジィ条件拡散を導出する。
本稿では,ファジィ条件の拡散と拡散依存性の注意マップを組み合わせた顔画像補正手法を提案する。
- 参考スコア(独自算出の注目度): 14.34815548338413
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Image diffusion has recently shown remarkable performance in image synthesis
and implicitly as an image prior. Such a prior has been used with conditioning
to solve the inpainting problem, but only supporting binary user-based
conditioning. We derive a fuzzy-conditioned diffusion, where implicit diffusion
priors can be exploited with controllable strength. Our fuzzy conditioning can
be applied pixel-wise, enabling the modification of different image components
to varying degrees. Additionally, we propose an application to facial image
correction, where we combine our fuzzy-conditioned diffusion with
diffusion-derived attention maps. Our map estimates the degree of anomaly, and
we obtain it by projecting on the diffusion space. We show how our approach
also leads to interpretable and autonomous facial image correction.
- Abstract(参考訳): 画像拡散は画像合成において顕著な性能を示しており、暗黙的に先行画像として機能している。
このような前者は、塗装問題の解決にコンディショニングが使われてきたが、バイナリユーザベースのコンディショニングのみをサポートしている。
我々は、暗黙の拡散先行を制御可能な強度で活用できるファジィ条件拡散を導出する。
ファジィコンディショニングはピクセル単位で適用でき、異なる画像コンポーネントを様々な程度に変更することができる。
さらに,ファジィ条件の拡散と拡散依存性の注意マップを組み合わせた顔画像補正手法を提案する。
我々の写像は異常の度合いを推定し、拡散空間に投影することで得られる。
われわれのアプローチは、また、解釈可能かつ自律的な顔画像補正につながることを示す。
関連論文リスト
- Immiscible Diffusion: Accelerating Diffusion Training with Noise Assignment [56.609042046176555]
準最適雑音データマッピングは拡散モデルの遅い訓練につながる。
物理学における不和性現象からインスピレーションを得て,不和性拡散を提案する。
我々のアプローチは極めて単純で、各画像の拡散可能な領域を制限するために1行のコードしか必要としない。
論文 参考訳(メタデータ) (2024-06-18T06:20:42Z) - Smooth Diffusion: Crafting Smooth Latent Spaces in Diffusion Models [82.8261101680427]
滑らかな潜伏空間は、入力潜伏空間上の摂動が出力画像の定常的な変化に対応することを保証している。
この特性は、画像の反転、反転、編集を含む下流タスクにおいて有益である。
スムース拡散(Smooth Diffusion, Smooth Diffusion)は, 高速かつスムーズな拡散モデルである。
論文 参考訳(メタデータ) (2023-12-07T16:26:23Z) - Prompt-tuning latent diffusion models for inverse problems [72.13952857287794]
本稿では,テキストから画像への遅延拡散モデルを用いた逆問題の画像化手法を提案する。
P2Lと呼ばれる本手法は,超解像,デブロアリング,インパインティングなどの様々なタスクにおいて,画像拡散モデルと潜時拡散モデルに基づく逆問題解法の両方に優れる。
論文 参考訳(メタデータ) (2023-10-02T11:31:48Z) - MaskDiffusion: Boosting Text-to-Image Consistency with Conditional Mask [84.84034179136458]
テキスト・イメージのミスマッチ問題に繋がる重要な要因は、モダリティ間の関係学習の不十分さである。
本稿では,注目マップと迅速な埋め込みを条件とした適応マスクを提案し,画像特徴に対する各テキストトークンの寄与度を動的に調整する。
この手法はMaskDiffusionと呼ばれ、トレーニング不要で、一般的な事前学習拡散モデルに対してホットプラグ可能である。
論文 参考訳(メタデータ) (2023-09-08T15:53:37Z) - Not All Steps are Created Equal: Selective Diffusion Distillation for
Image Manipulation [23.39614544877529]
条件付き拡散モデルは、画像操作タスクにおいて顕著な性能を示した。
ノイズが多すぎると画像の忠実度に影響を与え、編集性にはほとんど影響を与えない。
画像の忠実度と編集性の両方を保証する新しいフレームワークである拡散選択蒸留(SDD)を提案する。
論文 参考訳(メタデータ) (2023-07-17T12:42:56Z) - Diffusion in Diffusion: Cyclic One-Way Diffusion for Text-Vision-Conditioned Generation [11.80682025950519]
本研究では,拡散(機械学習)特性の拡散(物理学)について検討する。
拡散現象の方向を制御するために,循環一流拡散法(COW)を提案する。
本手法は,タスクニーズを理解するための新しい視点を提供し,より広い範囲のカスタマイズシナリオに適用可能である。
論文 参考訳(メタデータ) (2023-06-14T05:25:06Z) - A Variational Perspective on Solving Inverse Problems with Diffusion
Models [101.831766524264]
逆タスクは、データ上の後続分布を推測するものとして定式化することができる。
しかし、拡散過程の非線形的かつ反復的な性質が後部を引き付けるため、拡散モデルではこれは困難である。
そこで我々は,真の後続分布を近似する設計手法を提案する。
論文 参考訳(メタデータ) (2023-05-07T23:00:47Z) - ADIR: Adaptive Diffusion for Image Reconstruction [46.838084286784195]
本研究では,拡散モデルによる事前学習を利用した条件付きサンプリング手法を提案する。
次に、事前学習した拡散分極ネットワークを入力に適応させる新しいアプローチと組み合わせる。
画像再構成手法の適応拡散は,超高解像度,デブロアリング,テキストベースの編集タスクにおいて,大幅な改善が達成されていることを示す。
論文 参考訳(メタデータ) (2022-12-06T18:39:58Z) - SinDiffusion: Learning a Diffusion Model from a Single Natural Image [159.4285444680301]
SinDiffusionは1つの自然な画像からパッチの内部分布を捉えるためにデノナイズ拡散モデルを利用する。
SinDiffusionは、2つのコア設計に基づいている。まず、SinDiffusionは、段階的にスケールが成長する複数のモデルではなく、1つのスケールで1つのモデルで訓練されている。
第2に,拡散ネットワークのパッチレベルの受容領域は,画像のパッチ統計を捉える上で重要かつ効果的であることを示す。
論文 参考訳(メタデータ) (2022-11-22T18:00:03Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。