論文の概要: MoFRR: Mixture of Diffusion Models for Face Retouching Restoration
- arxiv url: http://arxiv.org/abs/2507.19770v1
- Date: Sat, 26 Jul 2025 03:45:53 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-29 16:23:56.173339
- Title: MoFRR: Mixture of Diffusion Models for Face Retouching Restoration
- Title(参考訳): MoFRR:顔修復のための拡散モデルの混合
- Authors: Jiaxin Liu, Qichao Ying, Zhenxing Qian, Sheng Li, Runqi Zhang, Jian Liu, Xinpeng Zhang,
- Abstract要約: Face Retouching Restoration (FRR) は、新しいコンピュータビジョンタスクである。
MoFRRは、異なるリタッチタイプを扱う専門専門家のスパースアクティベーションと、ユニバーサルリタッチトレースを扱う共有専門家の関与を使用する。
新たに構築された顔リタッチデータセットであるRetouchingFFHQ++の実験は、FRRに対するMoFRRの有効性を実証している。
- 参考スコア(独自算出の注目度): 36.309979915418296
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The widespread use of face retouching on social media platforms raises concerns about the authenticity of face images. While existing methods focus on detecting face retouching, how to accurately recover the original faces from the retouched ones has yet to be answered. This paper introduces Face Retouching Restoration (FRR), a novel computer vision task aimed at restoring original faces from their retouched counterparts. FRR differs from traditional image restoration tasks by addressing the complex retouching operations with various types and degrees, which focuses more on the restoration of the low-frequency information of the faces. To tackle this challenge, we propose MoFRR, Mixture of Diffusion Models for FRR. Inspired by DeepSeek's expert isolation strategy, the MoFRR uses sparse activation of specialized experts handling distinct retouching types and the engagement of a shared expert dealing with universal retouching traces. Each specialized expert follows a dual-branch structure with a DDIM-based low-frequency branch guided by an Iterative Distortion Evaluation Module (IDEM) and a Cross-Attention-based High-Frequency branch (HFCAM) for detail refinement. Extensive experiments on a newly constructed face retouching dataset, RetouchingFFHQ++, demonstrate the effectiveness of MoFRR for FRR.
- Abstract(参考訳): ソーシャルメディアプラットフォームにおける顔のリタッチの普及は、顔画像の真正性に対する懸念を高めている。
既存の方法では顔のリタッチ検出に重点を置いているが、元の顔のリタッチを正確に回収する方法はまだ答えられていない。
本稿では,顔の復元を目的とした新しいコンピュータビジョンタスクであるFace Retouching Restoration(FRR)を紹介する。
FRRは、顔の低周波情報の復元に焦点を当てた、様々なタイプと度合いで複雑な修正操作に対処することで、従来の画像復元作業とは異なる。
この課題に対処するため,FRR 用混合拡散モデル MoFRR を提案する。
DeepSeekのエキスパート分離戦略にインスパイアされたMoFRRは、異なるリタッチタイプを扱う専門専門家のスパースアクティベーションと、ユニバーサルリタッチトレースを扱う共有専門家の関与を使用する。
各専門分野の専門家は、DDIMベースの低周波分岐を反復歪み評価モジュール(IDEM)とクロスアテンションベースの高周波分岐(HFCAM)でガイドし、細部の改良を行う。
新たに構築された顔リタッチデータセットであるRetouchingFFHQ++に関する大規模な実験は、FRRに対するMoFRRの有効性を実証している。
関連論文リスト
- ReFIR: Grounding Large Restoration Models with Retrieval Augmentation [52.00990126884406]
本稿では,Retrieval-augmented Framework for Image Restoration (ReFIR) というソリューションを提案する。
我々のReFIRは、抽出した画像を外部知識として組み込んで、既存のLRMの知識境界を拡張する。
実験により,ReFIRは高忠実度だけでなく,現実的な復元結果も得られることが示された。
論文 参考訳(メタデータ) (2024-10-08T01:27:45Z) - FRRffusion: Unveiling Authenticity with Diffusion-Based Face Retouching Reversal [8.310525579478503]
本稿では,FRR(face retouching Reversal)問題について検討する。
本稿では,FRRタスクに対する新しい拡散型FRRアプローチ(FRRffusion)を提案する。
FRRffusionはGP-UNIT法と安定拡散法を4つのメトリクスで大きく上回っている。
論文 参考訳(メタデータ) (2024-05-13T09:38:49Z) - Multi-feature Reconstruction Network using Crossed-mask Restoration for Unsupervised Industrial Anomaly Detection [4.742650815342744]
産業生産における品質検査には, 教師なし異常検出が重要である。
本稿では,クロスマスク復元を用いた多機能再構成ネットワークMFRNetを提案する。
提案手法は,4つの公開データセットと1つの自作データセットにおいて,他の最先端のデータセットと高い競争力,あるいは大幅に上回っている。
論文 参考訳(メタデータ) (2024-04-20T05:13:56Z) - Reti-Diff: Illumination Degradation Image Restoration with Retinex-based
Latent Diffusion Model [59.08821399652483]
照明劣化画像復元(IDIR)技術は、劣化した画像の視認性を改善し、劣化した照明の悪影響を軽減することを目的としている。
これらのアルゴリズムのうち、拡散モデル(DM)に基づく手法は期待できる性能を示しているが、画像レベルの分布を予測する際に、重い計算要求や画素の不一致の問題に悩まされることが多い。
我々は、コンパクトな潜在空間内でDMを活用して、簡潔な指導先を生成することを提案し、IDIRタスクのためのReti-Diffと呼ばれる新しいソリューションを提案する。
Reti-Diff は Retinex-based Latent DM (RLDM) と Retinex-Guided Transformer (RG) の2つの鍵成分からなる。
論文 参考訳(メタデータ) (2023-11-20T09:55:06Z) - Implicit Subspace Prior Learning for Dual-Blind Face Restoration [66.67059961379923]
新しい暗黙的サブスペース事前学習(ISPL)フレームワークが、二重盲顔復元の一般的な解決策として提案されている。
実験の結果,既存の最先端手法に対するISPLの認識歪改善が顕著であった。
論文 参考訳(メタデータ) (2020-10-12T08:04:24Z) - LIRA: Lifelong Image Restoration from Unknown Blended Distortions [33.91806781681914]
そこで本研究では,ブレンド歪みに対する生涯画像復元問題を提案する。
まず,個別歪み除去タスクを専門とする複数の事前訓練されたエキスパートモデルを協調的に動作させるベースフォークジョイントモデルを設計する。
我々は、以前トレーニングされたモデルが新しいエキスパートブランチを組み込んで、新しい知識を継続的に蓄積する神経成長戦略を開発する。
論文 参考訳(メタデータ) (2020-08-19T03:35:45Z) - HiFaceGAN: Face Renovation via Collaborative Suppression and
Replenishment [63.333407973913374]
フェース・リノベーション(FR)は意味誘導型生成問題である。
HiFaceGANは、複数のネストされたCSRユニットを含む多段階フレームワークである。
合成画像と実顔画像の両方の実験により,HiFaceGANの優れた性能が確認された。
論文 参考訳(メタデータ) (2020-05-11T11:33:17Z) - Deep Face Super-Resolution with Iterative Collaboration between
Attentive Recovery and Landmark Estimation [92.86123832948809]
本稿では,2つの繰り返しネットワーク間の反復的協調による深層面超解像(FSR)手法を提案する。
各繰り返しステップにおいて、リカバリブランチは、ランドマークの事前の知識を利用して、高品質な画像を生成する。
新しい注意融合モジュールはランドマークマップのガイダンスを強化するために設計されている。
論文 参考訳(メタデータ) (2020-03-29T16:04:48Z) - Joint Face Completion and Super-resolution using Multi-scale Feature
Relation Learning [26.682678558621625]
本稿では,MFG-GAN(MFG-GAN)を用いたマルチスケール機能グラフ生成手法を提案する。
GANに基づいて、MFG-GANはグラフ畳み込みとピラミッドネットワークを統合し、隠蔽された低解像度の顔画像を非隠蔽の高解像度の顔画像に復元する。
パブリックドメインCelebAとHelenデータベースの実験結果から,提案手法は顔超解像(最大4倍または8倍)と顔補完を同時に行う上で,最先端の手法よりも優れていることが示された。
論文 参考訳(メタデータ) (2020-02-29T13:31:46Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。