論文の概要: Few-Shot Generative Model Adaption via Identity Injection and Preservation
- arxiv url: http://arxiv.org/abs/2603.22965v1
- Date: Tue, 24 Mar 2026 08:59:29 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-25 19:53:37.39163
- Title: Few-Shot Generative Model Adaption via Identity Injection and Preservation
- Title(参考訳): アイデンティティ注入と保存によるFew-Shot生成モデル適応
- Authors: Yeqi He, Liang Li, Jiehua Zhang, Yaoqi Sun, Xichun Sheng, Zhidong Zhao, Chenggang Yan,
- Abstract要約: 限られたデータで生成モデルを訓練することは、モード崩壊の深刻な課題を示す。
一般的なアプローチは、少数ショット生成モデル適応として知られる非常に少数のサンプルを持つターゲット領域に、大きな事前訓練された生成モデルを適用することである。
我々は、アイデンティティ注入と整合性アライメントを活用して、ソースのアイデンティティ知識を保存するアイデンティティ注入と保存(I$2$P)を提案する。
- 参考スコア(独自算出の注目度): 28.832140076917515
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Training generative models with limited data presents severe challenges of mode collapse. A common approach is to adapt a large pretrained generative model upon a target domain with very few samples (fewer than 10), known as few-shot generative model adaptation. However, existing methods often suffer from forgetting source domain identity knowledge during adaptation, which degrades the quality of generated images in the target domain. To address this, we propose Identity Injection and Preservation (I$^2$P), which leverages identity injection and consistency alignment to preserve the source identity knowledge. Specifically, we first introduce an identity injection module that integrates source domain identity knowledge into the target domain's latent space, ensuring the generated images retain key identity knowledge of the source domain. Second, we design an identity substitution module, which includes a style-content decoupler and a reconstruction modulator, to further enhance source domain identity preservation. We enforce identity consistency constraints by aligning features from identity substitution, thereby preserving identity knowledge. Both quantitative and qualitative experiments show that our method achieves substantial improvements over state-of-the-art methods on multiple public datasets and 5 metrics.
- Abstract(参考訳): 限られたデータで生成モデルを訓練することは、モード崩壊の深刻な課題を示す。
一般的なアプローチは、少数ショット生成モデル適応として知られる非常に少ないサンプル(10未満)のターゲット領域に、大きな事前訓練された生成モデルを適応させることである。
しかし、既存の手法は、適応中にソースドメインの知識を忘れることに悩まされることが多く、ターゲット領域で生成された画像の品質を低下させる。
これを解決するために、ID注入と整合性アライメントを活用するI$^2$P(Identity Injection and Preservation)を提案する。
具体的には、まず、ソースドメインのアイデンティティ知識をターゲットドメインの潜在空間に統合し、生成した画像がソースドメインの重要なアイデンティティ知識を保持することを保証するアイデンティティインジェクションモジュールを導入する。
第2に,スタイルコンテントデカップラと再構成変調器を備えたID置換モジュールを設計し,ソースドメインのアイデンティティ保存をさらに強化する。
我々は、アイデンティティの置換から特徴を整列させ、アイデンティティの知識を保存することによって、アイデンティティの一貫性の制約を強制する。
定量的および定性的な実験は、複数の公開データセットと5つのメトリクスについて、最先端の手法よりも大幅に改善されていることを示す。
関連論文リスト
- Beyond Inference Intervention: Identity-Decoupled Diffusion for Face Anonymization [55.29071072675132]
顔の匿名化は、非同一性属性を保持しながら、識別情報を隠蔽することを目的としている。
トレーニング中心の匿名化フレームワークである textbfIDsuperscript2Face を提案する。
IDtextsuperscript2Faceは、視覚的品質、アイデンティティの抑制、ユーティリティ保存において、既存の手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2025-10-28T09:28:12Z) - WithAnyone: Towards Controllable and ID Consistent Image Generation [83.55786496542062]
アイデンティティ・一貫性・ジェネレーションは、テキスト・ツー・イメージ研究において重要な焦点となっている。
マルチパーソンシナリオに適した大規模ペアデータセットを開発する。
本稿では,データと多様性のバランスをとるためにペアデータを活用する,対照的なアイデンティティ損失を持つ新たなトレーニングパラダイムを提案する。
論文 参考訳(メタデータ) (2025-10-16T17:59:54Z) - ID-Booth: Identity-consistent Face Generation with Diffusion Models [27.46650231581887]
我々はID-Boothと呼ばれる新しい生成拡散に基づくフレームワークを提案する。
このフレームワークは、事前訓練された拡散モデルの合成能力を保ちながら、アイデンティティ一貫性のある画像生成を可能にする。
本手法は、画像の多様性を向上しつつ、競合する手法よりもアイデンティティ間の一貫性とアイデンティティ間の分離性を向上する。
論文 参考訳(メタデータ) (2025-04-10T02:20:18Z) - Generative Unlearning for Any Identity [6.872154067622779]
プライバシー問題に関連する特定の領域では、高度な生成モデルと強力な反転法が潜在的な誤用につながる可能性がある。
生成的アイデンティティアンラーニング(generative identity unlearning)という,特定のアイデンティティのイメージを生成しないモデルを提案する。
本稿では,1つの画像のみを用いて生成元をアンラーニングすることで,特定のアイデンティティの再構築を防止する新しいフレームワーク,GUIDE(Generative Unlearning for Any Identity)を提案する。
論文 参考訳(メタデータ) (2024-05-16T08:00:55Z) - ID-Aligner: Enhancing Identity-Preserving Text-to-Image Generation with Reward Feedback Learning [57.91881829308395]
AIポートレートや広告といった幅広いアプリケーションシナリオのために、ID-T2I(ID-preserving text-to-image generation)が注目されている。
我々は,ID-T2I性能を向上させるための一般的なフィードバック学習フレームワークである textbfID-Aligner を提案する。
論文 参考訳(メタデータ) (2024-04-23T18:41:56Z) - StableIdentity: Inserting Anybody into Anywhere at First Sight [57.99693188913382]
一つの顔画像で同一性に一貫性のある再テクスチャ化を可能にするStableIdentityを提案する。
私たちは、1つの画像から学んだアイデンティティを直接、微調整なしでビデオ/3D生成に注入する最初の人です。
論文 参考訳(メタデータ) (2024-01-29T09:06:15Z) - Disentangle Before Anonymize: A Two-stage Framework for Attribute-preserved and Occlusion-robust De-identification [55.741525129613535]
匿名化前の混乱」は、新しい二段階フレームワーク(DBAF)である
このフレームワークには、Contrastive Identity Disentanglement (CID)モジュールとKey-authorized Reversible Identity Anonymization (KRIA)モジュールが含まれている。
大規模な実験により,本手法は最先端の非識別手法より優れていることが示された。
論文 参考訳(メタデータ) (2023-11-15T08:59:02Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。