Fugu-MT 論文翻訳(概要): PuLID: Pure and Lightning ID Customization via Contrastive Alignment

論文の概要: PuLID: Pure and Lightning ID Customization via Contrastive Alignment

arxiv url: http://arxiv.org/abs/2404.16022v1
Date: Wed, 24 Apr 2024 17:55:33 GMT
ステータス: 翻訳完了
システム内更新日: 2024-04-26 18:31:49.083979
Title: PuLID: Pure and Lightning ID Customization via Contrastive Alignment
Title（参考訳）: PuLID: コントラストアライメントによるPureとLightning IDのカスタマイズ
Authors: Zinan Guo, Yanze Wu, Zhuowei Chen, Lang Chen, Qian He,
Abstract要約: テキスト・ツー・イメージ生成のためのPuLID(Pure and Lightning ID customization)を提案する。 PuLIDにはLightning T2Iブランチと標準拡散ブランチが組み込まれており、オリジナルのモデルの破壊を最小限に抑えている。実験の結果,PuLIDはIDの忠実度と編集性の両方において優れた性能を示した。
参考スコア（独自算出の注目度）: 7.012130370533257
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: We propose Pure and Lightning ID customization (PuLID), a novel tuning-free ID customization method for text-to-image generation. By incorporating a Lightning T2I branch with a standard diffusion one, PuLID introduces both contrastive alignment loss and accurate ID loss, minimizing disruption to the original model and ensuring high ID fidelity. Experiments show that PuLID achieves superior performance in both ID fidelity and editability. Another attractive property of PuLID is that the image elements (e.g., background, lighting, composition, and style) before and after the ID insertion are kept as consistent as possible. Codes and models will be available at https://github.com/ToTheBeginning/PuLID
Abstract（参考訳）: 本稿では,PuLID(Pure and Lightning ID customization)を提案する。標準拡散器にLightning T2Iブランチを組み込むことで、PuLIDはコントラストアライメント損失と正確なID損失の両方を導入し、オリジナルのモデルの破壊を最小限に抑え、高いID忠実度を確保する。実験の結果,PuLIDはIDの忠実度と編集性の両方において優れた性能を示した。 PuLIDのもうひとつの魅力は、ID挿入前後のイメージ要素(例えば、背景、照明、構成、スタイル)を可能な限り一貫した状態に保つことである。コードとモデルはhttps://github.com/ToTheBeginning/PuLIDで入手できる。

関連論文リスト

Optimizing ID Consistency in Multimodal Large Models: Facial Restoration via Alignment, Entanglement, and Disentanglement [54.199726425201895]
大規模モデルのマルチモーダル編集は、様々なタスクにまたがる強力な編集機能を示している。現在の顔認証保存法は、顔認証と編集済み要素IPの整合性回復に苦慮している。そこで我々は,頑健なアイデンティティ特異的顔復元のためのアライメント・ディスタングルメント・アンタングルメント・フレームワークであるEditedIDを提案する。
論文参考訳（メタデータ） (2026-02-21T08:24:42Z)
Diff-PC: Identity-preserving and 3D-aware Controllable Diffusion for Zero-shot Portrait Customization [13.128154695283477]
Diff-PCはゼロショットポートレートカスタマイズ(PC)のための拡散ベースのフレームワークである写実的なポートレートを生成し、IDの忠実度が高く、顔の特徴が特定され、背景も様々である。本手法では, 3次元顔予測器を用いて, 3次元顔の事前認識を再構築する。
論文参考訳（メタデータ） (2026-01-31T10:15:41Z)
Training for Identity, Inference for Controllability: A Unified Approach to Tuning-Free Face Personalization [16.851646868288135]
両パラダイムを相乗的に統合する統合チューニングフリーフレームワークであるUniIDを紹介する。私たちの重要な洞察は、これらのアプローチを統合する際には、アイデンティティ関連情報のみを相互に強化する必要があるということです。この原則により、UniIDはフレキシブルテキスト制御性を備えた高忠実な顔のパーソナライゼーションを実現することができる。
論文参考訳（メタデータ） (2025-12-03T16:57:50Z)
Personalized Face Super-Resolution with Identity Decoupling and Fitting [50.473357681579664]
極端な劣化シナリオでは、重要な属性とID情報が入力画像で著しく失われることが多い。既存の方法では、そのような条件下で幻覚顔を生成する傾向があり、真のID制約を欠いた復元画像を生成する。本稿ではIDデカップリング・フィッティング(IDFSR)を用いた新しいFSR手法を提案する。
論文参考訳（メタデータ） (2025-08-13T02:33:11Z)
ID-Patch: Robust ID Association for Group Photo Personalization [29.38844265790726]
ID-Patchは、アイデンティティと2D位置の堅牢な関連を提供する新しい方法である。アプローチでは,同じ顔の特徴からIDパッチとID埋め込みを生成する。
論文参考訳（メタデータ） (2024-11-20T18:55:28Z)
UniPortrait: A Unified Framework for Identity-Preserving Single- and Multi-Human Image Personalization [10.760799194716922]
UniPortraitは、シングルIDとマルチIDのカスタマイズを統一する革新的なヒューマンイメージパーソナライズフレームワークである。 UniPortraitは、ID埋め込みモジュールとIDルーティングモジュールの2つのプラグイン・アンド・プレイモジュールで構成されている。
論文参考訳（メタデータ） (2024-08-12T06:27:29Z)
Synthesizing Efficient Data with Diffusion Models for Person Re-Identification Pre-Training [51.87027943520492]
本稿では,既知の同一性に基づく多様な画像の効率向上と生成を行う新しいパラダイムDiffusion-ReIDを提案する。提案したパラダイムに適合して,まず,5,183個のIDから777K以上の画像で構成された,大規模なRe-IDデータセットDiff-Personを新たに作成する。
論文参考訳（メタデータ） (2024-06-10T06:26:03Z)
MasterWeaver: Taming Editability and Face Identity for Personalized Text-to-Image Generation [59.13765130528232]
MasterWeaverは、忠実なアイデンティティとフレキシブルな編集性の両方でパーソナライズされた画像を生成するために設計された、テスト時のチューニング不要な手法である。具体的には、MasterWeaverはエンコーダを採用して、アイデンティティ機能を抽出し、追加のクロスアテンションを通じて画像生成をステアリングする。同一性を維持しながら編集性を向上させるため,MasterWeaverの編集方向をオリジナルのT2Iモデルと整合させる訓練用編集方向損失を提案する。
論文参考訳（メタデータ） (2024-05-09T14:42:16Z)
ID-Aligner: Enhancing Identity-Preserving Text-to-Image Generation with Reward Feedback Learning [57.91881829308395]
AIポートレートや広告といった幅広いアプリケーションシナリオのために、ID-T2I(ID-preserving text-to-image generation)が注目されている。我々は,ID-T2I性能を向上させるための一般的なフィードバック学習フレームワークである textbfID-Aligner を提案する。
論文参考訳（メタデータ） (2024-04-23T18:41:56Z)
Infinite-ID: Identity-preserved Personalization via ID-semantics Decoupling Paradigm [31.06269858216316]
アイデンティティ保存型パーソナライゼーションのためのID-セマンティックデカップリングパラダイムであるInfinite-IDを提案する。我々は、十分なID情報を取得するために、追加のイメージクロスアテンションモジュールを組み込んだアイデンティティ強化トレーニングを導入する。また、2つのストリームをシームレスにマージするために、混合アテンションモジュールとAdaIN平均演算を組み合わせた機能相互作用機構を導入する。
論文参考訳（メタデータ） (2024-03-18T13:39:53Z)
Magic-Me: Identity-Specific Video Customized Diffusion [72.05925155000165]
本稿では、VCD(Video Custom Diffusion)と呼ばれる、制御可能な被写体識別制御可能なビデオ生成フレームワークを提案する。いくつかの画像によって定義された特定IDにより、VCDはアイデンティティ特性を強化し、安定したビデオ出力のためにフレームワイズ相関を注入する。我々は、VCDがベースラインよりも優れたIDで安定した動画を生成可能であることを検証するために、広範囲な実験を行った。
論文参考訳（メタデータ） (2024-02-14T18:13:51Z)
Beyond Inserting: Learning Identity Embedding for Semantic-Fidelity Personalized Diffusion Generation [21.739328335601716]
本稿では,パーソナライズされた生成のための安定拡散モデルに,正確でインタラクティブなIDを挿入することに焦点を当てる。顔のレイアウトや背景などのIDに依存しない情報を絡み合わせるのではなく、顔領域にフィットする顔の注意損失を提案する。その結果,従来の手法と比較して,IDの精度,テキストベースの操作能力,一般化性が向上した。
論文参考訳（メタデータ） (2024-01-31T11:52:33Z)
PhotoMaker: Customizing Realistic Human Photos via Stacked ID Embedding [102.07914175196817]
PhotoMakerは、効率的なパーソナライズされたテキスト・ツー・イメージ生成方法である。任意の数の入力ID画像をスタックID埋め込みに符号化し、ID情報を保存する。
論文参考訳（メタデータ） (2023-12-07T17:32:29Z)
SingleInsert: Inserting New Concepts from a Single Image into Text-to-Image Models for Flexible Editing [59.3017821001455]
SingleInsert(シングルインサート)は、イメージ・トゥ・テキスト(I2T)のインバージョン手法であり、同じ概念を含む単一のソースイメージを持つ。本研究では,SingleInsertという,シングルイメージI2Tインバージョンのためのシンプルで効果的なベースラインを提案する。提案手法により、SingleInsertは、フレキシブルな編集を可能にしながら、高い視覚的忠実度でシングルコンセプト生成に優れる。
論文参考訳（メタデータ） (2023-10-12T07:40:39Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。