Fugu-MT 論文翻訳(概要): ID-Patch: Robust ID Association for Group Photo Personalization

論文の概要: ID-Patch: Robust ID Association for Group Photo Personalization

arxiv url: http://arxiv.org/abs/2411.13632v1
Date: Wed, 20 Nov 2024 18:55:28 GMT
ステータス: 翻訳完了
システム内更新日: 2024-11-28 17:07:49.629991
Title: ID-Patch: Robust ID Association for Group Photo Personalization
Title（参考訳）: IDパッチ:グループ写真パーソナライゼーションのためのロバストIDアソシエーション
Authors: Yimeng Zhang, Tiancheng Zhi, Jing Liu, Shen Sang, Liming Jiang, Qing Yan, Sijia Liu, Linjie Luo,
Abstract要約: ID-Patchは、アイデンティティと2D位置の堅牢な関連を提供する新しい方法である。アプローチでは,同じ顔の特徴からIDパッチとID埋め込みを生成する。
参考スコア（独自算出の注目度）: 29.38844265790726
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: The ability to synthesize personalized group photos and specify the positions of each identity offers immense creative potential. While such imagery can be visually appealing, it presents significant challenges for existing technologies. A persistent issue is identity (ID) leakage, where injected facial features interfere with one another, resulting in low face resemblance, incorrect positioning, and visual artifacts. Existing methods suffer from limitations such as the reliance on segmentation models, increased runtime, or a high probability of ID leakage. To address these challenges, we propose ID-Patch, a novel method that provides robust association between identities and 2D positions. Our approach generates an ID patch and ID embeddings from the same facial features: the ID patch is positioned on the conditional image for precise spatial control, while the ID embeddings integrate with text embeddings to ensure high resemblance. Experimental results demonstrate that ID-Patch surpasses baseline methods across metrics, such as face ID resemblance, ID-position association accuracy, and generation efficiency. Project Page is: https://byteaigc.github.io/ID-Patch/
Abstract（参考訳）: パーソナライズされたグループ写真を合成し、それぞれのアイデンティティの位置を特定する能力は、非常に創造的な可能性を秘めている。このようなイメージは視覚的に魅力的だが、既存の技術には大きな課題がある。永続的な問題はアイデンティティ(ID)リークであり、注入された顔の特徴が互いに干渉し合い、顔の類似性、不正確な位置付け、視覚的アーティファクトが低下する。既存のメソッドはセグメンテーションモデルへの依存、ランタイムの増加、IDリークの確率が高いといった制限に悩まされている。これらの課題に対処するために,IDと2次元位置の堅牢な関連性を提供する新しい手法であるID-Patchを提案する。提案手法は,同一の顔特徴からIDパッチとID埋め込みを生成する。IDパッチは条件付き画像上に位置決めされ,正確な空間制御が可能であり,ID埋め込みはテキスト埋め込みと統合され,高い類似性を確保する。実験の結果,ID-Patch は顔 ID の類似性,ID 配置関連精度,生成効率などの指標を網羅し,ベースライン法を超越していることがわかった。 Project Page は以下のものだ。

関連論文リスト

Optimizing ID Consistency in Multimodal Large Models: Facial Restoration via Alignment, Entanglement, and Disentanglement [54.199726425201895]
大規模モデルのマルチモーダル編集は、様々なタスクにまたがる強力な編集機能を示している。現在の顔認証保存法は、顔認証と編集済み要素IPの整合性回復に苦慮している。そこで我々は,頑健なアイデンティティ特異的顔復元のためのアライメント・ディスタングルメント・アンタングルメント・フレームワークであるEditedIDを提案する。
論文参考訳（メタデータ） (2026-02-21T08:24:42Z)
Beyond Inference Intervention: Identity-Decoupled Diffusion for Face Anonymization [55.29071072675132]
顔の匿名化は、非同一性属性を保持しながら、識別情報を隠蔽することを目的としている。トレーニング中心の匿名化フレームワークである textbfIDsuperscript2Face を提案する。 IDtextsuperscript2Faceは、視覚的品質、アイデンティティの抑制、ユーティリティ保存において、既存の手法よりも優れていることを示す。
論文参考訳（メタデータ） (2025-10-28T09:28:12Z)
Zero-shot Face Editing via ID-Attribute Decoupled Inversion [5.695436409400152]
本稿では,ID-Attribute Decoupled Inversionに基づくゼロショット顔編集手法を提案する。我々は、顔表現をIDと属性の特徴に分解し、それらを共同条件として、逆拡散過程と逆拡散過程の両方を導出する。本手法は,領域固有の入力を必要とせず,テキストプロンプトのみを用いた複雑な多属性顔編集タスクをサポートし,DDIMインバージョンに匹敵する速度で動作する。
論文参考訳（メタデータ） (2025-10-13T06:34:40Z)
Personalized Face Super-Resolution with Identity Decoupling and Fitting [50.473357681579664]
極端な劣化シナリオでは、重要な属性とID情報が入力画像で著しく失われることが多い。既存の方法では、そのような条件下で幻覚顔を生成する傾向があり、真のID制約を欠いた復元画像を生成する。本稿ではIDデカップリング・フィッティング(IDFSR)を用いた新しいFSR手法を提案する。
論文参考訳（メタデータ） (2025-08-13T02:33:11Z)
ID-EA: Identity-driven Text Enhancement and Adaptation with Textual Inversion for Personalized Text-to-Image Generation [33.84646269805187]
ID-EAは、テキストの埋め込みを視覚的アイデンティティの埋め込みに合わせてガイドする新しいフレームワークである。 ID-EAはアイデンティティ保存の指標において最先端の手法を大幅に上回っている。パーソナライズされた肖像画は、既存のアプローチの15倍の速さで生成される。
論文参考訳（メタデータ） (2025-07-16T07:42:02Z)
DynamicID: Zero-Shot Multi-ID Image Personalization with Flexible Facial Editability [12.692129257068085]
シングルIDとマルチIDパーソナライズされた生成を本質的に促進する,チューニング不要なフレームワークであるDynamicIDを提案する。主なイノベーションは,(1)ID特徴注入時のベースモデルの破壊を最小限に抑えるためのクエリレベルのアクティベーションゲーティング(SAA)と,トレーニング中に複数IDサンプルを必要とせずにマルチIDパーソナライゼーションを実現するためのクエリレベルのアクティベートゲーティングゲーティング(SAA),2)顔の動作とアイデンティティ機能を効果的にアンタングルするために特徴空間操作を適用したID-Motion Reconfigurator(IMR),3)データ依存を減らすタスク分離トレーニングパラダイムであるVariFace-10k(VariFace-10k)である。
論文参考訳（メタデータ） (2025-03-09T08:16:19Z)
Disentangled Representations for Short-Term and Long-Term Person Re-Identification [33.76874948187976]
アイデンティティシャッフルGAN(Identity shuffle GAN:IS-GAN)と呼ばれる新たな生成対向ネットワークを提案する。それは、アイデンティティシャッフル技術によって、個人画像からアイデンティティ関連および非関連の特徴を解き放つ。実験により,IS-GANの有効性が検証され,標準reIDベンチマークにおける最先端性能が示された。
論文参考訳（メタデータ） (2024-09-09T02:09:49Z)
ID-Aligner: Enhancing Identity-Preserving Text-to-Image Generation with Reward Feedback Learning [57.91881829308395]
AIポートレートや広告といった幅広いアプリケーションシナリオのために、ID-T2I(ID-preserving text-to-image generation)が注目されている。我々は,ID-T2I性能を向上させるための一般的なフィードバック学習フレームワークである textbfID-Aligner を提案する。
論文参考訳（メタデータ） (2024-04-23T18:41:56Z)
View-decoupled Transformer for Person Re-identification under Aerial-ground Camera Network [87.36616083812058]
地上人物再識別のための簡易かつ効果的なフレームワークとして,ビューデカップリングトランス (VDT) が提案されている。 2つの主要なコンポーネントは、ビュー関連とビュー非関連の機能を切り離すためにVDTで設計されている。さらに,5/8の空中/地上カメラ,5,000のアイデンティティ,108,563のイメージからなる大規模AGPReIDデータセットCARGOをコントリビュートした。
論文参考訳（メタデータ） (2024-03-21T16:08:21Z)
Beyond Inserting: Learning Identity Embedding for Semantic-Fidelity Personalized Diffusion Generation [21.739328335601716]
本稿では,パーソナライズされた生成のための安定拡散モデルに,正確でインタラクティブなIDを挿入することに焦点を当てる。顔のレイアウトや背景などのIDに依存しない情報を絡み合わせるのではなく、顔領域にフィットする顔の注意損失を提案する。その結果,従来の手法と比較して,IDの精度,テキストベースの操作能力,一般化性が向上した。
論文参考訳（メタデータ） (2024-01-31T11:52:33Z)
PhotoMaker: Customizing Realistic Human Photos via Stacked ID Embedding [102.07914175196817]
PhotoMakerは、効率的なパーソナライズされたテキスト・ツー・イメージ生成方法である。任意の数の入力ID画像をスタックID埋め込みに符号化し、ID情報を保存する。
論文参考訳（メタデータ） (2023-12-07T17:32:29Z)
HFORD: High-Fidelity and Occlusion-Robust De-identification for Face Privacy Protection [60.63915939982923]
顔の身元特定は、身元保護問題を解決するための実践的な方法である。既存の顔の特定方法にはいくつかの問題がある。これらの問題に対処するために,HFORD(High-Fidelity and Occlusion-Robust De-identification)法を提案する。
論文参考訳（メタデータ） (2023-11-15T08:59:02Z)
X-ReID: Cross-Instance Transformer for Identity-Level Person Re-Identification [53.047542904329866]
Cross-Identity Instancesモジュール(IntraX)は、ID-Levelの知識を転送するために、異なるIdentityインスタンスをフューズする。 Cross Inter-Identity Instancesモジュール(InterX)は、同じアイデンティティに対する注意応答を改善するために、ハードポジティとハードポジティのインスタンスを含む。
論文参考訳（メタデータ） (2023-02-04T03:16:18Z)
A Systematical Solution for Face De-identification [6.244117712209321]
異なるタスクにおいて、人々は顔の特定(De-ID)に様々な要件を持つ本稿では,これらのDe-ID操作に適合する系統的解を提案する。本手法は,様々な方法で顔データを柔軟に識別し,画像の画質が向上する。
論文参考訳（メタデータ） (2021-07-19T02:02:51Z)
Semantic Consistency and Identity Mapping Multi-Component Generative Adversarial Network for Person Re-Identification [39.605062525247135]
本稿では,1つのドメインから複数のドメインへのスタイル適応を提供する,意味一貫性とアイデンティティマッピングの多成分生成対向ネットワーク(SC-IMGAN)を提案する。提案手法は,6つの挑戦的人物リidデータセットにおける最先端技術よりも優れている。
論文参考訳（メタデータ） (2021-04-28T14:12:29Z)
Towards Precise Intra-camera Supervised Person Re-identification [54.86892428155225]
人物の再識別(Re-ID)のためのカメラ内監視(ICS)は、アイデンティティラベルが各カメラビュー内に独立してアノテートされていると仮定する。カメラ間ラベルの欠如により、ICS Re-ID問題は、完全に監督されたラベルよりもはるかに難しい。われわれの手法は、2つのデータセットで最先端の完全教師付き手法に匹敵する性能を発揮する。
論文参考訳（メタデータ） (2020-02-12T11:56:30Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。