論文の概要: AlbumFill: Album-Guided Reasoning and Retrieval for Personalized Image Completion
- arxiv url: http://arxiv.org/abs/2605.02892v1
- Date: Mon, 04 May 2026 17:59:59 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-05 20:33:50.451881
- Title: AlbumFill: Album-Guided Reasoning and Retrieval for Personalized Image Completion
- Title(参考訳): AlbumFill: パーソナライズされた画像補完のためのアルバムガイドによる推論と検索
- Authors: Yu-Ju Tsai, Brian Price, Qing Liu, Luis Figueroa, Daniil Pakhomov, Zhihong Ding, Scott Cohen, Ming-Hsuan Yang,
- Abstract要約: AlbumFillは、個人用アルバムから個人用の参照を検索してパーソナライズする、トレーニング不要のフレームワークである。
隠蔽画像と個人アルバムが与えられた場合、視覚言語モデルは、合成画像検索をガイドするために、欠落した意味的手がかりを推測する。
- 参考スコア(独自算出の注目度): 37.657996066098484
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Personalized image completion aims to restore occluded regions in personal photos while preserving identity and appearance. Existing methods either rely on generic inpainting models that often fail to maintain identity consistency, or assume that suitable reference images are explicitly provided. In practice, suitable references are often not explicitly provided, requiring the system to search for identity-consistent images within personal photo collections. We present AlbumFill, a training-free framework that retrieves identity-consistent references from personal albums for personalized completion. Given an occluded image and a personal album, a vision-language model infers missing semantic cues to guide composed image retrieval, and the retrieved references are used by reference-based completion models. To facilitate this task, we introduce a dataset containing 54K human-centric samples with associated album images. Experiments across multiple baselines demonstrate the difficulty of personalized completion and highlight the importance of identity-consistent reference retrieval. Project Page: https://liagm.github.io/AlbumFill/
- Abstract(参考訳): パーソナライズされた画像補完は、アイデンティティと外観を保ちながら、個人写真に隠された領域を復元することを目的としている。
既存のメソッドは、アイデンティティの整合性を維持するのにしばしば失敗する一般的なインペイントモデルに依存するか、あるいは適切な参照イメージが明示的に提供されると仮定する。
実際には、適切な参照は明示的に提供されないことが多く、個人写真コレクション内のアイデンティティ一貫性のあるイメージを検索する必要がある。
AlbumFillは個人用アルバムから個人識別一貫性のある参照を検索してパーソナライズする,トレーニング不要のフレームワークである。
隠蔽画像とパーソナルアルバムが与えられた場合、視覚言語モデルは、欠落した意味的手がかりを推測して合成画像検索を誘導し、検索された参照を参照ベース補完モデルで使用する。
この作業を容易にするために、54Kの人中心サンプルと関連するアルバム画像を含むデータセットを導入する。
複数のベースラインにわたる実験は、パーソナライズされた完了の難しさを示し、アイデンティティ一貫性のある参照検索の重要性を強調している。
Project Page: https://liagm.github.io/AlbumFill/
関連論文リスト
- PhotoBench: Beyond Visual Matching Towards Personalized Intent-Driven Photo Retrieval [29.907367363360652]
PhotoBenchは、本物の個人用アルバムから構築された最初のベンチマークである。
パラダイムを視覚的マッチングから、パーソナライズされたマルチソースインテント駆動推論に移行するように設計されている。
論文 参考訳(メタデータ) (2026-03-02T06:02:40Z) - Reverse Personalization [48.09783075634403]
顔の匿名化のための逆パーソナライズフレームワークを導入する。
顔の属性を制御できない従来の匿名化手法とは異なり、我々のフレームワークは属性制御可能な匿名化をサポートしている。
論文 参考訳(メタデータ) (2025-12-28T16:06:55Z) - Finer-Personalization Rank: Fine-Grained Retrieval Examines Identity Preservation for Personalized Generation [34.915564029238105]
ファイナ・パーソナライゼーション・ランク(Finer-Personalization Rank)は、アイデンティティ保護に適した評価プロトコルである。
生成した各画像を、視覚的に類似した実画像からなるアイデンティティラベル付きギャラリーに対するクエリとして扱う。
検索メトリクスは、より高いスコアがアイデンティティ固有の詳細が保存されていることを示すパフォーマンスを測定する。
論文 参考訳(メタデータ) (2025-12-22T04:53:40Z) - CompleteMe: Reference-based Human Image Completion [52.93963237043788]
我々は,新しい参照ベースヒューマン画像補完フレームワークであるCompleteMeを提案する。
CompleteMeは2つのU-Netアーキテクチャとリージョン中心の注意(RFA)ブロックを組み合わせている。
提案手法は既存の手法に比べて視覚的品質と意味的整合性に優れる。
論文 参考訳(メタデータ) (2025-04-28T17:59:56Z) - ID-Cloak: Crafting Identity-Specific Cloaks Against Personalized Text-to-Image Generation [54.14901999875917]
本研究は、画像の保護を行うアイデンティティ固有のクロークの作成について検討する。
我々は、モデルが通常の出力から遠ざけることを奨励する新しい目的によって、アイデンティティ固有のクロークを構築する。
提案手法は,個人固有のクローク設定とともに,現実的なプライバシ保護の顕著な進歩を示す。
論文 参考訳(メタデータ) (2025-02-12T03:52:36Z) - Resolving Multi-Condition Confusion for Finetuning-Free Personalized Image Generation [10.416673784744281]
本稿では,複数の参照画像特徴を対応オブジェクトにマージする重み付きマージ手法を提案する。
提案手法は,マルチオブジェクト・パーソナライズされた画像生成のためのConcept101データセットとDreamBoothデータセットの最先端技術よりも優れた性能を実現する。
論文 参考訳(メタデータ) (2024-09-26T15:04:13Z) - Measuring Style Similarity in Diffusion Models [118.22433042873136]
画像からスタイル記述子を理解し抽出するためのフレームワークを提案する。
我々のフレームワークは、スタイルが画像の主観的特性であるという洞察を用いてキュレートされた新しいデータセットで構成されている。
また、テキスト・ツー・イメージ・モデルのトレーニングデータセットで使用される画像に対して、生成した画像のスタイルに使用できるスタイル属性記述子を抽出する手法を提案する。
論文 参考訳(メタデータ) (2024-04-01T17:58:30Z) - Personalized Image Semantic Segmentation [58.980245748434]
ラベルのないパーソナライズされた画像に対して、データのパーソナライズされた特徴を調査することにより、より正確なセグメンテーション結果を生成する。
画像のセグメント化時に画像間コンテキストを組み込んだベースライン手法を提案する。
コードとPSSデータセットは公開されます。
論文 参考訳(メタデータ) (2021-07-24T04:03:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。