論文の概要: HiFi-Inpaint: Towards High-Fidelity Reference-Based Inpainting for Generating Detail-Preserving Human-Product Images
- arxiv url: http://arxiv.org/abs/2603.02210v2
- Date: Tue, 03 Mar 2026 05:00:58 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-04 14:54:12.722782
- Title: HiFi-Inpaint: Towards High-Fidelity Reference-Based Inpainting for Generating Detail-Preserving Human-Product Images
- Title(参考訳): HiFi-Inpaint:Detail-Preserving Human-Product Image 生成のための高忠実な参照ベースインペインティングを目指して
- Authors: Yichen Liu, Donghao Zhou, Jie Wang, Xin Gao, Guisheng Liu, Jiatong Li, Quanwei Zhang, Qiang Lyu, Lanqing Guo, Shilei Wen, Weiqiang Wang, Pheng-Ann Heng,
- Abstract要約: HiFi-Inpaintは、人為的な画像を生成するのに適した、新しい高忠実な参照ベースのインペインティングフレームワークである。
細粒度製品の特徴を洗練するためのSEA(Shared Enhancement Attention)と、正確なピクセルレベルの監視を行うためのDAL(Detail-Aware Loss)を導入する。
我々は、自己合成データから得られたサンプルを自動フィルタリングで処理し、HP-Image-40Kという新しいデータセットを構築した。
- 参考スコア(独自算出の注目度): 61.3479037455798
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Human-product images, which showcase the integration of humans and products, play a vital role in advertising, e-commerce, and digital marketing. The essential challenge of generating such images lies in ensuring the high-fidelity preservation of product details. Among existing paradigms, reference-based inpainting offers a targeted solution by leveraging product reference images to guide the inpainting process. However, limitations remain in three key aspects: the lack of diverse large-scale training data, the struggle of current models to focus on product detail preservation, and the inability of coarse supervision for achieving precise guidance. To address these issues, we propose HiFi-Inpaint, a novel high-fidelity reference-based inpainting framework tailored for generating human-product images. HiFi-Inpaint introduces Shared Enhancement Attention (SEA) to refine fine-grained product features and Detail-Aware Loss (DAL) to enforce precise pixel-level supervision using high-frequency maps. Additionally, we construct a new dataset, HP-Image-40K, with samples curated from self-synthesis data and processed with automatic filtering. Experimental results show that HiFi-Inpaint achieves state-of-the-art performance, delivering detail-preserving human-product images.
- Abstract(参考訳): 人間と製品の統合を示すヒューマンプロダクトイメージは、広告、eコマース、デジタルマーケティングにおいて重要な役割を果たす。
このような画像を生成する上で重要な課題は、製品の細部を高忠実に保存することにある。
既存のパラダイムの中で、参照ベースのインペインティングは、製品参照イメージを活用してインペインティングプロセスをガイドすることで、ターゲットとするソリューションを提供する。
しかし、様々な大規模トレーニングデータの欠如、製品の詳細保存に焦点をあてる現在のモデルの苦労、正確なガイダンスを達成するための粗い監督の欠如という3つの重要な側面に制限が残っている。
これらの課題に対処するために,人為的な画像生成に適した,新しい高忠実度参照ベースインペインティングフレームワークであるHiFi-Inpaintを提案する。
HiFi-Inpaintは、細粒度製品の特徴を洗練するためのSEA(Shared Enhancement Attention)と、高周波マップを用いた正確なピクセルレベルの監視を行うDAL(Detail-Aware Loss)を導入している。
さらに,自己合成データから収集したサンプルを自動フィルタリングで処理し,HP-Image-40Kという新しいデータセットを構築した。
実験結果から、HiFi-Inpaintは最先端のパフォーマンスを実現し、詳細な保存された人為的な画像を提供することがわかった。
関連論文リスト
- FreeInpaint: Tuning-free Prompt Alignment and Visual Rationality Enhancement in Image Inpainting [98.04041133839088]
ユーザからのテキストプロンプトを用いて,画像の特定領域内で新たなコンテンツを生成する。
FreeInpaintは,画像の忠実度を向上させるために,インジェクション中の拡散潜水剤を直接最適化する,プラグアンドプレイのチューニング不要な手法である。
論文 参考訳(メタデータ) (2025-12-24T11:06:26Z) - RefAdGen: High-Fidelity Advertising Image Generation [2.38180456064897]
RefAdGenは、分離された設計によって高い忠実性を達成する世代フレームワークである。
我々はRefAdGenが最先端のパフォーマンスを達成し、高忠実さと目立った視覚的結果を維持することで、高精細度を保ちながら、実世界と実世界の両方に挑戦し、高精細度で高精細度で高精細度で高精細度で高精細度で高精細度で高精細度な画像化を実現していることを示す。
論文 参考訳(メタデータ) (2025-08-12T18:25:31Z) - DreamPainter: Image Background Inpainting for E-commerce Scenarios [9.12444106077783]
我々はDreamPainterを紹介した。DreamPainterはテキストプロンプトと参照画像情報を付加的な制御信号として組み込む新しいフレームワークである。
提案手法は,テキストプロンプトと参照画像情報の両方を効果的に統合しつつ,高い製品一貫性を維持しながら,最先端の手法よりも優れている。
論文 参考訳(メタデータ) (2025-08-04T07:54:37Z) - Preserving Product Fidelity in Large Scale Image Recontextualization with Diffusion Models [1.8606057023042066]
本稿では,テキスト・ツー・イメージ拡散モデルと新しいデータ拡張パイプラインを用いた高忠実度製品画像再構成のためのフレームワークを提案する。
本手法は,生成画像の品質と多様性を,製品表現を分離し,モデルによる製品特性の理解を深めることによって改善する。
論文 参考訳(メタデータ) (2025-03-11T01:24:39Z) - An Evaluation Framework for Product Images Background Inpainting based on Human Feedback and Product Consistency [4.177224329586615]
製品広告アプリケーションでは、プロダクトイメージにおけるAI技術を活用した背景の自動塗り絵が重要なタスクとして現れている。
HFPC(Human Feedback and Product Consistency)は、2つのモジュールに基づいて生成した製品イメージを自動的に評価する。
HFPCは、他のオープンソースのビジュアル品質評価モデルと比較して、最先端(96.4%の精度)を実現している。
論文 参考訳(メタデータ) (2024-12-23T12:03:35Z) - Consistent Human Image and Video Generation with Spatially Conditioned Diffusion [82.4097906779699]
一貫性のある人中心画像とビデオ合成は、所定の参照画像との外観整合性を維持しつつ、新しいポーズを持つ画像を生成することを目的としている。
我々は,課題を空間条件付き塗装問題とみなし,対象画像をインペイントして参照との外観整合性を維持する。
このアプローチにより、参照機能により、統一された認知ネットワーク内でのポーズ準拠のターゲットの生成をガイドすることができる。
論文 参考訳(メタデータ) (2024-12-19T05:02:30Z) - FreeEnhance: Tuning-Free Image Enhancement via Content-Consistent Noising-and-Denoising Process [120.91393949012014]
FreeEnhanceは、既製の画像拡散モデルを用いたコンテンツ一貫性のある画像強調のためのフレームワークである。
ノイズ発生段階では、FreeEnhanceは、元の画像の高頻度パターンを保存するために、より周波数の高い領域により軽いノイズを加えるように考案されている。
この段階では3つの目標特性を予測された雑音の規則化の制約として提示し,高精度で視覚的品質の高い画像の強調を行う。
論文 参考訳(メタデータ) (2024-09-11T17:58:50Z) - Automated Virtual Product Placement and Assessment in Images using Diffusion Models [1.63075356372232]
本稿では,新しい3段階完全自動化VPPシステムを提案する。
第1段階では、言語誘導画像セグメンテーションモデルにより、製品塗布のための画像内の最適な領域を特定する。
第2段階では、いくつかの製品イメージを微調整した安定拡散(SD)を使用して、以前に特定された候補領域に製品を塗布する。
最終段階では、低画質の画像を効果的に取り出すために設計された「アライメントモジュール」が導入されている。
論文 参考訳(メタデータ) (2024-05-02T09:44:13Z) - RefFusion: Reference Adapted Diffusion Models for 3D Scene Inpainting [63.567363455092234]
RefFusionは,画像インペイント拡散モデルのマルチスケールパーソナライズに基づく,新しい3Dインペイント手法である。
我々のフレームワークは、制御性を維持しながら、オブジェクト除去の最先端の成果を達成する。
論文 参考訳(メタデータ) (2024-04-16T17:50:02Z) - BrushNet: A Plug-and-Play Image Inpainting Model with Decomposed
Dual-Branch Diffusion [61.90969199199739]
BrushNetは、ピクセルレベルのマスク付きイメージ機能を事前訓練されたDMに埋め込むために設計された、新しいプラグアンドプレイデュアルブランチモデルである。
BrushNetは、画像品質、マスク領域保存、テキストコヒーレンスを含む7つの主要な指標で、既存のモデルよりも優れたパフォーマンスを実現している。
論文 参考訳(メタデータ) (2024-03-11T17:59:31Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。