論文の概要: CatalogStitch: Dimension-Aware and Occlusion-Preserving Object Compositing for Catalog Image Generation
- arxiv url: http://arxiv.org/abs/2604.08836v1
- Date: Fri, 10 Apr 2026 00:25:41 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-13 17:57:53.618128
- Title: CatalogStitch: Dimension-Aware and Occlusion-Preserving Object Compositing for Catalog Image Generation
- Title(参考訳): CatalogStitch:カタログ画像生成のための次元認識とオクルージョン保存オブジェクト合成
- Authors: Sanyam Jain, Pragya Kandari, Manit Singhal, He Zhang, Soo Ye Kim,
- Abstract要約: 製品マスクの調整を自動化するモデルに依存しない一連の手法である CatalogStitch を提案する。
我々の次元対応マスクアルゴリズムは、ターゲット領域を自動的に適応し、異なる次元の製品に対応する。
ハイブリッド修復法では, 咬合要素の完全保存が保証され, 後編集が不要となる。
- 参考スコア(独自算出の注目度): 10.607005561544371
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Generative object compositing methods have shown remarkable ability to seamlessly insert objects into scenes. However, when applied to real-world catalog image generation, these methods require tedious manual intervention: users must carefully adjust masks when product dimensions differ, and painstakingly restore occluded elements post-generation. We present CatalogStitch, a set of model-agnostic techniques that automate these corrections, enabling user-friendly content creation. Our dimension-aware mask computation algorithm automatically adapts the target region to accommodate products with different dimensions; users simply provide a product image and background, without manual mask adjustments. Our occlusion-aware hybrid restoration method guarantees pixel-perfect preservation of occluding elements, eliminating post-editing workflows. We additionally introduce CatalogStitch-Eval, a 58-example benchmark covering aspect-ratio mismatch and occlusion-heavy catalog scenarios, together with supplementary PDF and HTML viewers. We evaluate our techniques with three state-of-the-art compositing models (ObjectStitch, OmniPaint, and InsertAnything), demonstrating consistent improvements across diverse catalog scenarios. By reducing manual intervention and automating tedious corrections, our approach transforms generative compositing into a practical, human-friendly tool for production catalog workflows.
- Abstract(参考訳): 生成オブジェクト合成手法は、オブジェクトをシーンにシームレスに挿入する素晴らしい能力を示している。
しかし、実際のカタログ画像生成に適用する場合、これらの手法には面倒な手作業の介入が必要であり、ユーザーは製品寸法が異なるときにマスクを慎重に調整する必要がある。
CatalogStitchは、これらの修正を自動化し、ユーザフレンドリーなコンテンツ作成を可能にする、モデルに依存しない一連のテクニックである。
我々の次元対応マスク計算アルゴリズムは、ターゲット領域を自動的に適応して、異なる次元の製品に対応する。
閉塞型ハイブリッド修復法は, 咬合要素の完全保存を保証し, 編集後のワークフローをなくす。
CatalogStitch-Evalはアスペクト比ミスマッチとオクルージョン重大カタログシナリオをカバーする58例のベンチマークであり、補足的なPDFとHTMLビューアも紹介する。
我々は,3つの最先端合成モデル(ObjectStitch,OmniPaint,InsertAnything)を用いて評価を行い,多様なカタログシナリオにおける一貫した改善を示す。
手作業による介入を減らし、面倒な修正を自動化することで、本手法は生成的合成を実用的で人間フレンドリな製品カタログワークフローに変換する。
関連論文リスト
- POCI-Diff: Position Objects Consistently and Interactively with 3D-Layout Guided Diffusion [46.97254555348757]
本稿では,テキスト・トゥ・イメージ(T2I)生成のための拡散型アプローチを提案する。
連続的かつインタラクティブな位置決めのためのフレームワーク(POCI-Diff)を導入する。
本手法は,個々のテキスト記述を特定の3次元境界ボックスに結合することで,オブジェクトごとのセマンティック制御を可能にする。
論文 参考訳(メタデータ) (2026-01-20T15:13:43Z) - Example-Based Feature Painting on Textures [7.130784822780051]
外観変化を考慮したテクスチャ作成のための新しい手法を提案する。
私たちのパイプライン全体は、小さなイメージコレクションから汎用的な生成モデルに移行しています。
特に,拡散ベースの編集と無限定常テクスチャ生成のためのアルゴリズムは汎用的であり,他の文脈でも有用であることが証明される。
論文 参考訳(メタデータ) (2025-11-03T12:26:50Z) - LACONIC: A 3D Layout Adapter for Controllable Image Creation [22.96293773013579]
誘導画像合成のための既存の生成アプローチは、画像やテキスト空間の2D制御に依存している。
本稿では,事前訓練されたテキスト・画像拡散モデルに接続可能な新しい条件付け手法,トレーニング方法,アダプタネットワークを提案する。
本手法は, カメラ制御, 明快な3次元空間におけるジオメトリの条件付け, シーンのコンテキスト全体について初めて記述する。
論文 参考訳(メタデータ) (2025-07-04T02:25:36Z) - AttentionDrag: Exploiting Latent Correlation Knowledge in Pre-trained Diffusion Models for Image Editing [33.74477787349966]
本研究では,AttentionDragという一段階のポイントベース画像編集手法を提案する。
このフレームワークは、大規模な再最適化や再トレーニングを必要とせずに、セマンティック一貫性と高品質な操作を可能にする。
以上の結果から,最先端の手法をはるかに高速に超越した性能を示す。
論文 参考訳(メタデータ) (2025-06-16T09:42:38Z) - OmniPaint: Mastering Object-Oriented Editing via Disentangled Insertion-Removal Inpainting [54.525583840585305]
我々はオブジェクトの削除と挿入を相互依存プロセスとして再概念化する統合フレームワークであるOmniPaintを紹介した。
我々の新しいCFDメトリクスは、コンテキスト整合性とオブジェクト幻覚の堅牢で参照不要な評価を提供する。
論文 参考訳(メタデータ) (2025-03-11T17:55:27Z) - Add-it: Training-Free Object Insertion in Images With Pretrained Diffusion Models [78.90023746996302]
Add-itは、拡散モデルの注意メカニズムを拡張して、3つの主要なソースからの情報を組み込む、トレーニング不要のアプローチである。
我々の重み付き拡張アテンション機構は、自然物の位置を確実にしながら、構造的一貫性と細部を維持できる。
人間の評価によると、Add-itは80%以上のケースで好まれる。
論文 参考訳(メタデータ) (2024-11-11T18:50:09Z) - DiffUHaul: A Training-Free Method for Object Dragging in Images [78.93531472479202]
DiffUHaulと呼ばれるオブジェクトドラッグタスクのためのトレーニング不要な手法を提案する。
まず、各認知段階に注意マスキングを適用して、各生成を異なるオブジェクトにまたがってよりゆがみやすくする。
初期のデノナイジングステップでは、ソース画像とターゲット画像の注意特徴を補間して、新しいレイアウトを元の外観とスムーズに融合させる。
論文 参考訳(メタデータ) (2024-06-03T17:59:53Z) - WMFormer++: Nested Transformer for Visible Watermark Removal via Implict
Joint Learning [68.00975867932331]
既存の透かし除去法は主にタスク固有のデコーダブランチを持つUNetに依存している。
両分野の情報を包括的に統合するために,暗黙的な共同学習パラダイムを導入する。
その結果、既存の最先端手法をはるかに上回る、我々のアプローチの顕著な優位性を示した。
論文 参考訳(メタデータ) (2023-08-20T07:56:34Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。