Fugu-MT 論文翻訳(概要): OSInsert: Towards High-authenticity and High-fidelity Image Composition

論文の概要: OSInsert: Towards High-authenticity and High-fidelity Image Composition

arxiv url: http://arxiv.org/abs/2602.19523v1
Date: Mon, 23 Feb 2026 05:25:05 GMT
ステータス: 翻訳完了
システム内更新日: 2026-02-24 17:42:02.686748
Title: OSInsert: Towards High-authenticity and High-fidelity Image Composition
Title（参考訳）: OSInsert: 高精度・高忠実な画像合成を目指して
Authors: Jingyuan Wang, Li Niu,
Abstract要約: 生成画像合成は、背景画像に与えられた前景オブジェクトを再生し、現実的な合成画像を生成することを目的としている。高精細度法では前景のポーズ/ビューを背景と互換性のあるものに調整でき、高精細度法では前景の細部を正確に保存することができる。本研究では,両目標を達成するための2段階戦略を提案する。
参考スコア（独自算出の注目度）: 31.954036253909255
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Generative image composition aims to regenerate the given foreground object in the background image to produce a realistic composite image. Some high-authenticity methods can adjust foreground pose/view to be compatible with background, while some high-fidelity methods can preserve the foreground details accurately. However, existing methods can hardly achieve both goals at the same time. In this work, we propose a two-stage strategy to achieve both goals. In the first stage, we use high-authenticity method to generate reasonable foreground shape, serving as the condition of high-fidelity method in the second stage. The experiments on MureCOM dataset verify the effectiveness of our two-stage strategy. The code and model have been released at https://github.com/bcmi/OSInsert-Image-Composition.
Abstract（参考訳）: 生成画像合成は、背景画像に与えられた前景オブジェクトを再生し、現実的な合成画像を生成することを目的としている。高精細度法では前景のポーズ/ビューを背景と互換性のあるものに調整でき、高精細度法では前景の細部を正確に保存することができる。しかし、既存の手法では両方の目標を同時に達成することはほとんどできない。本研究では,両目標を達成するための2段階戦略を提案する。第1段階では,高忠実度法を用いて,第2段階における高忠実度法の条件として,合理的な前景形状を生成する。 MureCOMデータセットの実験は、我々の2段階戦略の有効性を検証する。コードとモデルはhttps://github.com/bcmi/OSInsert-Image-Compositionでリリースされた。

関連論文リスト

Foreground Focus: Enhancing Coherence and Fidelity in Camouflaged Image Generation [28.86420429221175]
本稿では,カモフラージュ画像を生成するために,フォアグラウンド対応カモフラージュ画像生成(FACIG)モデルを提案する。具体的には、フォアグラウンド機能統合モジュール(FAFIM)を導入し、フォアグラウンド機能と背景知識の統合を強化する。様々なデータセットを用いた実験により,提案手法は画像の画質と前景の忠実度において,従来の手法よりも優れていた。
論文参考訳（メタデータ） (2025-04-02T23:51:13Z)
MureObjectStitch: Multi-reference Image Composition [23.110826295932554]
生成画像合成は、背景画像に与えられた前景オブジェクトを再生し、現実的な合成画像を生成することを目的としている。既存の方法は、前景の細部を保存し、同時に前景のポーズ/視点を調整するのに苦労している。生成画像合成モデルにおいて,前景オブジェクトを含む1つ以上の画像を用いて事前訓練されたモデルを微調整する,効果的な微調整手法を提案する。
論文参考訳（メタデータ） (2024-11-12T00:53:20Z)
Direct Consistency Optimization for Robust Customization of Text-to-Image Diffusion Models [67.68871360210208]
テキスト・ツー・イメージ(T2I)拡散モデルは、いくつかの個人画像に微調整された場合、高い一貫性で視覚を生成することができる。本稿では,微調整モデルと事前学習モデルとの偏差を制御し,直接整合性最適化(Direct Consistency Optimization)と呼ばれる新たな微調整対象を提案する。提案手法は, 通常の微調整モデルとのマージに最適化したモデルよりも, 高速な忠実度と主観的忠実度が得られることを示す。
論文参考訳（メタデータ） (2024-02-19T09:52:41Z)
ControlCom: Controllable Image Composition using Diffusion Model [45.48263800282992]
1つの拡散モデルにおいて4つのタスクを統一する制御可能な画像合成法を提案する。また,拡散モデルにおける前景の詳細を強化するために,局所的な拡張モジュールを提案する。提案手法は,公開ベンチマークと実世界のデータの両方を用いて評価する。
論文参考訳（メタデータ） (2023-08-19T14:56:44Z)
LayoutLLM-T2I: Eliciting Layout Guidance from LLM for Text-to-Image Generation [121.45667242282721]
レイアウト計画と画像生成を実現するための粗大なパラダイムを提案する。提案手法は,フォトリアリスティックなレイアウトと画像生成の観点から,最先端のモデルよりも優れている。
論文参考訳（メタデータ） (2023-08-09T17:45:04Z)
SceneComposer: Any-Level Semantic Image Synthesis [80.55876413285587]
任意の精度のセマンティックレイアウトから条件付き画像合成のための新しいフレームワークを提案する。このフレームワークは、形状情報のない最低レベルのテキスト・トゥ・イメージ(T2I)に自然に還元され、最高レベルのセグメンテーション・トゥ・イメージ(S2I)となる。本稿では,この新たなセットアップの課題に対処する,新しいテクニックをいくつか紹介する。
論文参考訳（メタデータ） (2022-11-21T18:59:05Z)
Modeling Image Composition for Complex Scene Generation [77.10533862854706]
本稿では,レイアウト・ツー・イメージ生成タスクにおける最先端結果を実現する手法を提案する。本稿では,RGB画像をパッチトークンに圧縮した後,オブジェクト・トゥ・オブジェクト,オブジェクト・トゥ・パッチ,パッチ・トゥ・パッチの依存関係を探索するTransformer with Focal Attention (TwFA)を提案する。
論文参考訳（メタデータ） (2022-06-02T08:34:25Z)
Deep Image Compositing [93.75358242750752]
ユーザ入力なしで高品質の画像合成を自動生成する手法を提案する。ラプラシアン・ピラミッド・ブレンディングにインスパイアされ、フォアグラウンドや背景画像からの情報を効果的に融合させるために、密結合型多ストリーム融合ネットワークが提案されている。実験により,提案手法は高品質な合成物を自動生成し,定性的かつ定量的に既存手法より優れた性能を発揮することが示された。
論文参考訳（メタデータ） (2020-11-04T06:12:24Z)
BachGAN: High-Resolution Image Synthesis from Salient Object Layout [78.51640906030244]
本稿では、より実用的な画像生成のための新しい課題である、有能なオブジェクトレイアウトからの高品質な画像合成を提案する。 i) セグメンテーションマップ入力なしできめ細かい詳細と現実的なテクスチャを生成する方法、(ii) バックグラウンドを作成してスタンドアロンのオブジェクトにシームレスに織り込む方法である。幻影背景表現を動的に生成することにより,高解像度画像をフォトリアリスティック・フォアグラウンドと積分背景の両方で合成することができる。
論文参考訳（メタデータ） (2020-03-26T00:54:44Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。