論文の概要: Making Images Real Again: A Comprehensive Survey on Deep Image Composition
- arxiv url: http://arxiv.org/abs/2106.14490v6
- Date: Mon, 20 Jan 2025 04:45:01 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-01-22 14:16:52.885611
- Title: Making Images Real Again: A Comprehensive Survey on Deep Image Composition
- Title(参考訳): 画像の作り直し:ディープ・イメージ・コンポジションに関する総合的な調査
- Authors: Li Niu, Wenyan Cong, Liu Liu, Yan Hong, Bo Zhang, Jing Liang, Liqing Zhang,
- Abstract要約: 画像合成タスクは複数のサブタスクに分解できる。
オブジェクト配置は、前景の適切なスケール、位置、形状を見つけることを目的としています。
画像ブレンディングは、前景と背景の間の不自然な境界に対処することを目的としている。
- 参考スコア(独自算出の注目度): 34.09380539557308
- License:
- Abstract: As a common image editing operation, image composition (object insertion) aims to combine the foreground from one image and another background image, resulting in a composite image. However, there are many issues that could make the composite images unrealistic. These issues can be summarized as the inconsistency between foreground and background, which includes appearance inconsistency (e.g., incompatible illumination), geometry inconsistency (e.g., unreasonable size), and semantic inconsistency (e.g., mismatched semantic context). Image composition task could be decomposed into multiple sub-tasks, in which each sub-task targets at one or more issues. Specifically, object placement aims to find reasonable scale, location, and shape for the foreground. Image blending aims to address the unnatural boundary between foreground and background. Image harmonization aims to adjust the illumination statistics of foreground. Shadow (resp., reflection) generation aims to generate plausible shadow (resp., reflection) for the foreground. These sub-tasks can be executed sequentially or parallelly to acquire realistic composite images. To the best of our knowledge, there is no previous survey on image composition (object insertion). In this paper, we conduct comprehensive survey over the sub-tasks and combinatorial task of image composition (object insertion). For each one, we summarize the existing methods, available datasets, and common evaluation metrics. We have also contributed the first image composition toolbox libcom, which assembles 10+ image composition related functions.
- Abstract(参考訳): 一般的な画像編集操作として、画像合成(オブジェクト挿入)は、ある画像と別の背景画像から前景を組み合わせることを目的としており、複合画像となる。
しかし、合成画像が非現実的になるような問題は数多くある。
これらの問題は、外観の不整合(例えば、不整合照明)、幾何学的不整合(例、不合理サイズ)、意味的不整合(例、不整合意味文脈)を含む、前景と背景の矛盾として要約できる。
画像合成タスクは複数のサブタスクに分解され、各サブタスクが1つ以上の課題を目標とする。
具体的には、オブジェクト配置は、前景の適切なスケール、位置、形状を見つけることを目的としている。
画像ブレンディングは、前景と背景の間の不自然な境界に対処することを目的としている。
画像調和は、前景の照明統計を調整することを目的としている。
影(反射、反射)生成は、前景のための可塑性影(反射、反射)を生成することを目的としている。
これらのサブタスクを順次又は並列に実行して、現実的な合成画像を取得することができる。
我々の知る限りでは、画像合成(オブジェクト挿入)に関する以前の調査はない。
本稿では,画像合成(オブジェクト挿入)のサブタスクと組み合わせタスクについて包括的調査を行う。
それぞれについて、既存のメソッド、利用可能なデータセット、一般的な評価指標を要約する。
また、10以上の画像合成関連関数を組み立てる最初の画像合成ツールボックスlibcomを寄贈した。
関連論文リスト
- DepGAN: Leveraging Depth Maps for Handling Occlusions and Transparency in Image Composition [7.693732944239458]
DepGANは、デプスマップとアルファチャンネルを利用して、不正確なオクルージョンを正すジェネレーティブ・アドバイサル・ネットワークである。
我々のネットワークの中心にはDepth Aware Lossと呼ばれる新しいロス関数があり、ピクセルのワイド深さ差を定量化している。
我々は不透明データを利用してネットワークの学習プロセスを強化し、透明で半透明なオブジェクトを含む構成を効果的に管理する。
論文 参考訳(メタデータ) (2024-07-16T16:18:40Z) - Repositioning the Subject within Image [78.8467524191102]
本稿では,革新的動的操作タスク,主題再構成を導入する。
このタスクは、画像の忠実性を保ちながら、ユーザが指定した対象を所望の位置に移動させることである。
本研究は, 主観的再配置の基本的なサブタスクを, 統一的, 即効的な塗装作業として効果的に再構築できることを明らかにする。
論文 参考訳(メタデータ) (2024-01-30T10:04:49Z) - AMICO: Amodal Instance Composition [40.03865667370814]
画像合成は、複数のオブジェクトをブレンドして調和した画像を形成することを目的としている。
対象画像に不完全なオブジェクトをブレンドするためのアモーダルインスタンス構成を提案する。
本結果は,COCOAおよびKINSベンチマークにおける最先端性能を示す。
論文 参考訳(メタデータ) (2022-10-11T23:23:14Z) - Blind Image Decomposition [53.760745569495825]
本稿では,Blind Image Decomposition (BID)について述べる。
雨のような重畳された画像を異なるソースコンポーネントに分解する方法は、現実世界の視覚システムにとって重要なステップだ。
本稿では,Blind Image Decomposition Network (BIDeN) を提案する。
論文 参考訳(メタデータ) (2021-08-25T17:37:19Z) - SSH: A Self-Supervised Framework for Image Harmonization [97.16345684998788]
我々は、編集せずに「自由」な自然画像だけで訓練できる新しい自己改善調和フレームワーク(SSH)を提案する。
提案したSSHは,基準指標,視覚的品質,主観的ユーザスタディにおいて,従来の最先端手法よりも優れていた。
論文 参考訳(メタデータ) (2021-08-15T19:51:33Z) - OPA: Object Placement Assessment Dataset [20.791187775546625]
画像合成は、ある画像から別の背景画像にオブジェクトを挿入することで、現実的な合成画像を生成することを目的とする。
本稿では,オブジェクト配置の観点で合成画像が妥当かどうかを検証するオブジェクト配置評価タスクに焦点をあてる。
論文 参考訳(メタデータ) (2021-07-05T09:23:53Z) - Deep Image Compositing [0.0]
画像編集では、最も一般的なタスクは、一方の画像から他方の画像にオブジェクトを貼り付け、背景オブジェクトで前景オブジェクトの表示を調整することです。
そのためには、GANS(Generative Adversarial Networks)を使用しています。
GANSは、画像の前景と背景部分の色ヒストグラムをデコードすることができ、また、前景オブジェクトと背景をブレンドすることを学ぶことができる。
論文 参考訳(メタデータ) (2021-03-29T09:23:37Z) - Bridging Composite and Real: Towards End-to-end Deep Image Matting [88.79857806542006]
画像マッチングにおける意味論と細部の役割について検討する。
本稿では,共有エンコーダと2つの分離デコーダを用いた新しいGlance and Focus Matting Network(GFM)を提案する。
総合的な実証研究により、GFMは最先端の手法より優れていることが示されている。
論文 参考訳(メタデータ) (2020-10-30T10:57:13Z) - Adversarial Image Composition with Auxiliary Illumination [53.89445873577062]
本稿では,現実的な画像合成を実現するためのAIC-Netを提案する。
影の発生と前景の移動を両立させる新しい分岐生成機構を提案する。
歩行者と自動車のコンポジションタスクに関する実験により,提案したAIC-Netが優れたコンポジション性能を実現することを示す。
論文 参考訳(メタデータ) (2020-09-17T12:58:16Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。