論文の概要: Making Images Real Again: A Comprehensive Survey on Deep Image
Composition
- arxiv url: http://arxiv.org/abs/2106.14490v1
- Date: Mon, 28 Jun 2021 09:09:14 GMT
- ステータス: 処理完了
- システム内更新日: 2021-06-29 18:03:06.505387
- Title: Making Images Real Again: A Comprehensive Survey on Deep Image
Composition
- Title(参考訳): 画像の作り直し:ディープ・イメージ・コンポジションに関する総合的な調査
- Authors: Li Niu, Wenyan Cong, Liu Liu, Yan Hong, Bo Zhang, Jing Liang, Liqing
Zhang
- Abstract要約: 画像合成は、ある画像から前景を切り取り、別の画像に貼り付け、合成画像を作成することを目的としている。
しかし、合成画像が非現実的になるような問題は数多くある。
- 参考スコア(独自算出の注目度): 21.732542223106236
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: As a common image editing operation, image composition aims to cut the
foreground from one image and paste it on another image, resulting in a
composite image. However, there are many issues that could make the composite
images unrealistic. These issues can be summarized as the inconsistency between
foreground and background, which include appearance inconsistency (e.g.,
incompatible color and illumination) and geometry inconsistency (e.g.,
unreasonable size and location). Previous works on image composition target at
one or more issues. Since each individual issue is a complicated problem, there
are some research directions (e.g., image harmonization, object placement)
which focus on only one issue. By putting all the efforts together, we can
acquire realistic composite images. Sometimes, we expect the composite images
to be not only realistic but also aesthetic, in which case aesthetic evaluation
needs to be considered. In this survey, we summarize the datasets and methods
for the above research directions. We also discuss the limitations and
potential directions to facilitate the future research for image composition.
Finally, as a double-edged sword, image composition may also have negative
effect on our lives (e.g., fake news) and thus it is imperative to develop
algorithms to fight against composite images. Datasets and codes for image
composition are summarized at
https://github.com/bcmi/Awesome-Image-Composition.
- Abstract(参考訳): 一般的な画像編集操作として、画像合成は前景を1枚の画像から切り離して別の画像に貼り付けることを目的としており、合成画像となる。
しかし、合成画像が非現実的になるような問題は数多くある。
これらの問題は、前景と背景の矛盾(例えば、不適合な色と照明)と幾何学的不整合(例えば、不合理な大きさと位置)である。
以前、画像合成のターゲットは1つ以上の問題だった。
個々の問題は複雑な問題であるため、ある研究方向(例えば、画像調和、オブジェクト配置など)が1つの問題だけに焦点を当てている。
すべての努力をまとめることで、現実的な合成画像を得ることができる。
時には、合成画像が現実的なだけでなく、美的評価も考慮する必要があると期待することもある。
本稿では,上記研究の方向性に関するデータセットと手法について概説する。
また,画像合成の今後の研究を促進するための限界と可能性について考察する。
最後に、二重刃の剣として、画像合成は私たちの生活(例えばフェイクニュース)に悪影響を及ぼす可能性があるため、複合画像と戦うアルゴリズムを開発することが不可欠である。
画像合成のためのデータセットとコードはhttps://github.com/bcmi/Awesome-Image-Compositionで要約されている。
関連論文リスト
- DepGAN: Leveraging Depth Maps for Handling Occlusions and Transparency in Image Composition [7.693732944239458]
DepGANは、デプスマップとアルファチャンネルを利用して、不正確なオクルージョンを正すジェネレーティブ・アドバイサル・ネットワークである。
我々のネットワークの中心にはDepth Aware Lossと呼ばれる新しいロス関数があり、ピクセルのワイド深さ差を定量化している。
我々は不透明データを利用してネットワークの学習プロセスを強化し、透明で半透明なオブジェクトを含む構成を効果的に管理する。
論文 参考訳(メタデータ) (2024-07-16T16:18:40Z) - DreamCom: Finetuning Text-guided Inpainting Model for Image Composition [24.411003826961686]
本研究では、画像合成を、特定の対象に対してカスタマイズされた画像インペイントとして扱うことで、DreamComを提案する。
具体的には、同じオブジェクトを含むいくつかの参照画像に基づいて、事前学習したテキスト誘導画像の塗装モデルを精査する。
実際には、挿入された物体は背景の影響を受けやすいため、陰性な背景干渉を避けるためにマスキングされた注意機構を提案する。
論文 参考訳(メタデータ) (2023-09-27T09:23:50Z) - DESOBAv2: Towards Large-scale Real-world Dataset for Shadow Generation [19.376935979734714]
本研究では,合成画像をよりリアルにするために,挿入された前景オブジェクトに対する可塑性影の生成に焦点をあてる。
既存の小規模なデータセットであるDESOBAを補完するために、DESOBAv2と呼ばれる大規模なデータセットを作成します。
論文 参考訳(メタデータ) (2023-08-19T10:21:23Z) - Blind Image Decomposition [53.760745569495825]
本稿では,Blind Image Decomposition (BID)について述べる。
雨のような重畳された画像を異なるソースコンポーネントに分解する方法は、現実世界の視覚システムにとって重要なステップだ。
本稿では,Blind Image Decomposition Network (BIDeN) を提案する。
論文 参考訳(メタデータ) (2021-08-25T17:37:19Z) - SSH: A Self-Supervised Framework for Image Harmonization [97.16345684998788]
我々は、編集せずに「自由」な自然画像だけで訓練できる新しい自己改善調和フレームワーク(SSH)を提案する。
提案したSSHは,基準指標,視覚的品質,主観的ユーザスタディにおいて,従来の最先端手法よりも優れていた。
論文 参考訳(メタデータ) (2021-08-15T19:51:33Z) - Shadow Generation for Composite Image in Real-world Scenes [23.532079444113528]
本稿では,シャドウマスク予測段階とシャドウマスク充填段階からなる新しいシャドウ生成ネットワークsgrnetを提案する。
シャドウマスク予測段階では、フォアグラウンドと背景情報が徹底的に相互作用してフォアグラウンドシャドウマスクを生成する。
シャドウ充填段階では、シャドウパラメータがシャドウ領域を満たすように予測される。
論文 参考訳(メタデータ) (2021-04-21T03:30:02Z) - Deep Image Compositing [0.0]
画像編集では、最も一般的なタスクは、一方の画像から他方の画像にオブジェクトを貼り付け、背景オブジェクトで前景オブジェクトの表示を調整することです。
そのためには、GANS(Generative Adversarial Networks)を使用しています。
GANSは、画像の前景と背景部分の色ヒストグラムをデコードすることができ、また、前景オブジェクトと背景をブレンドすることを学ぶことができる。
論文 参考訳(メタデータ) (2021-03-29T09:23:37Z) - Deep Image Compositing [93.75358242750752]
ユーザ入力なしで高品質の画像合成を自動生成する手法を提案する。
ラプラシアン・ピラミッド・ブレンディングにインスパイアされ、フォアグラウンドや背景画像からの情報を効果的に融合させるために、密結合型多ストリーム融合ネットワークが提案されている。
実験により,提案手法は高品質な合成物を自動生成し,定性的かつ定量的に既存手法より優れた性能を発揮することが示された。
論文 参考訳(メタデータ) (2020-11-04T06:12:24Z) - Bridging Composite and Real: Towards End-to-end Deep Image Matting [88.79857806542006]
画像マッチングにおける意味論と細部の役割について検討する。
本稿では,共有エンコーダと2つの分離デコーダを用いた新しいGlance and Focus Matting Network(GFM)を提案する。
総合的な実証研究により、GFMは最先端の手法より優れていることが示されている。
論文 参考訳(メタデータ) (2020-10-30T10:57:13Z) - Adversarial Image Composition with Auxiliary Illumination [53.89445873577062]
本稿では,現実的な画像合成を実現するためのAIC-Netを提案する。
影の発生と前景の移動を両立させる新しい分岐生成機構を提案する。
歩行者と自動車のコンポジションタスクに関する実験により,提案したAIC-Netが優れたコンポジション性能を実現することを示す。
論文 参考訳(メタデータ) (2020-09-17T12:58:16Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。