論文の概要: Painterly Image Harmonization via Adversarial Residual Learning
- arxiv url: http://arxiv.org/abs/2311.08646v1
- Date: Wed, 15 Nov 2023 01:53:46 GMT
- ステータス: 処理完了
- システム内更新日: 2023-11-16 17:41:18.828725
- Title: Painterly Image Harmonization via Adversarial Residual Learning
- Title(参考訳): 逆相残差学習による絵画の高調波化
- Authors: Xudong Wang, Li Niu, Junyan Cao, Yan Hong, Liqing Zhang
- Abstract要約: 画家的なイメージは 背景の絵のスタイルを 前景の物体に 転送することを目的としています
本研究では,前景特徴写像と背景特徴写像の間の領域ギャップを埋めるために,逆学習を用いる。
- 参考スコア(独自算出の注目度): 37.78751164466694
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Image compositing plays a vital role in photo editing. After inserting a
foreground object into another background image, the composite image may look
unnatural and inharmonious. When the foreground is photorealistic and the
background is an artistic painting, painterly image harmonization aims to
transfer the style of background painting to the foreground object, which is a
challenging task due to the large domain gap between foreground and background.
In this work, we employ adversarial learning to bridge the domain gap between
foreground feature map and background feature map. Specifically, we design a
dual-encoder generator, in which the residual encoder produces the residual
features added to the foreground feature map from main encoder. Then, a
pixel-wise discriminator plays against the generator, encouraging the refined
foreground feature map to be indistinguishable from background feature map.
Extensive experiments demonstrate that our method could achieve more harmonious
and visually appealing results than previous methods.
- Abstract(参考訳): 画像合成は写真編集において重要な役割を果たす。
別の背景画像にフォアグラウンドオブジェクトを挿入すると、合成画像は不自然で不調和に見える。
前景がフォトリアリスティックで背景が芸術的絵画である場合、画像調和は背景画の様式を前景と背景の間に大きな領域ギャップがあるため困難な課題である前景に伝達することを目的としている。
本研究では,前景特徴マップと背景特徴マップとのドメイン間ギャップを埋めるために,逆学習を用いる。
具体的には,残差エンコーダが主エンコーダから前景特徴マップに付加された残差特徴を生成するデュアルエンコーダジェネレータを設計する。
そして、画素単位での判別器がジェネレータと対戦し、洗練されたフォアグラウンド特徴マップが背景特徴マップと区別できないように促す。
広汎な実験により,本手法は従来の方法よりも調和し,視覚的に魅力的な結果が得られることが示された。
関連論文リスト
- DiffUHaul: A Training-Free Method for Object Dragging in Images [78.93531472479202]
DiffUHaulと呼ばれるオブジェクトドラッグタスクのためのトレーニング不要な手法を提案する。
まず、各認知段階に注意マスキングを適用して、各生成を異なるオブジェクトにまたがってよりゆがみやすくする。
初期のデノナイジングステップでは、ソース画像とターゲット画像の注意特徴を補間して、新しいレイアウトを元の外観とスムーズに融合させる。
論文 参考訳(メタデータ) (2024-06-03T17:59:53Z) - Painterly Image Harmonization by Learning from Painterly Objects [35.23590833646526]
美術絵画の絵画的対象に基づいて,背景のスタイルや物体情報から物体のスタイルへのマッピングを学習する。
学習したマッピングにより、エンコーダ特徴写像を調和させて調和した画像を生成するために使用される複合オブジェクトのターゲットスタイルを幻覚することができる。
論文 参考訳(メタデータ) (2023-12-15T23:36:44Z) - Cylin-Painting: Seamless {360\textdegree} Panoramic Image Outpainting
and Beyond [136.18504104345453]
塗り絵と塗り絵の間に有意義な協調関係を持つキリン塗り絵の枠組みを提示する。
提案アルゴリズムは、オブジェクト検出、深さ推定、画像超解像などの他のパノラマ視覚タスクに効果的に拡張できる。
論文 参考訳(メタデータ) (2022-04-18T21:18:49Z) - Contextual Attention Mechanism, SRGAN Based Inpainting System for
Eliminating Interruptions from Images [2.894944733573589]
完全な機械学習アプローチを用いて,画像のインペイントのためのエンドツーエンドパイプラインを提案する。
まず、YOLOモデルを使用して、画像から削除したいオブジェクトを自動的に識別し、ローカライズします。
その後、領域を埋めるためにコンテキストアテンション法を用いたGANモデルにマスク画像とオリジナル画像を提供する。
論文 参考訳(メタデータ) (2022-04-06T05:51:04Z) - Location-Free Camouflage Generation Network [82.74353843283407]
カモフラージュ(Camouflage)は一般的な視覚現象で、前景の物体を背景のイメージに隠すことで、人間の目からは一時的に見えなくなる。
本稿では,前景と背景像の高次特徴を融合させ,一つの推論によって結果を生成する,ロケーションフリーなカモフラージュ生成ネットワーク(LCG-Net)を提案する。
実験により,本手法は単一外観領域における最先端技術と同程度に良好であり,完全に見えない可能性が低いが,多外観領域における最先端技術の品質をはるかに上回っていることが示された。
論文 参考訳(メタデータ) (2022-03-18T10:33:40Z) - Pose with Style: Detail-Preserving Pose-Guided Image Synthesis with
Conditional StyleGAN [88.62422914645066]
任意のポーズで1つの画像から人物を再レンダリングするアルゴリズムを提案する。
既存の方法では、画像の同一性や細部を保ちながら、隠蔽されたコンテンツを写実的に幻覚することはしばしば困難である。
本手法は, 定量的評価と視覚的比較の両方において, 最先端のアルゴリズムと良好に比較できることを示す。
論文 参考訳(メタデータ) (2021-09-13T17:59:33Z) - BargainNet: Background-Guided Domain Translation for Image Harmonization [26.370523451625466]
不調和な前景と背景は合成画像の品質を低下させる。
整合性を改善するために前景を調整した画像調和は、不可欠だが難しい課題である。
本稿では,新しいドメインコード抽出器とよく調整された三重項損失を用いた画像調和ネットワークを提案する。
論文 参考訳(メタデータ) (2020-09-19T05:14:08Z) - BachGAN: High-Resolution Image Synthesis from Salient Object Layout [78.51640906030244]
本稿では、より実用的な画像生成のための新しい課題である、有能なオブジェクトレイアウトからの高品質な画像合成を提案する。
i) セグメンテーションマップ入力なしできめ細かい詳細と現実的なテクスチャを生成する方法、(ii) バックグラウンドを作成してスタンドアロンのオブジェクトにシームレスに織り込む方法である。
幻影背景表現を動的に生成することにより,高解像度画像をフォトリアリスティック・フォアグラウンドと積分背景の両方で合成することができる。
論文 参考訳(メタデータ) (2020-03-26T00:54:44Z) - Unsupervised Disentanglement of Pose, Appearance and Background from
Images and Videos [44.93648211794362]
教師なしのランドマーク学習は、高価な入力キーポイントレベルのアノテーションを使わずに意味キーポイントのような表現を学習するタスクである。
一般的なアプローチは、イメージをポーズと外観データストリームに分解し、分解されたコンポーネントからイメージを再構成することである。
本研究は, 再建作業を異なる前景と背景の復元に分解する効果について検討する。
論文 参考訳(メタデータ) (2020-01-26T20:59:47Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。