論文の概要: A Generative Adversarial Framework for Optimizing Image Matting and
Harmonization Simultaneously
- arxiv url: http://arxiv.org/abs/2108.06087v1
- Date: Fri, 13 Aug 2021 06:48:14 GMT
- ステータス: 処理完了
- システム内更新日: 2021-08-16 13:08:34.796686
- Title: A Generative Adversarial Framework for Optimizing Image Matting and
Harmonization Simultaneously
- Title(参考訳): 画像マッチングとハーモニゼーションを同時に最適化するジェネレータフレームワーク
- Authors: Xuqian Ren, Yifan Liu, Chunlei Song
- Abstract要約: 本稿では,自己注意識別器をベースとしたマッチングネットワークと調和ネットワークを最適化するGAN(Generative Adversarial)フレームワークを提案する。
私たちのデータセットとデータセット生成パイプラインは、urlhttps://git.io/HaMaGANで確認できます。
- 参考スコア(独自算出の注目度): 7.541357996797061
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Image matting and image harmonization are two important tasks in image
composition. Image matting, aiming to achieve foreground boundary details, and
image harmonization, aiming to make the background compatible with the
foreground, are both promising yet challenging tasks. Previous works consider
optimizing these two tasks separately, which may lead to a sub-optimal
solution. We propose to optimize matting and harmonization simultaneously to
get better performance on both the two tasks and achieve more natural results.
We propose a new Generative Adversarial (GAN) framework which optimizing the
matting network and the harmonization network based on a self-attention
discriminator. The discriminator is required to distinguish the natural images
from different types of fake synthesis images. Extensive experiments on our
constructed dataset demonstrate the effectiveness of our proposed method. Our
dataset and dataset generating pipeline can be found in
\url{https://git.io/HaMaGAN}
- Abstract(参考訳): イメージマッティングとイメージ調和は、画像合成において2つの重要なタスクである。
前景境界の詳細を達成することを目的とした画像マッチングと、背景を前景と互換性を持たせることを目的とした画像調和は、どちらも有望だが困難な課題である。
以前の研究では、これら2つのタスクを別々に最適化することを検討している。
2つのタスクでより優れたパフォーマンスを得られ、より自然な結果が得られるように、マッティングと調和を同時に最適化することを提案する。
本稿では,自己認識型識別器に基づくマッチングネットワークと調和ネットワークを最適化するGAN(Generative Adversarial)フレームワークを提案する。
判別器は、自然画像と異なる種類の偽合成画像とを区別する必要がある。
構築したデータセットに対する大規模な実験により,提案手法の有効性が示された。
我々のデータセットとデータセット生成パイプラインは \url{https://git.io/HaMaGAN} で見ることができる。
関連論文リスト
- DiffHarmony: Latent Diffusion Model Meets Image Harmonization [11.500358677234939]
拡散モデルは画像から画像への翻訳タスクの迅速な開発を促進する。
スクラッチからの微調整事前学習潜伏拡散モデルは計算集約的である。
本稿では,事前学習した潜伏拡散モデルを画像調和タスクに適用し,調和性はあるが曖昧な初期画像を生成する。
論文 参考訳(メタデータ) (2024-04-09T09:05:23Z) - Exposure Bracketing is All You Need for Unifying Image Restoration and Enhancement Tasks [50.822601495422916]
本稿では,露光ブラケット写真を利用して画像復元と拡張作業を統合することを提案する。
実世界のペアの収集が困難であるため,まず合成ペアデータを用いてモデルを事前学習する手法を提案する。
特に,時間変調リカレントネットワーク(TMRNet)と自己教師あり適応手法を提案する。
論文 参考訳(メタデータ) (2024-01-01T14:14:35Z) - Deep Image Harmonization with Learnable Augmentation [17.690945824240348]
小型データセットの照明多様性を向上し、調和性能を向上させるため、学習可能な拡張法を提案する。
SycoNetは、フォアグラウンドマスクとランダムベクトルで実画像を取り込んで、適切な色変換を学習し、この実画像のフォアグラウンドに適用して合成合成合成画像を生成する。
論文 参考訳(メタデータ) (2023-08-01T08:40:23Z) - Painterly Image Harmonization in Dual Domains [13.067850524730698]
本稿では,2つのドメイン・ジェネレータと2つのドメイン・ディスクリミネータから構成される画期的調和ネットワークを提案する。
二重領域生成器は空間領域のAdaINモジュールと周波数領域のResFFTモジュールを用いて調和を行う。
二重領域判別器は、各パッチの空間的特徴と周波数特徴に基づいて不調和なパッチを識別し、逆向きにジェネレータの能力を高める。
論文 参考訳(メタデータ) (2022-12-17T11:00:34Z) - Image Harmonization with Region-wise Contrastive Learning [51.309905690367835]
本稿では,外部スタイルの融合と領域単位のコントラスト学習方式を備えた新しい画像調和フレームワークを提案する。
提案手法は, 前景と背景の相互情報を最大化することにより, 対応する正と負のサンプルをまとめることを試みる。
論文 参考訳(メタデータ) (2022-05-27T15:46:55Z) - Spatial-Separated Curve Rendering Network for Efficient and
High-Resolution Image Harmonization [59.19214040221055]
本稿では,空間分離型曲線描画ネットワーク(S$2$CRNet)を提案する。
提案手法は従来の手法と比較して90%以上のパラメータを減少させる。
提案手法は,既存の手法よりも10ドル以上高速な高解像度画像をリアルタイムにスムーズに処理することができる。
論文 参考訳(メタデータ) (2021-09-13T07:20:16Z) - SSH: A Self-Supervised Framework for Image Harmonization [97.16345684998788]
我々は、編集せずに「自由」な自然画像だけで訓練できる新しい自己改善調和フレームワーク(SSH)を提案する。
提案したSSHは,基準指標,視覚的品質,主観的ユーザスタディにおいて,従来の最先端手法よりも優れていた。
論文 参考訳(メタデータ) (2021-08-15T19:51:33Z) - Adversarial Image Composition with Auxiliary Illumination [53.89445873577062]
本稿では,現実的な画像合成を実現するためのAIC-Netを提案する。
影の発生と前景の移動を両立させる新しい分岐生成機構を提案する。
歩行者と自動車のコンポジションタスクに関する実験により,提案したAIC-Netが優れたコンポジション性能を実現することを示す。
論文 参考訳(メタデータ) (2020-09-17T12:58:16Z) - A Flexible Framework for Designing Trainable Priors with Adaptive
Smoothing and Game Encoding [57.1077544780653]
我々は、前方通過を非滑らかな凸最適化問題として解釈できるニューラルネットワーク層の設計とトレーニングのための一般的なフレームワークを紹介する。
グラフのノードに代表されるローカルエージェントによって解決され、正規化関数を介して相互作用する凸ゲームに焦点を当てる。
このアプローチは、訓練可能なエンドツーエンドのディープモデル内で、古典的な画像の事前使用を可能にするため、画像の問題を解決するために魅力的である。
論文 参考訳(メタデータ) (2020-06-26T08:34:54Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。