論文の概要: Deep Image Harmonization with Learnable Augmentation
- arxiv url: http://arxiv.org/abs/2308.00376v1
- Date: Tue, 1 Aug 2023 08:40:23 GMT
- ステータス: 処理完了
- システム内更新日: 2023-08-02 15:02:10.456635
- Title: Deep Image Harmonization with Learnable Augmentation
- Title(参考訳): 学習可能拡張による深部画像調和
- Authors: Li Niu, Junyan Cao, Wenyan Cong, Liqing Zhang
- Abstract要約: 小型データセットの照明多様性を向上し、調和性能を向上させるため、学習可能な拡張法を提案する。
SycoNetは、フォアグラウンドマスクとランダムベクトルで実画像を取り込んで、適切な色変換を学習し、この実画像のフォアグラウンドに適用して合成合成合成画像を生成する。
- 参考スコア(独自算出の注目度): 17.690945824240348
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The goal of image harmonization is adjusting the foreground appearance in a
composite image to make the whole image harmonious. To construct paired
training images, existing datasets adopt different ways to adjust the
illumination statistics of foregrounds of real images to produce synthetic
composite images. However, different datasets have considerable domain gap and
the performances on small-scale datasets are limited by insufficient training
data. In this work, we explore learnable augmentation to enrich the
illumination diversity of small-scale datasets for better harmonization
performance. In particular, our designed SYthetic COmposite Network (SycoNet)
takes in a real image with foreground mask and a random vector to learn
suitable color transformation, which is applied to the foreground of this real
image to produce a synthetic composite image. Comprehensive experiments
demonstrate the effectiveness of our proposed learnable augmentation for image
harmonization. The code of SycoNet is released at
https://github.com/bcmi/SycoNet-Adaptive-Image-Harmonization.
- Abstract(参考訳): 画像調和の目標は、合成画像の前景の外観を調整し、画像全体を調和させることである。
ペアトレーニング画像を構築するために、既存のデータセットは、実画像の前景の照明統計を調整して合成複合画像を生成する異なる方法を採用する。
しかしながら、異なるデータセットにはかなりのドメインギャップがあり、小規模データセットのパフォーマンスはトレーニングデータ不足によって制限される。
本研究では,小型データセットの照明多様性を向上し,調和性能を向上させるための学習可能な拡張について検討する。
特に,筆者らが設計したsymthetic composite network (syconet) は,前景マスクとランダムベクターを備えた実画像を取り込んで,この実画像の前景に適用して合成合成合成画像を生成する適切な色変換を学習する。
画像調和のための学習可能拡張の有効性を総合実験で実証した。
SycoNetのコードはhttps://github.com/bcmi/SycoNet-Adaptive-Image-Harmonizationで公開されている。
関連論文リスト
- Is Synthetic Image Useful for Transfer Learning? An Investigation into Data Generation, Volume, and Utilization [62.157627519792946]
ブリッジドトランスファー(ブリッジドトランスファー)と呼ばれる新しいフレームワークを導入する。このフレームワークは、当初、トレーニング済みモデルの微調整に合成画像を使用し、転送性を向上させる。
合成画像と実画像のスタイルアライメントを改善するために,データセットスタイルの逆変換方式を提案する。
提案手法は10の異なるデータセットと5つの異なるモデルで評価され、一貫した改善が示されている。
論文 参考訳(メタデータ) (2024-03-28T22:25:05Z) - Exposure Bracketing is All You Need for Unifying Image Restoration and Enhancement Tasks [50.822601495422916]
本稿では,露光ブラケット写真を利用して画像復元と拡張作業を統合することを提案する。
実世界のペアの収集が困難であるため,まず合成ペアデータを用いてモデルを事前学習する手法を提案する。
特に,時間変調リカレントネットワーク(TMRNet)と自己教師あり適応手法を提案する。
論文 参考訳(メタデータ) (2024-01-01T14:14:35Z) - ControlCom: Controllable Image Composition using Diffusion Model [45.48263800282992]
1つの拡散モデルにおいて4つのタスクを統一する制御可能な画像合成法を提案する。
また,拡散モデルにおける前景の詳細を強化するために,局所的な拡張モジュールを提案する。
提案手法は,公開ベンチマークと実世界のデータの両方を用いて評価する。
論文 参考訳(メタデータ) (2023-08-19T14:56:44Z) - Deep Image Harmonization with Globally Guided Feature Transformation and
Relation Distillation [20.302430505018]
我々は,グローバル情報を用いて前景の特徴変換を導くことで,大幅な改善が期待できることを示した。
また,前景と背景の関係を実画像から合成画像に転送し,変換エンコーダの特徴の中間的管理を行う。
論文 参考訳(メタデータ) (2023-08-01T07:53:25Z) - CcHarmony: Color-checker based Image Harmonization Dataset [13.651034765401386]
合成画像の前景を調整して背景と互換性を持たせ、よりリアルで調和した画像を生成する。
我々は、カラーチェッカー(cc)にちなむccHarmonyと呼ばれる画像調和データセットを構築した。
論文 参考訳(メタデータ) (2022-06-01T23:57:16Z) - Enhancing Low-Light Images in Real World via Cross-Image Disentanglement [58.754943762945864]
そこで本研究では,現実の汚職とミスアライメントされたトレーニング画像からなる,新しい低照度画像強調データセットを提案する。
本モデルでは,新たに提案したデータセットと,他の一般的な低照度データセットの両方に対して,最先端のパフォーマンスを実現する。
論文 参考訳(メタデータ) (2022-01-10T03:12:52Z) - SSH: A Self-Supervised Framework for Image Harmonization [97.16345684998788]
我々は、編集せずに「自由」な自然画像だけで訓練できる新しい自己改善調和フレームワーク(SSH)を提案する。
提案したSSHは,基準指標,視覚的品質,主観的ユーザスタディにおいて,従来の最先端手法よりも優れていた。
論文 参考訳(メタデータ) (2021-08-15T19:51:33Z) - A Generative Adversarial Framework for Optimizing Image Matting and
Harmonization Simultaneously [7.541357996797061]
本稿では,自己注意識別器をベースとしたマッチングネットワークと調和ネットワークを最適化するGAN(Generative Adversarial)フレームワークを提案する。
私たちのデータセットとデータセット生成パイプラインは、urlhttps://git.io/HaMaGANで確認できます。
論文 参考訳(メタデータ) (2021-08-13T06:48:14Z) - Deep Image Harmonization by Bridging the Reality Gap [18.86655082192153]
既存の実世界データセットを増強する人件費の少ない大規模レンダリング調和データセットRHHarmonyの構築を提案する。
実世界画像とレンダリング画像の両方を活用するため,クロスドメイン調和ネットワークcharmnetを提案する。
論文 参考訳(メタデータ) (2021-03-31T14:19:56Z) - Deep Image Compositing [93.75358242750752]
ユーザ入力なしで高品質の画像合成を自動生成する手法を提案する。
ラプラシアン・ピラミッド・ブレンディングにインスパイアされ、フォアグラウンドや背景画像からの情報を効果的に融合させるために、密結合型多ストリーム融合ネットワークが提案されている。
実験により,提案手法は高品質な合成物を自動生成し,定性的かつ定量的に既存手法より優れた性能を発揮することが示された。
論文 参考訳(メタデータ) (2020-11-04T06:12:24Z) - Intrinsic Autoencoders for Joint Neural Rendering and Intrinsic Image
Decomposition [67.9464567157846]
合成3Dモデルからリアルな画像を生成するためのオートエンコーダを提案し,同時に実像を本質的な形状と外観特性に分解する。
実験により, レンダリングと分解の併用処理が有益であることが確認され, 画像から画像への翻訳の質的, 定量的なベースラインよりも優れた結果が得られた。
論文 参考訳(メタデータ) (2020-06-29T12:53:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。