論文の概要: Deep Image Harmonization in Dual Color Spaces
- arxiv url: http://arxiv.org/abs/2308.02813v1
- Date: Sat, 5 Aug 2023 07:21:08 GMT
- ステータス: 処理完了
- システム内更新日: 2023-08-08 18:40:16.269574
- Title: Deep Image Harmonization in Dual Color Spaces
- Title(参考訳): デュアルカラー空間における深部画像調和
- Authors: Linfeng Tan, Jiangtong Li, Li Niu and Liqing Zhang
- Abstract要約: 既存の手法は主に相関した$RGB$色空間で動作し、絡み合った特徴と限られた表現能力に繋がる。
本稿では、両色空間における画像調和について検討する。これは、アンタングル付き$RGB$と非アンタングル付き$L$、$a$、$b$の機能を補うものである。
ネットワークは、$RGB$調和バックボーン、$Lab$エンコーディングモジュール、$Lab$コントロールモジュールで構成される。
- 参考スコア(独自算出の注目度): 20.782949230005322
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Image harmonization is an essential step in image composition that adjusts
the appearance of composite foreground to address the inconsistency between
foreground and background. Existing methods primarily operate in correlated
$RGB$ color space, leading to entangled features and limited representation
ability. In contrast, decorrelated color space (e.g., $Lab$) has decorrelated
channels that provide disentangled color and illumination statistics. In this
paper, we explore image harmonization in dual color spaces, which supplements
entangled $RGB$ features with disentangled $L$, $a$, $b$ features to alleviate
the workload in harmonization process. The network comprises a $RGB$
harmonization backbone, an $Lab$ encoding module, and an $Lab$ control module.
The backbone is a U-Net network translating composite image to harmonized
image. Three encoders in $Lab$ encoding module extract three control codes
independently from $L$, $a$, $b$ channels, which are used to manipulate the
decoder features in harmonization backbone via $Lab$ control module. Our code
and model are available at
\href{https://github.com/bcmi/DucoNet-Image-Harmonization}{https://github.com/bcmi/DucoNet-Image-Harmonization}.
- Abstract(参考訳): イメージ調和は、前景と背景の矛盾に対処するために、複合前景の外観を調整する画像合成において不可欠なステップである。
既存の手法は主に相関した$RGB$色空間で動作し、絡み合った特徴と限られた表現能力をもたらす。
対照的に、デコレーション色空間(例えば$lab$)は、ディコレーション色と照明の統計を提供するデコレーションチャネルを持つ。
本稿では、両色空間における画像調和について検討し、アンタングル付き$RGB$とアンタングル付き$L$,$a$,$b$の機能を補足することで、ハーモナイズプロセスにおける作業負荷を軽減する。
このネットワークは、$rgb$調和バックボーン、$lab$エンコーディングモジュール、$lab$コントロールモジュールで構成されている。
バックボーンは複合画像を調和画像に変換するU-Netネットワークである。
$Lab$エンコーディングモジュールの3つのエンコーダは、$L$, $a$, $b$チャネルから独立して3つのコントロールコードを抽出する。
私たちのコードとモデルは、 \href{https://github.com/bcmi/DucoNet-Image-Harmonization}{https://github.com/bcmi/DucoNet-Image-Harmonization}で利用可能です。
関連論文リスト
- Painterly Image Harmonization in Dual Domains [13.067850524730698]
本稿では,2つのドメイン・ジェネレータと2つのドメイン・ディスクリミネータから構成される画期的調和ネットワークを提案する。
二重領域生成器は空間領域のAdaINモジュールと周波数領域のResFFTモジュールを用いて調和を行う。
二重領域判別器は、各パッチの空間的特徴と周波数特徴に基づいて不調和なパッチを識別し、逆向きにジェネレータの能力を高める。
論文 参考訳(メタデータ) (2022-12-17T11:00:34Z) - DeepVoxNet2: Yet another CNN framework [6.692460499366963]
本稿では,DeepVoxNet2 (DVN2) の1, 2, 3次元画像分類とセグメンテーションのためのフレームワークを紹介する。
このチュートリアルでは、2018年のマルチモーダル脳腫瘍画像ベンチマーク(BRATS)のデータを使用して、3Dセグメンテーションパイプラインの例を示す。
論文 参考訳(メタデータ) (2022-11-17T14:54:12Z) - CcHarmony: Color-checker based Image Harmonization Dataset [13.651034765401386]
合成画像の前景を調整して背景と互換性を持たせ、よりリアルで調和した画像を生成する。
我々は、カラーチェッカー(cc)にちなむccHarmonyと呼ばれる画像調和データセットを構築した。
論文 参考訳(メタデータ) (2022-06-01T23:57:16Z) - FRIH: Fine-grained Region-aware Image Harmonization [49.420765789360836]
我々は,FRIH(Fentral-Aware Image Harmonization)のための新しいグローバルな2段階フレームワークを提案する。
提案アルゴリズムは,軽量モデルを用いて,iHarmony4データセット(PSNRは38.19dB)上で最高の性能を実現する。
論文 参考訳(メタデータ) (2022-05-13T04:50:26Z) - $\ell_1$DecNet+: A new architecture framework by $\ell_1$ decomposition and iteration unfolding for sparse feature segmentation [4.150107303000611]
$ell_$DecNetは、$ell_$関連スパース正規化を組み込んだ変動分解モデルから派生した、展開されていないネットワークである。
我々は$ell_$DecNet+を開発し、 $ell_$DecNetと抽出されたスパース機能を操作するセグメンテーションモジュールからなる学習可能なアーキテクチャフレームワークを開発した。
医療用画像処理における網膜血管分割と,産業用異常識別における舗装き裂検出の2つの課題に対する $ell_$DecNet+ の有効性を検討した。
論文 参考訳(メタデータ) (2022-03-05T09:17:32Z) - Pix2NeRF: Unsupervised Conditional $\pi$-GAN for Single Image to Neural
Radiance Fields Translation [93.77693306391059]
本研究では,物体のニューラルレージアンス場(NeRF)を生成するパイプラインを提案する。
本手法は,無条件3D画像合成のための生成モデルである$pi$-GANに基づいている。
論文 参考訳(メタデータ) (2022-02-26T15:28:05Z) - Spatial-Separated Curve Rendering Network for Efficient and
High-Resolution Image Harmonization [59.19214040221055]
本稿では,空間分離型曲線描画ネットワーク(S$2$CRNet)を提案する。
提案手法は従来の手法と比較して90%以上のパラメータを減少させる。
提案手法は,既存の手法よりも10ドル以上高速な高解像度画像をリアルタイムにスムーズに処理することができる。
論文 参考訳(メタデータ) (2021-09-13T07:20:16Z) - SSH: A Self-Supervised Framework for Image Harmonization [97.16345684998788]
我々は、編集せずに「自由」な自然画像だけで訓練できる新しい自己改善調和フレームワーク(SSH)を提案する。
提案したSSHは,基準指標,視覚的品質,主観的ユーザスタディにおいて,従来の最先端手法よりも優れていた。
論文 参考訳(メタデータ) (2021-08-15T19:51:33Z) - Auto-Encoding for Shared Cross Domain Feature Representation and
Image-to-Image Translation [0.0]
クロスドメイン画像から画像への変換はコンピュータビジョンとパターン認識問題のサブセットである。
単一エンコーダ・デコーダアーキテクチャを用いて,複数の領域にまたがるクロスドメイン画像と画像の変換を行う手法を提案する。
論文 参考訳(メタデータ) (2020-06-11T21:38:23Z) - On the Modularity of Hypernetworks [103.1147622394852]
構造化対象関数の場合、ハイパーネットワークにおけるトレーニング可能なパラメータの総数は、標準ニューラルネットワークのトレーニング可能なパラメータの数や埋め込み法よりも桁違いに小さいことを示す。
論文 参考訳(メタデータ) (2020-02-23T22:51:52Z) - Few-Shot Learning via Learning the Representation, Provably [115.7367053639605]
本稿では,表現学習による少数ショット学習について検討する。
1つのタスクは、ターゲットタスクのサンプルの複雑さを減らすために、$T$ソースタスクと$n_1$データを使用して表現を学習する。
論文 参考訳(メタデータ) (2020-02-21T17:30:00Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。