論文の概要: TransCC: Transformer-based Multiple Illuminant Color Constancy Using
Multitask Learning
- arxiv url: http://arxiv.org/abs/2211.08772v1
- Date: Wed, 16 Nov 2022 09:00:20 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-17 15:29:58.158246
- Title: TransCC: Transformer-based Multiple Illuminant Color Constancy Using
Multitask Learning
- Title(参考訳): TransCC:マルチタスク学習を用いたトランスフォーマーを用いたマルチイルミナントカラーコンステンシー
- Authors: Shuwei Li, Jikai Wang, Michael S. Brown, Robby T. Tan
- Abstract要約: 本稿では,1枚の入力画像から1枚の光色と複数枚の光色を推定する,トランスフォーマーに基づくマルチタスク学習手法を提案する。
提案手法は,最先端のマルチ照度カラーコンステンシー法と比較して40.7%改善可能であることを示す。
- 参考スコア(独自算出の注目度): 49.297535205619106
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Multi-illuminant color constancy is a challenging problem with only a few
existing methods. For example, one prior work used a small set of predefined
white balance settings and spatially blended among them, limiting the solution
to predefined illuminations. Another method proposed a generative adversarial
network and an angular loss, yet the performance is suboptimal due to the lack
of regularization for multi-illumination colors. This paper introduces a
transformer-based multi-task learning method to estimate single and multiple
light colors from a single input image. To help our deep learning model have
better cues of the light colors, achromatic-pixel detection, and edge detection
are used as auxiliary tasks in our multi-task learning setting. By exploiting
extracted content features from the input image as tokens, illuminant color
correlations between pixels are learned by leveraging contextual information in
our transformer. Our transformer approach is further assisted via a contrastive
loss defined between the input, output, and ground truth. We demonstrate that
our proposed model achieves 40.7% improvement compared to a state-of-the-art
multi-illuminant color constancy method on a multi-illuminant dataset (LSMI).
Moreover, our model maintains a robust performance on the single illuminant
dataset (NUS-8) and provides 22.3% improvement on the state-of-the-art single
color constancy method.
- Abstract(参考訳): マルチイルミナント色濃度は、いくつかの既存手法では難しい問題である。
例えば、ある先行研究では、予め定義されたホワイトバランスの設定の小さなセットを使用し、その間に空間的にブレンドし、あらかじめ定義された照明に溶液を制限した。
別の手法では、生成逆ネットワークと角損失を提案したが、多色照明色の正規化が欠如しているため、性能は最適ではない。
本稿では,単一入力画像から単色および複数光色を推定するトランスベースマルチタスク学習手法を提案する。
深層学習モデルにおいて,光色,無彩色・画素検出,エッジ検出が,マルチタスク学習環境における補助的タスクとして使用される。
入力画像から抽出されたコンテンツ特徴をトークンとして活用することにより、我々のトランスフォーマの文脈情報を利用して画素間の照度色相関を学習する。
我々のトランスアプローチは、入力、出力、および基底真理の間に定義された対照的な損失によってさらに補助される。
提案手法は,マルチイルミナントデータセット(LSMI)上で,最先端のマルチイルミナントカラーコンスタンス法と比較して40.7%改善可能であることを示す。
さらに,本モデルは単一照度データセット (nus-8) 上でロバストな性能を維持し,最先端の単一カラーコンステンシー法を22.3%改善した。
関連論文リスト
- MultiColor: Image Colorization by Learning from Multiple Color Spaces [4.738828630428634]
MultiColorは、グレースケールイメージを自動的にカラー化する学習ベースの新しいアプローチである。
我々は、個々の色空間に専用の着色モジュール群を用いる。
これらの予測色チャネルは様々な色空間を表すため、相補的なネットワークは相補性を生かし、優雅で合理的な色付き画像を生成するように設計されている。
論文 参考訳(メタデータ) (2024-08-08T02:34:41Z) - Control Color: Multimodal Diffusion-based Interactive Image Colorization [81.68817300796644]
Control Color (Ctrl Color) は、事前訓練された安定拡散(SD)モデルを利用する多モードカラー化手法である。
ユーザのストロークをエンコードして、局所的な色操作を正確に行うための効果的な方法を提案する。
また、カラーオーバーフローと不正確な色付けの長年の問題に対処するために、自己注意に基づく新しいモジュールとコンテンツ誘導型変形可能なオートエンコーダを導入する。
論文 参考訳(メタデータ) (2024-02-16T17:51:13Z) - You Only Need One Color Space: An Efficient Network for Low-light Image Enhancement [50.37253008333166]
低照度画像強調(LLIE)タスクは、劣化した低照度画像から詳細と視覚情報を復元する傾向がある。
水平/垂直インテンシティ(HVI)と呼ばれる新しいトレーニング可能なカラー空間を提案する。
輝度と色をRGBチャネルから切り離して、拡張中の不安定性を緩和するだけでなく、トレーニング可能なパラメータによって異なる照明範囲の低照度画像にも適応する。
論文 参考訳(メタデータ) (2024-02-08T16:47:43Z) - Pixel-Wise Color Constancy via Smoothness Techniques in Multi-Illuminant
Scenes [16.176896461798993]
複数光源による画素ワイズ照明図を学習し,新しい多照度カラーコンスタント法を提案する。
提案手法は, 隣接する画素内のスムーズさを, 全変動損失でトレーニングを正則化することによって実施する。
さらに、エッジを保ちながら、推定画像の自然な外観を高めるために、両側フィルタを設ける。
論文 参考訳(メタデータ) (2024-02-05T11:42:19Z) - Diving into Darkness: A Dual-Modulated Framework for High-Fidelity
Super-Resolution in Ultra-Dark Environments [51.58771256128329]
本稿では,低照度超解像課題の性質を深く理解しようとする,特殊二変調学習フレームワークを提案する。
Illuminance-Semantic Dual Modulation (ISDM) コンポーネントを開発した。
包括的実験は、我々のアプローチが多様で挑戦的な超低照度条件に適用可能であることを示す。
論文 参考訳(メタデータ) (2023-09-11T06:55:32Z) - Generative Models for Multi-Illumination Color Constancy [23.511249515559122]
そこで本研究では,種(物理駆動)に基づく多照色濃度法を提案する。
GANを用いて照明推定問題を画像から画像へのドメイン変換問題としてモデル化する。
単照度および多照度データセットを用いた実験により,本手法がソタ法より優れていることが示された。
論文 参考訳(メタデータ) (2021-09-02T12:24:40Z) - Underwater Image Enhancement via Medium Transmission-Guided Multi-Color
Space Embedding [88.46682991985907]
本稿では,Ucolor と呼ばれる媒体透過誘導多色空間埋め込みによる水中画像強調ネットワークを提案する。
当社のネットワークは、複数の色空間を埋め込むことにより、水中画像の視覚的品質を効果的に改善できます。
論文 参考訳(メタデータ) (2021-04-27T07:35:30Z) - Shed Various Lights on a Low-Light Image: Multi-Level Enhancement Guided
by Arbitrary References [17.59529931863947]
本稿では,マルチレベル低光度画像強調のためのニューラルネットワークを提案する。
スタイル転送にインスパイアされたこの手法は,潜在空間内の2つの低結合機能コンポーネントにイメージを分解する。
このようにして、ネットワークは一連の画像対からシーン不変および明るさ固有情報を抽出することを学ぶ。
論文 参考訳(メタデータ) (2021-01-04T07:38:51Z) - The Cube++ Illumination Estimation Dataset [50.58610459038332]
本稿では,新しい照明推定データセットを提案する。
照明色が既知の4890の画像と、追加のセマンティックデータで構成されている。
データセットは、単一または2つの照度推定を実行するメソッドのトレーニングとテストに使用することができる。
論文 参考訳(メタデータ) (2020-11-19T18:50:08Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。