論文の概要: A Multi-Hypothesis Approach to Color Constancy
- arxiv url: http://arxiv.org/abs/2002.12896v2
- Date: Mon, 2 Mar 2020 15:07:43 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-28 02:31:33.305312
- Title: A Multi-Hypothesis Approach to Color Constancy
- Title(参考訳): 色濃度に対する多相合成法
- Authors: Daniel Hernandez-Juarez and Sarah Parisot and Benjamin Busam and Ales
Leonardis and Gregory Slabaugh and Steven McDonagh
- Abstract要約: 現在のアプローチは、カメラ固有の照度マッピングを学習する際の色濃度の問題である。
本稿では,マルチハイプセシス戦略を用いて,自然に色相のあいまいさを処理できるベイズ的枠組みを提案する。
提案手法は,リアルタイムな実行を維持しつつ,複数の公開データセットに対して最先端の精度を提供する。
- 参考スコア(独自算出の注目度): 22.35581217222978
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Contemporary approaches frame the color constancy problem as learning camera
specific illuminant mappings. While high accuracy can be achieved on camera
specific data, these models depend on camera spectral sensitivity and typically
exhibit poor generalisation to new devices. Additionally, regression methods
produce point estimates that do not explicitly account for potential
ambiguities among plausible illuminant solutions, due to the ill-posed nature
of the problem. We propose a Bayesian framework that naturally handles color
constancy ambiguity via a multi-hypothesis strategy. Firstly, we select a set
of candidate scene illuminants in a data-driven fashion and apply them to a
target image to generate of set of corrected images. Secondly, we estimate, for
each corrected image, the likelihood of the light source being achromatic using
a camera-agnostic CNN. Finally, our method explicitly learns a final
illumination estimate from the generated posterior probability distribution.
Our likelihood estimator learns to answer a camera-agnostic question and thus
enables effective multi-camera training by disentangling illuminant estimation
from the supervised learning task. We extensively evaluate our proposed
approach and additionally set a benchmark for novel sensor generalisation
without re-training. Our method provides state-of-the-art accuracy on multiple
public datasets (up to 11% median angular error improvement) while maintaining
real-time execution.
- Abstract(参考訳): 現代のアプローチでは、カラーコンステンシー問題をカメラ固有の照度マッピングの学習として捉えている。
高い精度はカメラ固有のデータで達成できるが、これらのモデルはカメラのスペクトル感度に依存し、新しいデバイスにはあまり一般化されない。
さらに、回帰法は問題の性質が不明確であるため、可視照度解の潜在的な曖昧さを明示的に考慮しない点推定を生成する。
本稿では,色相のあいまいさを自然に扱うベイズ的枠組みを提案する。
まず、データ駆動方式で候補シーン照度のセットを選択し、対象画像に適用して修正画像のセットを生成する。
第2に、補正画像毎に、光源が無彩色である可能性がカメラ非依存のCNNを用いて推定する。
最後に,提案手法は生成した後続確率分布から最終照明推定値を明示的に学習する。
確率推定器はカメラ非依存の質問に答えることを学び、教師付き学習タスクから照度推定を分離することで、効果的なマルチカメラトレーニングを可能にする。
提案手法を広範に評価し,新たなセンサ一般化のためのベンチマークを再学習せずに設定した。
提案手法は,リアルタイム実行を維持しつつ,複数の公開データセット(最大11%の中央値角誤差改善)に対して最先端の精度を提供する。
関連論文リスト
- Single-image camera calibration with model-free distortion correction [0.0]
本稿では,センサ全体をカバーする平面スペックルパターンの単一画像から,キャリブレーションパラメータの完全な集合を推定する方法を提案する。
デジタル画像相関を用いて校正対象の画像点と物理点との対応を求める。
プロシージャの最後には、画像全体にわたって、密度が高く均一なモデルフリーな歪みマップが得られる。
論文 参考訳(メタデータ) (2024-03-02T16:51:35Z) - Cameras as Rays: Pose Estimation via Ray Diffusion [54.098613859015856]
カメラのポーズを推定することは3D再構成の基本的な課題であり、まばらにサンプリングされたビューを考えると依然として困難である。
本稿では,カメラを光束として扱うカメラポーズの分散表現を提案する。
提案手法は回帰法と拡散法の両方で,CO3Dのカメラポーズ推定における最先端性能を示す。
論文 参考訳(メタデータ) (2024-02-22T18:59:56Z) - Dimma: Semi-supervised Low Light Image Enhancement with Adaptive Dimming [0.728258471592763]
自然色を維持しながら低照度画像を強調することは、カメラ処理のバリエーションによって難しい問題である。
そこで我々はDimmaを提案する。Dimmaは、画像対の小さなセットを利用して、任意のカメラと整合する半教師付きアプローチである。
そこで我々は,照明の違いに基づいて,シーンの歪み色を生成する畳み込み混合密度ネットワークを導入することで実現した。
論文 参考訳(メタデータ) (2023-10-14T17:59:46Z) - Deep Richardson-Lucy Deconvolution for Low-Light Image Deblurring [48.80983873199214]
我々は,飽和画素を学習潜時マップでモデル化するデータ駆動型手法を開発した。
新しいモデルに基づいて、非盲検除色タスクを最大後部(MAP)問題に定式化することができる。
増幅されたアーティファクトを使わずに高品質な劣化画像を推定するために,我々は事前推定ネットワークを構築した。
論文 参考訳(メタデータ) (2023-08-10T12:53:30Z) - Single Image Depth Prediction Made Better: A Multivariate Gaussian Take [163.14849753700682]
本稿では,画素ごとの深度を連続的にモデル化する手法を提案する。
提案手法の精度(MG)は,KITTI深度予測ベンチマークリーダーボードの上位に位置する。
論文 参考訳(メタデータ) (2023-03-31T16:01:03Z) - Learning Enriched Illuminants for Cross and Single Sensor Color
Constancy [182.4997117953705]
ネットワークをトレーニングするためのクロスセンサ自己教師型トレーニングを提案する。
センサに依存しない方法で人工発光体をランダムにサンプリングすることでネットワークを訓練する。
実験により、我々のクロスセンサモデルとシングルセンサーモデルは、他の最先端手法よりも大きなマージンで優れていることが示された。
論文 参考訳(メタデータ) (2022-03-21T15:45:35Z) - Spatio-Temporal Outdoor Lighting Aggregation on Image Sequences using
Transformer Networks [23.6427456783115]
本研究は,画像からのノイズ推定を集約した屋外照明推定に焦点をあてる。
ディープニューラルネットワークに基づく最近の研究は、単一画像の照明推定に有望な結果を示しているが、堅牢性に悩まされている。
画像シーケンスの角領域と時間領域でサンプリングされた複数の画像ビューからの照明推定値を組み合わせることで、この問題に対処する。
論文 参考訳(メタデータ) (2022-02-18T14:11:16Z) - Monte Carlo Dropout Ensembles for Robust Illumination Estimation [94.14796147340041]
計算カラー一貫性(Computational Color Constancy)は、多くのカメラシステムで使用される前処理ステップである。
出力の不確実性に応じて異なる深層学習手法を集約することを提案する。
提案したフレームワークはINTEL-TAUデータセット上での最先端のパフォーマンスを実現する。
論文 参考訳(メタデータ) (2020-07-20T13:56:14Z) - 6D Camera Relocalization in Ambiguous Scenes via Continuous Multimodal
Inference [67.70859730448473]
あいまいさと不確かさを捉えるマルチモーダルカメラ再ローカライズフレームワークを提案する。
我々は、複数のカメラのポーズ仮説を予測し、それぞれの予測の不確実性も予測する。
あいまいな環境下でのカメラローカライゼーション研究を促進するための新しいデータセットを提案する。
論文 参考訳(メタデータ) (2020-04-09T20:55:06Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。