論文の概要: Training Neural Networks on RAW and HDR Images for Restoration Tasks
- arxiv url: http://arxiv.org/abs/2312.03640v2
- Date: Fri, 21 Mar 2025 10:23:16 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-03-24 14:53:00.121345
- Title: Training Neural Networks on RAW and HDR Images for Restoration Tasks
- Title(参考訳): 修復作業のためのRAWおよびHDR画像に基づくニューラルネットワークの訓練
- Authors: Andrew Yanzhe Ke, Lei Luo, Alexandre Chapiro, Xiaoyu Xiang, Yuchen Fan, Rakesh Ranjan, Rafal Mantiuk,
- Abstract要約: 線形色空間におけるRAWおよびHDR画像のタスクに対して、ニューラルネットワークをどのようにトレーニングするかを検討する。
その結果、ニューラルネットワークは色空間で表現されるHDRおよびRAW画像において、かなりよく訓練されていることが示唆された。
トレーニング戦略へのこの小さな変更は、2から9dBの間で、非常に大きなパフォーマンス向上をもたらします。
- 参考スコア(独自算出の注目度): 54.24020587899901
- License:
- Abstract: The vast majority of standard image and video content available online is represented in display-encoded color spaces, in which pixel values are conveniently scaled to a limited range (0-1) and the color distribution is approximately perceptually uniform. In contrast, both camera RAW and high dynamic range (HDR) images are often represented in linear color spaces, in which color values are linearly related to colorimetric quantities of light. While training on commonly available display-encoded images is a well-established practice, there is no consensus on how neural networks should be trained for tasks on RAW and HDR images in linear color spaces. In this work, we test several approaches on three popular image restoration applications: denoising, deblurring, and single-image super-resolution. We examine whether HDR/RAW images need to be display-encoded using popular transfer functions (PQ, PU21, and mu-law), or whether it is better to train in linear color spaces, but use loss functions that correct for perceptual non-uniformity. Our results indicate that neural networks train significantly better on HDR and RAW images represented in display-encoded color spaces, which offer better perceptual uniformity than linear spaces. This small change to the training strategy can bring a very substantial gain in performance, between 2 and 9 dB.
- Abstract(参考訳): オンラインで利用可能な標準画像やビデオコンテンツの大部分は、表示符号化された色空間で表現されており、画素値は、都合よく範囲(0-1)にスケールされ、色分布は概ね知覚的に均一である。
対照的に、カメラRAWと高ダイナミックレンジ(HDR)画像は、色値が色量量に線形に関係している線色空間でしばしば表現される。
一般的な表示符号化画像のトレーニングは確立された慣行であるが、線形色空間におけるRAWおよびHDRイメージのタスクに対して、ニューラルネットワークをどのようにトレーニングすべきかについては合意がない。
そこで本研究では,3つの画像復元アプリケーション(デノイング,デブロアリング,シングルイメージ超解像)について,いくつかのアプローチを検証した。
我々は,一般的な伝達関数(PQ,PU21,mu-law)を用いてHDR/RAW画像を表示符号化する必要があるか,線形色空間でのトレーニングが望ましいかを検討するが,知覚的非均一性に対して正しい損失関数を用いる。
その結果、ニューラルネットワークは、表示符号化された色空間で表現されるHDRやRAW画像のトレーニングに優れており、線形空間よりも知覚の均一性が高いことが示唆された。
トレーニング戦略へのこの小さな変更は、2から9dBの間で、非常に大きなパフォーマンス向上をもたらします。
関連論文リスト
- You Only Need One Color Space: An Efficient Network for Low-light Image Enhancement [50.37253008333166]
低照度画像強調(LLIE)タスクは、劣化した低照度画像から詳細と視覚情報を復元する傾向がある。
水平/垂直インテンシティ(HVI)と呼ばれる新しいトレーニング可能なカラー空間を提案する。
輝度と色をRGBチャネルから切り離して、拡張中の不安定性を緩和するだけでなく、トレーニング可能なパラメータによって異なる照明範囲の低照度画像にも適応する。
論文 参考訳(メタデータ) (2024-02-08T16:47:43Z) - Self-Supervised High Dynamic Range Imaging with Multi-Exposure Images in
Dynamic Scenes [58.66427721308464]
Selfは、訓練中にダイナミックなマルチ露光画像のみを必要とする自己教師型再構成手法である。
Selfは最先端の自己管理手法に対して優れた結果を出し、教師付き手法に匹敵するパフォーマンスを実現している。
論文 参考訳(メタデータ) (2023-10-03T07:10:49Z) - Transform your Smartphone into a DSLR Camera: Learning the ISP in the
Wild [159.71025525493354]
本稿では,スマートフォンが取得したRAW画像に基づいて,DSLRの品質画像を生成する訓練可能な画像信号処理フレームワークを提案する。
トレーニング画像ペア間の色ずれに対処するために、カラー条件ISPネットワークを使用し、各入力RAWと基準DSLR画像間の新しいパラメトリック色マッピングを最適化する。
論文 参考訳(メタデータ) (2022-03-20T20:13:59Z) - Locally Weighted Mean Phase Angle (LWMPA) Based Tone Mapping Quality
Index (TMQI-3) [0.0]
本稿では,低ダイナミックレンジ(LDR)画像の品質を客観的スコアに基づいて評価するトーンマッピング品質指標(TMQI-3)を提案する。
TMQI-3は耐雑音性があり、構造と自然性を考慮し、3つの色チャネル全てを1つのコンポーネントに統合する。
論文 参考訳(メタデータ) (2021-09-17T22:17:20Z) - Learning RAW-to-sRGB Mappings with Inaccurately Aligned Supervision [76.41657124981549]
本稿では,画像アライメントとRAW-to-sRGBマッピングのための共同学習モデルを提案する。
実験の結果,本手法はZRRおよびSR-RAWデータセットの最先端に対して良好に動作することがわかった。
論文 参考訳(メタデータ) (2021-08-18T12:41:36Z) - Learning to Structure an Image with Few Colors [59.34619548026885]
そこで,カラー量子化ネットワークであるColorCNNを提案する。
1ビットのカラースペース(すなわち2色)だけで、提案されたネットワークはCIFAR10データセット上で82.1%のトップ-1の精度を達成した。
アプリケーションの場合、PNGでエンコードされた場合、提案したカラー量子化は、極低ビットレート方式の他の画像圧縮方法よりも優れていることを示す。
論文 参考訳(メタデータ) (2020-03-17T17:56:15Z) - Adaptive Dithering Using Curved Markov-Gaussian Noise in the Quantized
Domain for Mapping SDR to HDR Image [2.913398015606848]
高ダイナミックレンジ(SDR)イメージングは、レギュラーディスプレイだけでなくスマートフォンでも、リアルなコンテンツによって注目を集めている。
本稿では,量子化画像の画素で動作するノイズ生成手法を提案する。
我々は、量子化画素のルマと逆トーンマッピング関数の傾きに基づいて、雑音パターンの大きさと構造を適応的に変化させる。
論文 参考訳(メタデータ) (2020-01-20T05:30:16Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。