論文の概要: Training Neural Networks on RAW and HDR Images for Restoration Tasks
- arxiv url: http://arxiv.org/abs/2312.03640v1
- Date: Wed, 6 Dec 2023 17:47:16 GMT
- ステータス: 処理完了
- システム内更新日: 2023-12-07 14:13:52.343119
- Title: Training Neural Networks on RAW and HDR Images for Restoration Tasks
- Title(参考訳): 修復作業のためのRAWおよびHDR画像に基づくニューラルネットワークの訓練
- Authors: Lei Luo, Alexandre Chapiro, Xiaoyu Xiang, Yuchen Fan, Rakesh Ranjan,
Rafal Mantiuk
- Abstract要約: 本研究は,3つの画像復元アプリケーション(デノイング,デブロアリング,シングルイメージ超解像)に対するアプローチを検証した。
その結果、ニューラルネットワークは、表示色空間で表現されるHDRおよびRAW画像において、かなりよく訓練されていることが示唆された。
トレーニング戦略へのこの小さな変更は、最大10~15dBのパフォーマンスを大幅に向上させることができます。
- 参考スコア(独自算出の注目度): 59.41340420564656
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The vast majority of standard image and video content available online is
represented in display-encoded color spaces, in which pixel values are
conveniently scaled to a limited range (0-1) and the color distribution is
approximately perceptually uniform. In contrast, both camera RAW and high
dynamic range (HDR) images are often represented in linear color spaces, in
which color values are linearly related to colorimetric quantities of light.
While training on commonly available display-encoded images is a
well-established practice, there is no consensus on how neural networks should
be trained for tasks on RAW and HDR images in linear color spaces. In this
work, we test several approaches on three popular image restoration
applications: denoising, deblurring, and single-image super-resolution. We
examine whether HDR/RAW images need to be display-encoded using popular
transfer functions (PQ, PU21, mu-law), or whether it is better to train in
linear color spaces, but use loss functions that correct for perceptual
non-uniformity. Our results indicate that neural networks train significantly
better on HDR and RAW images represented in display-encoded color spaces, which
offer better perceptual uniformity than linear spaces. This small change to the
training strategy can bring a very substantial gain in performance, up to 10-15
dB.
- Abstract(参考訳): オンラインで利用可能な標準画像やビデオコンテンツの大部分はディスプレイエンコードされた色空間で表現され、ピクセル値は限られた範囲 (0-1) に便利にスケールされ、色分布はほぼ一様である。
対照的に、カメラrawおよびハイダイナミックレンジ(hdr)画像は、しばしば直線的な色空間で表現され、色値は光の測色量と線形に関係している。
一般に利用可能なディスプレイエンコード画像のトレーニングは、確立されたプラクティスであるが、線形色空間における生およびhdr画像のタスクに対するニューラルネットワークのトレーニング方法に関するコンセンサスはない。
本研究では,3種類の画像復元アプリケーション(デノイジング,デブラリング,シングルイメージ・スーパーレゾリューション)について,いくつかのアプローチをテストした。
我々は,一般的な伝達関数(PQ,PU21,mu-law)を用いてHDR/RAW画像を表示符号化する必要があるか,線形色空間でのトレーニングが望ましいかを検討する。
以上の結果から,ニューラルネットワークは,ディスプレイエンコードされたカラー空間で表現されたhdrやraw画像上で,線形空間よりも知覚的均一性が向上することが示唆された。
トレーニング戦略へのこの小さな変更は、最大10~15dBのパフォーマンスを大幅に向上させることができます。
関連論文リスト
- You Only Need One Color Space: An Efficient Network for Low-light Image Enhancement [50.37253008333166]
低照度画像強調(LLIE)タスクは、劣化した低照度画像から詳細と視覚情報を復元する傾向がある。
水平/垂直インテンシティ(HVI)と呼ばれる新しいトレーニング可能なカラー空間を提案する。
輝度と色をRGBチャネルから切り離して、拡張中の不安定性を緩和するだけでなく、トレーニング可能なパラメータによって異なる照明範囲の低照度画像にも適応する。
論文 参考訳(メタデータ) (2024-02-08T16:47:43Z) - Self-Supervised High Dynamic Range Imaging with Multi-Exposure Images in
Dynamic Scenes [58.66427721308464]
Selfは、訓練中にダイナミックなマルチ露光画像のみを必要とする自己教師型再構成手法である。
Selfは最先端の自己管理手法に対して優れた結果を出し、教師付き手法に匹敵するパフォーマンスを実現している。
論文 参考訳(メタデータ) (2023-10-03T07:10:49Z) - Transform your Smartphone into a DSLR Camera: Learning the ISP in the
Wild [159.71025525493354]
本稿では,スマートフォンが取得したRAW画像に基づいて,DSLRの品質画像を生成する訓練可能な画像信号処理フレームワークを提案する。
トレーニング画像ペア間の色ずれに対処するために、カラー条件ISPネットワークを使用し、各入力RAWと基準DSLR画像間の新しいパラメトリック色マッピングを最適化する。
論文 参考訳(メタデータ) (2022-03-20T20:13:59Z) - Locally Weighted Mean Phase Angle (LWMPA) Based Tone Mapping Quality
Index (TMQI-3) [0.0]
本稿では,低ダイナミックレンジ(LDR)画像の品質を客観的スコアに基づいて評価するトーンマッピング品質指標(TMQI-3)を提案する。
TMQI-3は耐雑音性があり、構造と自然性を考慮し、3つの色チャネル全てを1つのコンポーネントに統合する。
論文 参考訳(メタデータ) (2021-09-17T22:17:20Z) - Learning RAW-to-sRGB Mappings with Inaccurately Aligned Supervision [76.41657124981549]
本稿では,画像アライメントとRAW-to-sRGBマッピングのための共同学習モデルを提案する。
実験の結果,本手法はZRRおよびSR-RAWデータセットの最先端に対して良好に動作することがわかった。
論文 参考訳(メタデータ) (2021-08-18T12:41:36Z) - Learning to Structure an Image with Few Colors [59.34619548026885]
そこで,カラー量子化ネットワークであるColorCNNを提案する。
1ビットのカラースペース(すなわち2色)だけで、提案されたネットワークはCIFAR10データセット上で82.1%のトップ-1の精度を達成した。
アプリケーションの場合、PNGでエンコードされた場合、提案したカラー量子化は、極低ビットレート方式の他の画像圧縮方法よりも優れていることを示す。
論文 参考訳(メタデータ) (2020-03-17T17:56:15Z) - Adaptive Dithering Using Curved Markov-Gaussian Noise in the Quantized
Domain for Mapping SDR to HDR Image [2.913398015606848]
高ダイナミックレンジ(SDR)イメージングは、レギュラーディスプレイだけでなくスマートフォンでも、リアルなコンテンツによって注目を集めている。
本稿では,量子化画像の画素で動作するノイズ生成手法を提案する。
我々は、量子化画素のルマと逆トーンマッピング関数の傾きに基づいて、雑音パターンの大きさと構造を適応的に変化させる。
論文 参考訳(メタデータ) (2020-01-20T05:30:16Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。