Fugu-MT 論文翻訳(概要): Training Neural Networks on RAW and HDR Images for Restoration Tasks

論文の概要: Training Neural Networks on RAW and HDR Images for Restoration Tasks

arxiv url: http://arxiv.org/abs/2312.03640v2
Date: Fri, 21 Mar 2025 10:23:16 GMT
ステータス: 翻訳完了
システム内更新日: 2025-03-24 15:40:09.59252
Title: Training Neural Networks on RAW and HDR Images for Restoration Tasks
Title（参考訳）: 修復作業のためのRAWおよびHDR画像に基づくニューラルネットワークの訓練
Authors: Andrew Yanzhe Ke, Lei Luo, Alexandre Chapiro, Xiaoyu Xiang, Yuchen Fan, Rakesh Ranjan, Rafal Mantiuk,
Abstract要約: 線形色空間におけるRAWおよびHDR画像のタスクに対して、ニューラルネットワークをどのようにトレーニングするかを検討する。その結果、ニューラルネットワークは色空間で表現されるHDRおよびRAW画像において、かなりよく訓練されていることが示唆された。トレーニング戦略へのこの小さな変更は、2から9dBの間で、非常に大きなパフォーマンス向上をもたらします。
参考スコア（独自算出の注目度）: 54.24020587899901
License: http://creativecommons.org/licenses/by/4.0/
Abstract: The vast majority of standard image and video content available online is represented in display-encoded color spaces, in which pixel values are conveniently scaled to a limited range (0-1) and the color distribution is approximately perceptually uniform. In contrast, both camera RAW and high dynamic range (HDR) images are often represented in linear color spaces, in which color values are linearly related to colorimetric quantities of light. While training on commonly available display-encoded images is a well-established practice, there is no consensus on how neural networks should be trained for tasks on RAW and HDR images in linear color spaces. In this work, we test several approaches on three popular image restoration applications: denoising, deblurring, and single-image super-resolution. We examine whether HDR/RAW images need to be display-encoded using popular transfer functions (PQ, PU21, and mu-law), or whether it is better to train in linear color spaces, but use loss functions that correct for perceptual non-uniformity. Our results indicate that neural networks train significantly better on HDR and RAW images represented in display-encoded color spaces, which offer better perceptual uniformity than linear spaces. This small change to the training strategy can bring a very substantial gain in performance, between 2 and 9 dB.
Abstract（参考訳）: オンラインで利用可能な標準画像やビデオコンテンツの大部分は、表示符号化された色空間で表現されており、画素値は、都合よく範囲(0-1)にスケールされ、色分布は概ね知覚的に均一である。対照的に、カメラRAWと高ダイナミックレンジ(HDR)画像は、色値が色量量に線形に関係している線色空間でしばしば表現される。一般的な表示符号化画像のトレーニングは確立された慣行であるが、線形色空間におけるRAWおよびHDRイメージのタスクに対して、ニューラルネットワークをどのようにトレーニングすべきかについては合意がない。そこで本研究では,3つの画像復元アプリケーション(デノイング,デブロアリング,シングルイメージ超解像)について,いくつかのアプローチを検証した。我々は,一般的な伝達関数(PQ,PU21,mu-law)を用いてHDR/RAW画像を表示符号化する必要があるか,線形色空間でのトレーニングが望ましいかを検討するが,知覚的非均一性に対して正しい損失関数を用いる。その結果、ニューラルネットワークは、表示符号化された色空間で表現されるHDRやRAW画像のトレーニングに優れており、線形空間よりも知覚の均一性が高いことが示唆された。トレーニング戦略へのこの小さな変更は、2から9dBの間で、非常に大きなパフォーマンス向上をもたらします。

関連論文リスト

X2HDR: HDR Image Generation in a Perceptually Uniform Space [37.83280929526874]
高ダイナミックレンジフォーマットとディスプレイはますます普及しているが、最先端の画像生成装置は低ダイナミックレンジ(LDR)出力に限定されている。既存の事前学習拡散モデルでは,スクラッチから再学習することなく,HDR生成に容易に適応できることを示す。
論文参考訳（メタデータ） (2026-02-04T17:59:51Z)
Log NeRF: Comparing Spaces for Learning Radiance Fields [0.6542188603141654]
ニューラル・ラジアンス・フィールド(NeRF)は、新しいビュー合成において顕著な成果を上げている。 BiIlluminant Dichromatic Reflection (BIDR)モデルにインスパイアされた我々は、対数RGB空間によりNeRFはよりコンパクトで効果的なシーン外観表現を学習できるという仮説を立てた。我々は様々な色空間解釈の下でNeRFモデルを訓練し、各ネットワーク出力をレンダリングとロス計算の前に共通色空間に変換し、異なる色空間での表現学習を強制した。
論文参考訳（メタデータ） (2025-12-10T07:12:33Z)
You Only Need One Color Space: An Efficient Network for Low-light Image Enhancement [50.37253008333166]
低照度画像強調(LLIE)タスクは、劣化した低照度画像から詳細と視覚情報を復元する傾向がある。水平/垂直インテンシティ(HVI)と呼ばれる新しいトレーニング可能なカラー空間を提案する。輝度と色をRGBチャネルから切り離して、拡張中の不安定性を緩和するだけでなく、トレーニング可能なパラメータによって異なる照明範囲の低照度画像にも適応する。
論文参考訳（メタデータ） (2024-02-08T16:47:43Z)
Self-Supervised High Dynamic Range Imaging with Multi-Exposure Images in Dynamic Scenes [58.66427721308464]
Selfは、訓練中にダイナミックなマルチ露光画像のみを必要とする自己教師型再構成手法である。 Selfは最先端の自己管理手法に対して優れた結果を出し、教師付き手法に匹敵するパフォーマンスを実現している。
論文参考訳（メタデータ） (2023-10-03T07:10:49Z)
Transform your Smartphone into a DSLR Camera: Learning the ISP in the Wild [159.71025525493354]
本稿では,スマートフォンが取得したRAW画像に基づいて,DSLRの品質画像を生成する訓練可能な画像信号処理フレームワークを提案する。トレーニング画像ペア間の色ずれに対処するために、カラー条件ISPネットワークを使用し、各入力RAWと基準DSLR画像間の新しいパラメトリック色マッピングを最適化する。
論文参考訳（メタデータ） (2022-03-20T20:13:59Z)
Astronomical Image Colorization and upscaling with Generative Adversarial Networks [0.0]
本研究の目的は、非常に特定の画像領域、すなわち天文学的な画像に焦点をあてることにより、この問題に自動的アプローチを提供することである。我々は、RGBとL*a*bという2つの異なる色空間における様々なモデルの使用について検討する。このモデルは、画像に存在しない高解像度で色付けされたデータを幻覚させる視覚的に魅力的な画像を生成する。
論文参考訳（メタデータ） (2021-12-27T19:01:20Z)
Locally Weighted Mean Phase Angle (LWMPA) Based Tone Mapping Quality Index (TMQI-3) [0.0]
本稿では,低ダイナミックレンジ(LDR)画像の品質を客観的スコアに基づいて評価するトーンマッピング品質指標(TMQI-3)を提案する。 TMQI-3は耐雑音性があり、構造と自然性を考慮し、3つの色チャネル全てを1つのコンポーネントに統合する。
論文参考訳（メタデータ） (2021-09-17T22:17:20Z)
Learning RAW-to-sRGB Mappings with Inaccurately Aligned Supervision [76.41657124981549]
本稿では,画像アライメントとRAW-to-sRGBマッピングのための共同学習モデルを提案する。実験の結果,本手法はZRRおよびSR-RAWデータセットの最先端に対して良好に動作することがわかった。
論文参考訳（メタデータ） (2021-08-18T12:41:36Z)
Learning to Structure an Image with Few Colors [59.34619548026885]
そこで,カラー量子化ネットワークであるColorCNNを提案する。 1ビットのカラースペース(すなわち2色)だけで、提案されたネットワークはCIFAR10データセット上で82.1%のトップ-1の精度を達成した。アプリケーションの場合、PNGでエンコードされた場合、提案したカラー量子化は、極低ビットレート方式の他の画像圧縮方法よりも優れていることを示す。
論文参考訳（メタデータ） (2020-03-17T17:56:15Z)
Adaptive Dithering Using Curved Markov-Gaussian Noise in the Quantized Domain for Mapping SDR to HDR Image [2.913398015606848]
高ダイナミックレンジ(SDR)イメージングは、レギュラーディスプレイだけでなくスマートフォンでも、リアルなコンテンツによって注目を集めている。本稿では,量子化画像の画素で動作するノイズ生成手法を提案する。我々は、量子化画素のルマと逆トーンマッピング関数の傾きに基づいて、雑音パターンの大きさと構造を適応的に変化させる。
論文参考訳（メタデータ） (2020-01-20T05:30:16Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。