論文の概要: CIE XYZ Net: Unprocessing Images for Low-Level Computer Vision Tasks
- arxiv url: http://arxiv.org/abs/2006.12709v1
- Date: Tue, 23 Jun 2020 02:59:11 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-17 23:37:12.778565
- Title: CIE XYZ Net: Unprocessing Images for Low-Level Computer Vision Tasks
- Title(参考訳): CIE XYZ Net:低レベルコンピュータビジョンタスクのための非処理イメージ
- Authors: Mahmoud Afifi, Abdelrahman Abdelhamed, Abdullah Abuolaim, Abhijith
Punnappurath, and Michael S. Brown
- Abstract要約: 現在、カメラは2つの画像状態にアクセスすることができる: (生センサデータ) または (ii) 高度に処理された非線形画像状態 (sRGB) である。
コンピュータビジョンタスクは、画像の退色や画像の退色など、線形画像の状態で最もうまく機能する。
本稿では,CIE XYZ 画像への非線形像の復号化が可能な深層学習フレームワーク CIE XYZ Net を提案する。
- 参考スコア(独自算出の注目度): 45.820956016608314
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Cameras currently allow access to two image states: (i) a minimally processed
linear raw-RGB image state (i.e., raw sensor data) or (ii) a highly-processed
nonlinear image state (e.g., sRGB). There are many computer vision tasks that
work best with a linear image state, such as image deblurring and image
dehazing. Unfortunately, the vast majority of images are saved in the nonlinear
image state. Because of this, a number of methods have been proposed to
"unprocess" nonlinear images back to a raw-RGB state. However, existing
unprocessing methods have a drawback because raw-RGB images are
sensor-specific. As a result, it is necessary to know which camera produced the
sRGB output and use a method or network tailored for that sensor to properly
unprocess it. This paper addresses this limitation by exploiting another camera
image state that is not available as an output, but it is available inside the
camera pipeline. In particular, cameras apply a colorimetric conversion step to
convert the raw-RGB image to a device-independent space based on the CIE XYZ
color space before they apply the nonlinear photo-finishing. Leveraging this
canonical image state, we propose a deep learning framework, CIE XYZ Net, that
can unprocess a nonlinear image back to the canonical CIE XYZ image. This image
can then be processed by any low-level computer vision operator and re-rendered
back to the nonlinear image. We demonstrate the usefulness of the CIE XYZ Net
on several low-level vision tasks and show significant gains that can be
obtained by this processing framework. Code and dataset are publicly available
at https://github.com/mahmoudnafifi/CIE_XYZ_NET.
- Abstract(参考訳): 現在、カメラは2つの画像状態にアクセスすることができる。
(i)最小処理線形生rgb画像状態(すなわち、生センサデータ)又は
(ii)高度に処理された非線形画像状態(sRGBなど)。
画像デブラリングや画像デハジングなど、線形画像状態が最もうまく機能するコンピュータビジョンタスクは数多く存在する。
残念なことに、ほとんどの画像は非線形画像状態に保存される。
このため、非線形画像を生のRGB状態に"アンプロセス"する方法がいくつか提案されている。
しかし、RGB画像はセンサ固有のため、既存のアンプロセッシング手法には欠点がある。
その結果、どのカメラがsRGB出力を生成したのかを把握し、そのセンサに適した方法やネットワークを用いて適切にアン処理する必要がある。
本稿では、出力として使用できない別のカメライメージ状態を利用して、この制限に対処するが、カメラパイプライン内で利用可能である。
特に、カメラは、非線形フォトフィニッシュを施す前に、CIE XYZ色空間に基づいて、原RGB画像をデバイス非依存空間に変換するためのカラー変換ステップを適用する。
この標準画像状態を活用することで,CIE XYZ 画像への非線形像の復号化が可能な深層学習フレームワーク CIE XYZ Net を提案する。
この画像は低レベルのコンピュータビジョン演算子によって処理され、非線形画像に再レンダリングされる。
我々は,CIE XYZ Netの低レベル視覚タスクにおける有用性を実証し,この処理フレームワークで得られる顕著な利得を示す。
コードとデータセットはhttps://github.com/mahmoudnafifi/cie_xyz_netで公開されている。
関連論文リスト
- Toward Efficient Deep Blind RAW Image Restoration [56.41827271721955]
我々は、深部ブラインドRAW復元モデルをトレーニングするための、新しい現実的な劣化パイプラインを設計する。
私たちのパイプラインでは、リアルなセンサーノイズ、動きのぼかし、カメラの揺れ、その他の一般的な劣化について検討しています。
パイプラインと複数のセンサーのデータで訓練されたモデルは、ノイズとぼやけをうまく低減し、異なるカメラから撮影されたRAW画像の細部を復元する。
論文 参考訳(メタデータ) (2024-09-26T18:34:37Z) - SEL-CIE: Knowledge-Guided Self-Supervised Learning Framework for CIE-XYZ Reconstruction from Non-Linear sRGB Images [7.932206255996779]
CIE-XYZ色空間は、カメラパイプラインの一部として使用されるデバイスに依存しない線形空間である。
画像は通常非線形状態に保存され、従来の方法でCIE-XYZカラー画像を実現することは必ずしも不可能である。
本稿では,CIE-XYZ 画像と sRGB 画像の再構成に SSL 手法を併用したフレームワークを提案する。
論文 参考訳(メタデータ) (2024-05-20T17:20:41Z) - Simple Image Signal Processing using Global Context Guidance [56.41827271721955]
ディープラーニングベースのISPは、深層ニューラルネットワークを使用してRAW画像をDSLRライクなRGBイメージに変換することを目指している。
我々は,全RAW画像からグローバルなコンテキスト情報をキャプチャするために,任意のニューラルISPに統合可能な新しいモジュールを提案する。
本モデルでは,多種多様な実スマートフォン画像を用いて,様々なベンチマークで最新の結果が得られる。
論文 参考訳(メタデータ) (2024-04-17T17:11:47Z) - BSRAW: Improving Blind RAW Image Super-Resolution [63.408484584265985]
RAW領域におけるブラインド画像の超解像化に取り組む。
生センサデータを用いたトレーニングモデルに特化した,現実的な劣化パイプラインを設計する。
私たちのパイプラインでトレーニングしたBSRAWモデルは、リアルタイムRAW画像をスケールアップし、品質を向上させることができます。
論文 参考訳(メタデータ) (2023-12-24T14:17:28Z) - Self-Supervised Reversed Image Signal Processing via Reference-Guided
Dynamic Parameter Selection [1.1602089225841632]
メタデータとペア画像を必要としない自己教師付き逆ISP方式を提案する。
提案手法は,RGB画像を参照RAW画像と同じセンサで同一環境で撮影されたRAWライクな画像に変換する。
提案手法は,他の最先端教師付き手法に匹敵する精度で,様々な逆ISPを学習可能であることを示す。
論文 参考訳(メタデータ) (2023-03-24T11:12:05Z) - Efficient Visual Computing with Camera RAW Snapshots [41.9863557302409]
従来のカメラはセンサ上の画像光を捕捉し、画像信号プロセッサ(ISP)を用いてRGB画像に変換する。
RAW画像にはキャプチャされた全ての情報が含まれているため、ISPを用いたRAWからRGBへの変換はビジュアルコンピューティングには必要ないと論じることができる。
RAW画像を用いた高レベルセマンティック理解と低レベル圧縮を実現するための新しい$rho$-Visionフレームワークを提案する。
論文 参考訳(メタデータ) (2022-12-15T12:54:21Z) - Reversed Image Signal Processing and RAW Reconstruction. AIM 2022
Challenge Report [109.2135194765743]
本稿では,AIM 2022 Challenge on Reversed Image Signal Processing and RAW Reconstructionを紹介する。
我々は,メタデータを使わずにRGBから生のセンサイメージを回収し,ISP変換を「逆」することを目的としている。
論文 参考訳(メタデータ) (2022-10-20T10:43:53Z) - Learning RAW-to-sRGB Mappings with Inaccurately Aligned Supervision [76.41657124981549]
本稿では,画像アライメントとRAW-to-sRGBマッピングのための共同学習モデルを提案する。
実験の結果,本手法はZRRおよびSR-RAWデータセットの最先端に対して良好に動作することがわかった。
論文 参考訳(メタデータ) (2021-08-18T12:41:36Z) - Invertible Image Signal Processing [42.109752151834456]
InvISP(Invertible Image Signal Processing)パイプラインにより、視覚的に魅力的なsRGBイメージをレンダリングできます。
メモリのオーバーヘッドなしにsrgb画像から生データを合成する代わりに、リアルな生データを再構築できる。
論文 参考訳(メタデータ) (2021-03-28T06:30:15Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。