論文の概要: CIE XYZ Net: Unprocessing Images for Low-Level Computer Vision Tasks
- arxiv url: http://arxiv.org/abs/2006.12709v1
- Date: Tue, 23 Jun 2020 02:59:11 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-17 23:37:12.778565
- Title: CIE XYZ Net: Unprocessing Images for Low-Level Computer Vision Tasks
- Title(参考訳): CIE XYZ Net:低レベルコンピュータビジョンタスクのための非処理イメージ
- Authors: Mahmoud Afifi, Abdelrahman Abdelhamed, Abdullah Abuolaim, Abhijith
Punnappurath, and Michael S. Brown
- Abstract要約: 現在、カメラは2つの画像状態にアクセスすることができる: (生センサデータ) または (ii) 高度に処理された非線形画像状態 (sRGB) である。
コンピュータビジョンタスクは、画像の退色や画像の退色など、線形画像の状態で最もうまく機能する。
本稿では,CIE XYZ 画像への非線形像の復号化が可能な深層学習フレームワーク CIE XYZ Net を提案する。
- 参考スコア(独自算出の注目度): 45.820956016608314
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Cameras currently allow access to two image states: (i) a minimally processed
linear raw-RGB image state (i.e., raw sensor data) or (ii) a highly-processed
nonlinear image state (e.g., sRGB). There are many computer vision tasks that
work best with a linear image state, such as image deblurring and image
dehazing. Unfortunately, the vast majority of images are saved in the nonlinear
image state. Because of this, a number of methods have been proposed to
"unprocess" nonlinear images back to a raw-RGB state. However, existing
unprocessing methods have a drawback because raw-RGB images are
sensor-specific. As a result, it is necessary to know which camera produced the
sRGB output and use a method or network tailored for that sensor to properly
unprocess it. This paper addresses this limitation by exploiting another camera
image state that is not available as an output, but it is available inside the
camera pipeline. In particular, cameras apply a colorimetric conversion step to
convert the raw-RGB image to a device-independent space based on the CIE XYZ
color space before they apply the nonlinear photo-finishing. Leveraging this
canonical image state, we propose a deep learning framework, CIE XYZ Net, that
can unprocess a nonlinear image back to the canonical CIE XYZ image. This image
can then be processed by any low-level computer vision operator and re-rendered
back to the nonlinear image. We demonstrate the usefulness of the CIE XYZ Net
on several low-level vision tasks and show significant gains that can be
obtained by this processing framework. Code and dataset are publicly available
at https://github.com/mahmoudnafifi/CIE_XYZ_NET.
- Abstract(参考訳): 現在、カメラは2つの画像状態にアクセスすることができる。
(i)最小処理線形生rgb画像状態(すなわち、生センサデータ)又は
(ii)高度に処理された非線形画像状態(sRGBなど)。
画像デブラリングや画像デハジングなど、線形画像状態が最もうまく機能するコンピュータビジョンタスクは数多く存在する。
残念なことに、ほとんどの画像は非線形画像状態に保存される。
このため、非線形画像を生のRGB状態に"アンプロセス"する方法がいくつか提案されている。
しかし、RGB画像はセンサ固有のため、既存のアンプロセッシング手法には欠点がある。
その結果、どのカメラがsRGB出力を生成したのかを把握し、そのセンサに適した方法やネットワークを用いて適切にアン処理する必要がある。
本稿では、出力として使用できない別のカメライメージ状態を利用して、この制限に対処するが、カメラパイプライン内で利用可能である。
特に、カメラは、非線形フォトフィニッシュを施す前に、CIE XYZ色空間に基づいて、原RGB画像をデバイス非依存空間に変換するためのカラー変換ステップを適用する。
この標準画像状態を活用することで,CIE XYZ 画像への非線形像の復号化が可能な深層学習フレームワーク CIE XYZ Net を提案する。
この画像は低レベルのコンピュータビジョン演算子によって処理され、非線形画像に再レンダリングされる。
我々は,CIE XYZ Netの低レベル視覚タスクにおける有用性を実証し,この処理フレームワークで得られる顕著な利得を示す。
コードとデータセットはhttps://github.com/mahmoudnafifi/cie_xyz_netで公開されている。
関連論文リスト
- BSRAW: Improving Blind RAW Image Super-Resolution [63.408484584265985]
RAW領域におけるブラインド画像の超解像化に取り組む。
生センサデータを用いたトレーニングモデルに特化した,現実的な劣化パイプラインを設計する。
私たちのパイプラインでトレーニングしたBSRAWモデルは、リアルタイムRAW画像をスケールアップし、品質を向上させることができます。
論文 参考訳(メタデータ) (2023-12-24T14:17:28Z) - Training Neural Networks on RAW and HDR Images for Restoration Tasks [59.41340420564656]
本研究は,3つの画像復元アプリケーション(デノイング,デブロアリング,シングルイメージ超解像)に対するアプローチを検証した。
その結果、ニューラルネットワークは、表示色空間で表現されるHDRおよびRAW画像において、かなりよく訓練されていることが示唆された。
トレーニング戦略へのこの小さな変更は、最大10~15dBのパフォーマンスを大幅に向上させることができます。
論文 参考訳(メタデータ) (2023-12-06T17:47:16Z) - Self-Supervised Reversed Image Signal Processing via Reference-Guided
Dynamic Parameter Selection [1.1602089225841632]
メタデータとペア画像を必要としない自己教師付き逆ISP方式を提案する。
提案手法は,RGB画像を参照RAW画像と同じセンサで同一環境で撮影されたRAWライクな画像に変換する。
提案手法は,他の最先端教師付き手法に匹敵する精度で,様々な逆ISPを学習可能であることを示す。
論文 参考訳(メタデータ) (2023-03-24T11:12:05Z) - Efficient Visual Computing with Camera RAW Snapshots [41.9863557302409]
従来のカメラはセンサ上の画像光を捕捉し、画像信号プロセッサ(ISP)を用いてRGB画像に変換する。
RAW画像にはキャプチャされた全ての情報が含まれているため、ISPを用いたRAWからRGBへの変換はビジュアルコンピューティングには必要ないと論じることができる。
RAW画像を用いた高レベルセマンティック理解と低レベル圧縮を実現するための新しい$rho$-Visionフレームワークを提案する。
論文 参考訳(メタデータ) (2022-12-15T12:54:21Z) - Reversed Image Signal Processing and RAW Reconstruction. AIM 2022
Challenge Report [109.2135194765743]
本稿では,AIM 2022 Challenge on Reversed Image Signal Processing and RAW Reconstructionを紹介する。
我々は,メタデータを使わずにRGBから生のセンサイメージを回収し,ISP変換を「逆」することを目的としている。
論文 参考訳(メタデータ) (2022-10-20T10:43:53Z) - Learning sRGB-to-Raw-RGB De-rendering with Content-Aware Metadata [46.28281823015191]
我々は,サンプリングと再構築を共同で学習することで,デレンダリングの結果を改善する方法を示す。
実験の結果,既存の手法よりも画像内容に適応し,生の再現性を向上できることがわかった。
論文 参考訳(メタデータ) (2022-06-03T20:43:17Z) - Learning RAW-to-sRGB Mappings with Inaccurately Aligned Supervision [76.41657124981549]
本稿では,画像アライメントとRAW-to-sRGBマッピングのための共同学習モデルを提案する。
実験の結果,本手法はZRRおよびSR-RAWデータセットの最先端に対して良好に動作することがわかった。
論文 参考訳(メタデータ) (2021-08-18T12:41:36Z) - Semantic-embedded Unsupervised Spectral Reconstruction from Single RGB
Images in the Wild [48.44194221801609]
この課題に対処するため、我々は、新しい軽量でエンドツーエンドの学習ベースのフレームワークを提案する。
我々は、効率的なカメラスペクトル応答関数推定により、検索されたHS画像から入力されたRGB画像と再投影されたRGB画像の差を徐々に広げる。
提案手法は最先端の教師なし手法よりも優れており,いくつかの設定下では最新の教師付き手法よりも優れている。
論文 参考訳(メタデータ) (2021-08-15T05:19:44Z) - Invertible Image Signal Processing [42.109752151834456]
InvISP(Invertible Image Signal Processing)パイプラインにより、視覚的に魅力的なsRGBイメージをレンダリングできます。
メモリのオーバーヘッドなしにsrgb画像から生データを合成する代わりに、リアルな生データを再構築できる。
論文 参考訳(メタデータ) (2021-03-28T06:30:15Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。