論文の概要: SEL-CIE: Knowledge-Guided Self-Supervised Learning Framework for CIE-XYZ Reconstruction from Non-Linear sRGB Images
- arxiv url: http://arxiv.org/abs/2405.12265v1
- Date: Mon, 20 May 2024 17:20:41 GMT
- ステータス: 処理完了
- システム内更新日: 2024-05-22 15:17:08.580355
- Title: SEL-CIE: Knowledge-Guided Self-Supervised Learning Framework for CIE-XYZ Reconstruction from Non-Linear sRGB Images
- Title(参考訳): SEL-CIE:非線形sRGB画像からのCIE-XYZ再構成のための知識誘導型自己教師付き学習フレームワーク
- Authors: Shir Barzel, Moshe Salhov, Ofir Lindenbaum, Amir Averbuch,
- Abstract要約: CIE-XYZ色空間は、カメラパイプラインの一部として使用されるデバイスに依存しない線形空間である。
画像は通常非線形状態に保存され、従来の方法でCIE-XYZカラー画像を実現することは必ずしも不可能である。
本稿では,CIE-XYZ 画像と sRGB 画像の再構成に SSL 手法を併用したフレームワークを提案する。
- 参考スコア(独自算出の注目度): 7.932206255996779
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: Modern cameras typically offer two types of image states: a minimally processed linear raw RGB image representing the raw sensor data, and a highly-processed non-linear image state, such as the sRGB state. The CIE-XYZ color space is a device-independent linear space used as part of the camera pipeline and can be helpful for computer vision tasks, such as image deblurring, dehazing, and color recognition tasks in medical applications, where color accuracy is important. However, images are usually saved in non-linear states, and achieving CIE-XYZ color images using conventional methods is not always possible. To tackle this issue, classical methodologies have been developed that focus on reversing the acquisition pipeline. More recently, supervised learning has been employed, using paired CIE-XYZ and sRGB representations of identical images. However, obtaining a large-scale dataset of CIE-XYZ and sRGB pairs can be challenging. To overcome this limitation and mitigate the reliance on large amounts of paired data, self-supervised learning (SSL) can be utilized as a substitute for relying solely on paired data. This paper proposes a framework for using SSL methods alongside paired data to reconstruct CIE-XYZ images and re-render sRGB images, outperforming existing approaches. The proposed framework is applied to the sRGB2XYZ dataset.
- Abstract(参考訳): 現代のカメラは、通常、原センサーデータを表す最小処理の線形RGB画像と、sRGB状態のような高処理の非線形画像状態の2種類の画像状態を提供する。
CIE-XYZ色空間(CIE-XYZ color space)は、カメラパイプラインの一部として使用されるデバイスに依存しない線形空間であり、医用アプリケーションにおける画像の劣化、脱毛、色認識といったコンピュータビジョンタスクに役立ち、色精度が重要である。
しかし、通常、画像は非線形状態に保存され、従来の方法でCIE-XYZ色画像を達成することは必ずしも不可能である。
この問題に対処するため、買収パイプラインの反転に焦点を当てた古典的な方法論が開発されている。
最近では、同一画像のCIE-XYZとsRGB表現を組み合わせた教師あり学習が採用されている。
しかし、CIE-XYZとsRGBペアの大規模なデータセットを得るのは難しい。
この制限を克服し、大量のペアデータへの依存を軽減するために、自己教師付き学習(SSL)を、ペアデータのみに依存する代用として利用することができる。
本稿では,CIE-XYZ 画像と sRGB 画像の再構成に SSL 手法を併用したフレームワークを提案する。
提案するフレームワークはsRGB2XYZデータセットに適用される。
関連論文リスト
- Diffusion-based RGB-D Semantic Segmentation with Deformable Attention Transformer [10.982521876026281]
本稿では,RGB-Dセマンティックセグメンテーション問題に対処する拡散型フレームワークを提案する。
本研究では,デフォルマブルアテンション変換器をエンコーダとして利用し,奥行き画像から特徴を抽出することにより,デフォルマブルアテンション変換器の特性を効果的に把握できることを実証する。
論文 参考訳(メタデータ) (2024-09-23T15:23:01Z) - A Learnable Color Correction Matrix for RAW Reconstruction [19.394856071610604]
複雑な逆画像信号処理装置(ISP)を近似する学習可能な色補正行列(CCM)を導入する。
実験結果から,本手法で生成したRAW(simRAW)画像は,より複雑な逆ISP法で生成した画像と同等の性能向上が得られた。
論文 参考訳(メタデータ) (2024-09-04T07:46:42Z) - Beyond Learned Metadata-based Raw Image Reconstruction [86.1667769209103]
生画像は、線形性や微細な量子化レベルなど、sRGB画像に対して明確な利点がある。
ストレージの要求が大きいため、一般ユーザからは広く採用されていない。
本稿では,メタデータとして,潜在空間におけるコンパクトな表現を学習する新しいフレームワークを提案する。
論文 参考訳(メタデータ) (2023-06-21T06:59:07Z) - Raw Image Reconstruction with Learned Compact Metadata [61.62454853089346]
本稿では,メタデータとしての潜在空間におけるコンパクトな表現をエンドツーエンドで学習するための新しいフレームワークを提案する。
提案する生画像圧縮方式は,グローバルな視点から重要な画像領域に適応的により多くのビットを割り当てることができることを示す。
論文 参考訳(メタデータ) (2023-02-25T05:29:45Z) - Model-Based Image Signal Processors via Learnable Dictionaries [6.766416093990318]
デジタルカメラは画像信号処理装置(ISP)を用いてRAW読み出しをRGB画像に変換する
近年のアプローチでは、RGBからRAWマッピングを推定することで、このギャップを埋めようとしている。
本稿では,学習可能かつ解釈可能なハイブリッド・モデルベースかつデータ駆動型ISPを提案する。
論文 参考訳(メタデータ) (2022-01-10T08:36:10Z) - Learning RAW-to-sRGB Mappings with Inaccurately Aligned Supervision [76.41657124981549]
本稿では,画像アライメントとRAW-to-sRGBマッピングのための共同学習モデルを提案する。
実験の結果,本手法はZRRおよびSR-RAWデータセットの最先端に対して良好に動作することがわかった。
論文 参考訳(メタデータ) (2021-08-18T12:41:36Z) - Semantic-embedded Unsupervised Spectral Reconstruction from Single RGB
Images in the Wild [48.44194221801609]
この課題に対処するため、我々は、新しい軽量でエンドツーエンドの学習ベースのフレームワークを提案する。
我々は、効率的なカメラスペクトル応答関数推定により、検索されたHS画像から入力されたRGB画像と再投影されたRGB画像の差を徐々に広げる。
提案手法は最先端の教師なし手法よりも優れており,いくつかの設定下では最新の教師付き手法よりも優れている。
論文 参考訳(メタデータ) (2021-08-15T05:19:44Z) - Self-Supervised Representation Learning for RGB-D Salient Object
Detection [93.17479956795862]
我々は、自己教師付き表現学習を用いて、クロスモーダルオートエンコーダと深さ-輪郭推定という2つのプレテキストタスクを設計する。
我々のプレテキストタスクは、ネットワークがリッチなセマンティックコンテキストをキャプチャする事前トレーニングを実行するのに、少数のRGB-Dデータセットしか必要としない。
RGB-D SODにおけるクロスモーダル核融合の固有の問題として,マルチパス核融合モジュールを提案する。
論文 参考訳(メタデータ) (2021-01-29T09:16:06Z) - CIE XYZ Net: Unprocessing Images for Low-Level Computer Vision Tasks [45.820956016608314]
現在、カメラは2つの画像状態にアクセスすることができる: (生センサデータ) または (ii) 高度に処理された非線形画像状態 (sRGB) である。
コンピュータビジョンタスクは、画像の退色や画像の退色など、線形画像の状態で最もうまく機能する。
本稿では,CIE XYZ 画像への非線形像の復号化が可能な深層学習フレームワーク CIE XYZ Net を提案する。
論文 参考訳(メタデータ) (2020-06-23T02:59:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。