論文の概要: Beyond RGB: Adaptive Parallel Processing for RAW Object Detection
- arxiv url: http://arxiv.org/abs/2503.13163v1
- Date: Mon, 17 Mar 2025 13:36:49 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-03-18 12:30:11.257187
- Title: Beyond RGB: Adaptive Parallel Processing for RAW Object Detection
- Title(参考訳): RGBを超える: RAWオブジェクト検出のための適応並列処理
- Authors: Shani Gamrian, Hila Barel, Feiran Li, Masakazu Yoshimura, Daisuke Iso,
- Abstract要約: Raw Adaptation Module (RAM)は、従来の画像信号処理(ISP)を置き換えるために設計されたモジュールである。
提案手法はRGBに基づく手法より優れており,様々なRAW画像データセットにまたがって最先端の結果が得られる。
- 参考スコア(独自算出の注目度): 5.36869872375791
- License:
- Abstract: Object detection models are typically applied to standard RGB images processed through Image Signal Processing (ISP) pipelines, which are designed to enhance sensor-captured RAW images for human vision. However, these ISP functions can lead to a loss of critical information that may be essential in optimizing for computer vision tasks, such as object detection. In this work, we introduce Raw Adaptation Module (RAM), a module designed to replace the traditional ISP, with parameters optimized specifically for RAW object detection. Inspired by the parallel processing mechanisms of the human visual system, RAM departs from existing learned ISP methods by applying multiple ISP functions in parallel rather than sequentially, allowing for a more comprehensive capture of image features. These processed representations are then fused in a specialized module, which dynamically integrates and optimizes the information for the target task. This novel approach not only leverages the full potential of RAW sensor data but also enables task-specific pre-processing, resulting in superior object detection performance. Our approach outperforms RGB-based methods and achieves state-of-the-art results across diverse RAW image datasets under varying lighting conditions and dynamic ranges.
- Abstract(参考訳): オブジェクト検出モデルは一般的に、イメージ信号処理(ISP)パイプラインを通して処理される標準RGB画像に適用される。
しかし、これらのISP関数は、オブジェクト検出などのコンピュータビジョンタスクの最適化に不可欠な重要な情報が失われる可能性がある。
本稿では,従来のISPを置き換えるために設計されたモジュールであるRaw Adaptation Module (RAM)について紹介する。
人間の視覚システムの並列処理機構にインスパイアされたRAMは、複数のISP関数を逐次ではなく並列に適用することで、既存の学習ISPメソッドから離れ、画像機能のより包括的なキャプチャを可能にする。
これらの処理された表現は特殊なモジュールに融合され、ターゲットタスクに関する情報を動的に統合し、最適化する。
この手法はRAWセンサデータの潜在能力を最大限に活用するだけでなく、タスク固有の事前処理を可能にし、オブジェクト検出性能が向上する。
提案手法はRGBに基づく手法より優れており,照明条件やダイナミックレンジの異なるRAW画像データセットにまたがって最新の結果が得られる。
関連論文リスト
- RAW-Diffusion: RGB-Guided Diffusion Models for High-Fidelity RAW Image Generation [4.625376287612609]
RGB画像でガイドされたRAW画像を生成するための新しい拡散法を提案する。
このアプローチは高忠実度RAW画像を生成し、カメラ固有のRAWデータセットの作成を可能にする。
提案手法を拡張してBDD100K-RAWとCityscapes-RAWデータセットを作成し,RAW画像におけるオブジェクト検出の有効性を明らかにする。
論文 参考訳(メタデータ) (2024-11-20T09:40:12Z) - RAWMamba: Unified sRGB-to-RAW De-rendering With State Space Model [52.250939617273744]
本稿では, sRGB-to-RAWデレンダリングのための統一フレームワークであるRAWMambaを提案する。
RAWMambaのコアはUnified Metadata Embedding (UME)モジュールである。
Local Tone-Aware Mambaモジュールは、メタデータの効果的なグローバルな伝搬を可能にするために、長距離依存関係をキャプチャする。
論文 参考訳(メタデータ) (2024-11-18T16:45:44Z) - A Learnable Color Correction Matrix for RAW Reconstruction [19.394856071610604]
複雑な逆画像信号処理装置(ISP)を近似する学習可能な色補正行列(CCM)を導入する。
実験結果から,本手法で生成したRAW(simRAW)画像は,より複雑な逆ISP法で生成した画像と同等の性能向上が得られた。
論文 参考訳(メタデータ) (2024-09-04T07:46:42Z) - RAW-Adapter: Adapting Pre-trained Visual Model to Camera RAW Images [51.68432586065828]
本稿では,カメラRAWデータへのsRGB事前学習モデルの適用を目的とした新しいアプローチであるRAW-Adapterを紹介する。
Raw-Adapterは、学習可能なISPステージを使用してRAW入力を調整する入力レベルアダプタと、ISPステージとその後の高レベルネットワーク間の接続を構築するモデルレベルアダプタで構成されている。
論文 参考訳(メタデータ) (2024-08-27T06:14:54Z) - Beyond Learned Metadata-based Raw Image Reconstruction [86.1667769209103]
生画像は、線形性や微細な量子化レベルなど、sRGB画像に対して明確な利点がある。
ストレージの要求が大きいため、一般ユーザからは広く採用されていない。
本稿では,メタデータとして,潜在空間におけるコンパクトな表現を学習する新しいフレームワークを提案する。
論文 参考訳(メタデータ) (2023-06-21T06:59:07Z) - Self-Supervised Reversed Image Signal Processing via Reference-Guided
Dynamic Parameter Selection [1.1602089225841632]
メタデータとペア画像を必要としない自己教師付き逆ISP方式を提案する。
提案手法は,RGB画像を参照RAW画像と同じセンサで同一環境で撮影されたRAWライクな画像に変換する。
提案手法は,他の最先端教師付き手法に匹敵する精度で,様々な逆ISPを学習可能であることを示す。
論文 参考訳(メタデータ) (2023-03-24T11:12:05Z) - Raw Image Reconstruction with Learned Compact Metadata [61.62454853089346]
本稿では,メタデータとしての潜在空間におけるコンパクトな表現をエンドツーエンドで学習するための新しいフレームワークを提案する。
提案する生画像圧縮方式は,グローバルな視点から重要な画像領域に適応的により多くのビットを割り当てることができることを示す。
論文 参考訳(メタデータ) (2023-02-25T05:29:45Z) - Efficient Visual Computing with Camera RAW Snapshots [41.9863557302409]
従来のカメラはセンサ上の画像光を捕捉し、画像信号プロセッサ(ISP)を用いてRGB画像に変換する。
RAW画像にはキャプチャされた全ての情報が含まれているため、ISPを用いたRAWからRGBへの変換はビジュアルコンピューティングには必要ないと論じることができる。
RAW画像を用いた高レベルセマンティック理解と低レベル圧縮を実現するための新しい$rho$-Visionフレームワークを提案する。
論文 参考訳(メタデータ) (2022-12-15T12:54:21Z) - Reversed Image Signal Processing and RAW Reconstruction. AIM 2022
Challenge Report [109.2135194765743]
本稿では,AIM 2022 Challenge on Reversed Image Signal Processing and RAW Reconstructionを紹介する。
我々は,メタデータを使わずにRGBから生のセンサイメージを回収し,ISP変換を「逆」することを目的としている。
論文 参考訳(メタデータ) (2022-10-20T10:43:53Z) - Model-Based Image Signal Processors via Learnable Dictionaries [6.766416093990318]
デジタルカメラは画像信号処理装置(ISP)を用いてRAW読み出しをRGB画像に変換する
近年のアプローチでは、RGBからRAWマッピングを推定することで、このギャップを埋めようとしている。
本稿では,学習可能かつ解釈可能なハイブリッド・モデルベースかつデータ駆動型ISPを提案する。
論文 参考訳(メタデータ) (2022-01-10T08:36:10Z) - Towards Low Light Enhancement with RAW Images [101.35754364753409]
我々は、低光強度でRAW画像を使用することの優位性について、最初のベンチマークを行う。
本研究では,RAW画像の特性を計測可能な因子に分解するFEM(Facterized Enhancement Model)を新たに開発した。
実アプリケーションにおけるRAW画像の利点と利用不可のトレードオフを生かしたREENet(RAW-guiding Exposure Enhancement Network)を開発した。
論文 参考訳(メタデータ) (2021-12-28T07:27:51Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。