論文の概要: RAWDet-7: A Multi-Scenario Benchmark for Object Detection and Description on Quantized RAW Images
- arxiv url: http://arxiv.org/abs/2602.03760v1
- Date: Tue, 03 Feb 2026 17:22:45 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-04 18:37:15.599309
- Title: RAWDet-7: A Multi-Scenario Benchmark for Object Detection and Description on Quantized RAW Images
- Title(参考訳): RAWDet-7: 量子RAW画像のオブジェクト検出と記述のためのマルチシナリオベンチマーク
- Authors: Mishal Fatima, Shashank Agnihotri, Kanchana Vaishnavi Gandikota, Michael Moeller, Margret Keuper,
- Abstract要約: RAWDet-7は25kのトレーニングと7.6kのテストRAW画像の大規模なデータセットで、様々なカメラ、照明条件、環境にまたがって収集される。
我々は、RAW画像処理と低ビット量子化によるオブジェクトレベルの情報保存の容易化を目的として、対応する高解像度sRGB画像から導出されたオブジェクトレベルの記述を提供する。
- 参考スコア(独自算出の注目度): 28.105402889173032
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Most vision models are trained on RGB images processed through ISP pipelines optimized for human perception, which can discard sensor-level information useful for machine reasoning. RAW images preserve unprocessed scene data, enabling models to leverage richer cues for both object detection and object description, capturing fine-grained details, spatial relationships, and contextual information often lost in processed images. To support research in this domain, we introduce RAWDet-7, a large-scale dataset of ~25k training and 7.6k test RAW images collected across diverse cameras, lighting conditions, and environments, densely annotated for seven object categories following MS-COCO and LVIS conventions. In addition, we provide object-level descriptions derived from the corresponding high-resolution sRGB images, facilitating the study of object-level information preservation under RAW image processing and low-bit quantization. The dataset allows evaluation under simulated 4-bit, 6-bit, and 8-bit quantization, reflecting realistic sensor constraints, and provides a benchmark for studying detection performance, description quality & detail, and generalization in low-bit RAW image processing. Dataset & code upon acceptance.
- Abstract(参考訳): ほとんどのビジョンモデルは、人間の知覚に最適化されたISPパイプラインで処理されたRGBイメージに基づいて訓練されている。
RAW画像は、未処理のシーンデータを保存し、オブジェクト検出とオブジェクト記述の両方にリッチなキューを活用できるようにし、細粒度の詳細、空間的関係、処理された画像でしばしば失われるコンテキスト情報をキャプチャする。
この領域の研究を支援するため、様々なカメラ、照明条件、環境にまたがって収集された、約25kのトレーニングと7.6kのテストRAW画像の大規模なデータセットであるRAWDet-7を導入し、MS-COCOおよびLVISの規則に従って7つの対象カテゴリに強く注釈付けした。
さらに、対応する高分解能sRGB画像から得られたオブジェクトレベル記述を提供し、RAW画像処理と低ビット量子化によるオブジェクトレベル情報保存の研究を容易にする。
このデータセットは、4ビット、6ビット、8ビットの量子化をシミュレーションし、現実的なセンサー制約を反映し、検出性能、記述品質と詳細、低ビットRAW画像処理における一般化のベンチマークを提供する。
受け入れ時のデータセットとコード。
関連論文リスト
- Beyond RGB: Adaptive Parallel Processing for RAW Object Detection [5.36869872375791]
Raw Adaptation Module (RAM)は、従来の画像信号処理(ISP)を置き換えるために設計されたモジュールである。
提案手法はRGBに基づく手法より優れており,様々なRAW画像データセットにまたがって最先端の結果が得られる。
論文 参考訳(メタデータ) (2025-03-17T13:36:49Z) - SimROD: A Simple Baseline for Raw Object Detection with Global and Local Enhancements [8.83849713449091]
RAWオブジェクト検出のための軽量かつ効果的なアプローチであるSimRODを提案する。
学習可能なグローバルガンマ変換を4つのパラメータで適用可能なグローバルガンマ拡張(GGE)モジュールを提案する。
我々の研究は、現実世界の物体検出のためのRAWデータの可能性を強調している。
論文 参考訳(メタデータ) (2025-03-10T09:23:14Z) - Towards RAW Object Detection in Diverse Conditions [65.30190654593842]
62のカテゴリにまたがる135,601のアノテーション付きインスタンスを備えた7,785の高分解能実RAW画像を提供するAODRawデータセットを紹介した。
sRGB と RAW の領域ギャップにより RAW オブジェクト検出の可能性は sRGB と RAW との事前学習によって制限されることがわかった。
我々は,RAW事前学習を支援するために,SRGBドメインで事前学習した市販のモデルから知識を抽出する。
論文 参考訳(メタデータ) (2024-11-24T01:23:04Z) - RAW-Diffusion: RGB-Guided Diffusion Models for High-Fidelity RAW Image Generation [4.625376287612609]
RGB画像でガイドされたRAW画像を生成するための新しい拡散法を提案する。
このアプローチは高忠実度RAW画像を生成し、カメラ固有のRAWデータセットの作成を可能にする。
提案手法を拡張してBDD100K-RAWとCityscapes-RAWデータセットを作成し,RAW画像におけるオブジェクト検出の有効性を明らかにする。
論文 参考訳(メタデータ) (2024-11-20T09:40:12Z) - Unveiling Hidden Details: A RAW Data-Enhanced Paradigm for Real-World Super-Resolution [56.98910228239627]
リアル・ワールド・イメージ・スーパーレゾリューション(Real SR)は、低解像度(LR)画像から高忠実でディテールに富んだ高解像度(HR)画像を生成することを目的としている。
既存のReal SRメソッドは主にLR RGBドメインから詳細を生成することに重点を置いており、しばしば細部における豊かさや忠実さの欠如につながっている。
RAWデータに隠された詳細を用いて既存のRGBのみの手法を補完し、優れた出力を得る。
論文 参考訳(メタデータ) (2024-11-16T13:29:50Z) - Raw Image Reconstruction with Learned Compact Metadata [61.62454853089346]
本稿では,メタデータとしての潜在空間におけるコンパクトな表現をエンドツーエンドで学習するための新しいフレームワークを提案する。
提案する生画像圧縮方式は,グローバルな視点から重要な画像領域に適応的により多くのビットを割り当てることができることを示す。
論文 参考訳(メタデータ) (2023-02-25T05:29:45Z) - Reversed Image Signal Processing and RAW Reconstruction. AIM 2022
Challenge Report [109.2135194765743]
本稿では,AIM 2022 Challenge on Reversed Image Signal Processing and RAW Reconstructionを紹介する。
我々は,メタデータを使わずにRGBから生のセンサイメージを回収し,ISP変換を「逆」することを目的としている。
論文 参考訳(メタデータ) (2022-10-20T10:43:53Z) - Towards Low Light Enhancement with RAW Images [101.35754364753409]
我々は、低光強度でRAW画像を使用することの優位性について、最初のベンチマークを行う。
本研究では,RAW画像の特性を計測可能な因子に分解するFEM(Facterized Enhancement Model)を新たに開発した。
実アプリケーションにおけるRAW画像の利点と利用不可のトレードオフを生かしたREENet(RAW-guiding Exposure Enhancement Network)を開発した。
論文 参考訳(メタデータ) (2021-12-28T07:27:51Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。