論文の概要: SimROD: A Simple Baseline for Raw Object Detection with Global and Local Enhancements
- arxiv url: http://arxiv.org/abs/2503.07101v2
- Date: Thu, 27 Mar 2025 08:58:54 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-03-28 12:49:00.491221
- Title: SimROD: A Simple Baseline for Raw Object Detection with Global and Local Enhancements
- Title(参考訳): SimROD: グローバルおよびローカル拡張による生オブジェクト検出のためのシンプルなベースライン
- Authors: Haiyang Xie, Xi Shen, Shihua Huang, Qirui Wang, Zheng Wang,
- Abstract要約: RAWオブジェクト検出のための軽量かつ効果的なアプローチであるSimRODを提案する。
学習可能なグローバルガンマ変換を4つのパラメータで適用可能なグローバルガンマ拡張(GGE)モジュールを提案する。
我々の研究は、現実世界の物体検出のためのRAWデータの可能性を強調している。
- 参考スコア(独自算出の注目度): 8.83849713449091
- License:
- Abstract: Most visual models are designed for sRGB images, yet RAW data offers significant advantages for object detection by preserving sensor information before ISP processing. This enables improved detection accuracy and more efficient hardware designs by bypassing the ISP. However, RAW object detection is challenging due to limited training data, unbalanced pixel distributions, and sensor noise. To address this, we propose SimROD, a lightweight and effective approach for RAW object detection. We introduce a Global Gamma Enhancement (GGE) module, which applies a learnable global gamma transformation with only four parameters, improving feature representation while keeping the model efficient. Additionally, we leverage the green channel's richer signal to enhance local details, aligning with the human eye's sensitivity and Bayer filter design. Extensive experiments on multiple RAW object detection datasets and detectors demonstrate that SimROD outperforms state-of-the-art methods like RAW-Adapter and DIAP while maintaining efficiency. Our work highlights the potential of RAW data for real-world object detection. Code is available at https://ocean146.github.io/SimROD2025/.
- Abstract(参考訳): ほとんどのビジュアルモデルは sRGB 画像用に設計されているが、RAW データは ISP 処理前にセンサ情報を保存することでオブジェクト検出に大きな利点をもたらす。
これにより、ISPをバイパスすることで、検出精度の向上とハードウェア設計の効率化が可能になる。
しかし、RAWオブジェクト検出は、限られたトレーニングデータ、不均衡画素分布、センサノイズのために困難である。
そこで本研究では,RAWオブジェクト検出のための軽量かつ効率的なアプローチであるSimRODを提案する。
GGE(Global Gamma Enhancement)モジュールを導入し、学習可能なグローバルガンマ変換を4つのパラメータで適用し、モデルを効率よく保ちながら特徴表現を改善した。
さらに、グリーンチャネルのリッチな信号を利用して、人間の目の感度やベイザーフィルタの設計と整合して、局部的な詳細性を高める。
複数のRAWオブジェクト検出データセットと検出器に関する大規模な実験は、SimRODが効率を保ちながらRAW-AdapterやDIAPのような最先端の手法より優れていることを示した。
我々の研究は、現実世界の物体検出のためのRAWデータの可能性を強調している。
コードはhttps://ocean146.github.io/SimROD2025/で公開されている。
関連論文リスト
- Towards RAW Object Detection in Diverse Conditions [65.30190654593842]
62のカテゴリにまたがる135,601のアノテーション付きインスタンスを備えた7,785の高分解能実RAW画像を提供するAODRawデータセットを紹介した。
sRGB と RAW の領域ギャップにより RAW オブジェクト検出の可能性は sRGB と RAW との事前学習によって制限されることがわかった。
我々は,RAW事前学習を支援するために,SRGBドメインで事前学習した市販のモデルから知識を抽出する。
論文 参考訳(メタデータ) (2024-11-24T01:23:04Z) - RAW-Diffusion: RGB-Guided Diffusion Models for High-Fidelity RAW Image Generation [4.625376287612609]
RGB画像でガイドされたRAW画像を生成するための新しい拡散法を提案する。
このアプローチは高忠実度RAW画像を生成し、カメラ固有のRAWデータセットの作成を可能にする。
提案手法を拡張してBDD100K-RAWとCityscapes-RAWデータセットを作成し,RAW画像におけるオブジェクト検出の有効性を明らかにする。
論文 参考訳(メタデータ) (2024-11-20T09:40:12Z) - Unveiling Hidden Details: A RAW Data-Enhanced Paradigm for Real-World Super-Resolution [56.98910228239627]
リアル・ワールド・イメージ・スーパーレゾリューション(Real SR)は、低解像度(LR)画像から高忠実でディテールに富んだ高解像度(HR)画像を生成することを目的としている。
既存のReal SRメソッドは主にLR RGBドメインから詳細を生成することに重点を置いており、しばしば細部における豊かさや忠実さの欠如につながっている。
RAWデータに隠された詳細を用いて既存のRGBのみの手法を補完し、優れた出力を得る。
論文 参考訳(メタデータ) (2024-11-16T13:29:50Z) - Enhanced Automotive Object Detection via RGB-D Fusion in a DiffusionDet Framework [0.0]
視覚に基づく自律走行には、信頼性と効率的な物体検出が必要である。
本研究では、単眼カメラと深度センサからのデータ融合を利用してRGBと深度(RGB-D)データを提供するDiffusionDetベースのフレームワークを提案する。
RGB画像のテクスチャ特徴と色特徴とLiDARセンサの空間深度情報を統合することにより,自動車目標の物体検出を大幅に強化する特徴融合が提案されている。
論文 参考訳(メタデータ) (2024-06-05T10:24:00Z) - SIRST-5K: Exploring Massive Negatives Synthesis with Self-supervised
Learning for Robust Infrared Small Target Detection [53.19618419772467]
単一フレーム赤外線小ターゲット検出(SIRST)は、乱雑な背景から小さなターゲットを認識することを目的としている。
Transformerの開発に伴い、SIRSTモデルのスケールは常に増大している。
赤外線小ターゲットデータの多彩な多様性により,本アルゴリズムはモデル性能と収束速度を大幅に改善する。
論文 参考訳(メタデータ) (2024-03-08T16:14:54Z) - BSRAW: Improving Blind RAW Image Super-Resolution [63.408484584265985]
RAW領域におけるブラインド画像の超解像化に取り組む。
生センサデータを用いたトレーニングモデルに特化した,現実的な劣化パイプラインを設計する。
私たちのパイプラインでトレーニングしたBSRAWモデルは、リアルタイムRAW画像をスケールアップし、品質を向上させることができます。
論文 参考訳(メタデータ) (2023-12-24T14:17:28Z) - Innovative Horizons in Aerial Imagery: LSKNet Meets DiffusionDet for
Advanced Object Detection [55.2480439325792]
本稿では,LSKNetのバックボーンをDiffusionDetヘッドに統合したオブジェクト検出モデルの詳細な評価を行う。
提案手法は平均精度(MAP)を約45.7%向上させる。
この進歩は、提案された修正の有効性を強調し、航空画像解析の新しいベンチマークを設定する。
論文 参考訳(メタデータ) (2023-11-21T19:49:13Z) - Reversed Image Signal Processing and RAW Reconstruction. AIM 2022
Challenge Report [109.2135194765743]
本稿では,AIM 2022 Challenge on Reversed Image Signal Processing and RAW Reconstructionを紹介する。
我々は,メタデータを使わずにRGBから生のセンサイメージを回収し,ISP変換を「逆」することを目的としている。
論文 参考訳(メタデータ) (2022-10-20T10:43:53Z) - GenISP: Neural ISP for Low-Light Machine Cognition [19.444297600977546]
低照度環境では、原画像データを用いた物体検出器は、ISPパイプラインで処理された画像データを用いた検出器よりも堅牢である。
我々は、デバイスに依存しないカラー空間にカラー空間変換を明示的に組み込んだ、マシン認知のための最小限のニューラルISPパイプラインGenISPを提案する。
論文 参考訳(メタデータ) (2022-05-07T17:17:24Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。