論文の概要: RAWild: Sensor-Agnostic RAW Object Detection via Physics-Guided Curve and Grid Modeling
- arxiv url: http://arxiv.org/abs/2605.05941v1
- Date: Thu, 07 May 2026 09:51:47 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-08 22:27:11.674098
- Title: RAWild: Sensor-Agnostic RAW Object Detection via Physics-Guided Curve and Grid Modeling
- Title(参考訳): RAWild:物理誘導曲線と格子モデリングによるセンサ非依存のRAW物体検出
- Authors: Shuhong Liu, Gengjia Chang, Jun Liu, Xuangeng Chu, Yinqiang Zheng, Tatsuya Harada, Ziteng Cui,
- Abstract要約: textbfRAWildは、センサに依存しないRAWオブジェクト検出のための物理誘導型グローバルローカルトーンマッピングフレームワークである。
我々は、様々なスペクトル感度、照度、センサ非理想性にまたがるリアルなセンサ出力を合成する物理ベースのRAWシミュレーションパイプラインを構築した。
- 参考スコア(独自算出の注目度): 69.96407948879015
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Camera sensor RAW data offers intrinsic advantages for object detection, including deeper bit depth, preserved physical information, and freedom from image signal processor (ISP) distortions. However, varying exposure conditions, spectral sensitivities, and bit depths across devices introduce substantially larger domain gaps than sRGB, making sensor-agnostic generalization a fundamental challenge. In this study, we present \textbf{RAWild}, a physics-guided global-local tone mapping framework for sensor-agnostic RAW object detection. By factoring sensor-induced variations into a global tonal correction and a spatially adaptive local color adjustment, both driven by RAW distribution priors, our framework enables a single network to train jointly across heterogeneous sensors. To further support cross-sensor generalization, we construct a physics-based RAW simulation pipeline that synthesizes realistic sensor outputs spanning diverse spectral sensitivities, illuminants, and sensor non-idealities. Extensive experiments across multiple RAW benchmarks covering bit depths from 10 to 24 demonstrate state-of-the-art (SOTA) performance under single-dataset, mixed-dataset, and challenging robustness settings.
- Abstract(参考訳): カメラセンサRAWデータは、深部ビット深度、保存された物理情報、画像信号プロセッサ(ISP)歪みからの解放など、オブジェクト検出に固有の利点を提供する。
しかし、様々な露光条件、スペクトル感度、デバイス間のビット深度は、sRGBよりもはるかに大きなドメインギャップをもたらし、センサ非依存の一般化が根本的な課題となる。
本研究では,センサに依存しないRAWオブジェクト検出のための物理誘導グローバル局所トーンマッピングフレームワークであるtextbf{RAWild}を提案する。
センサによる変化を大域的な音色補正と空間適応的な局所色調整に分解することで、RAWの分布に先立って駆動されるこの枠組みにより、単一ネットワークが異種センサを共同で訓練することが可能となる。
我々は、クロスセンサの一般化をさらに支援するために、様々なスペクトル感度、照度、センサ非イデアルにまたがるリアルなセンサ出力を合成する物理ベースのRAWシミュレーションパイプラインを構築した。
ビット深度を10から24までカバーする複数のRAWベンチマークに対する大規模な実験は、単一データセット、混合データセット、頑健性の設定下でのSOTA(State-of-the-art)のパフォーマンスを示している。
関連論文リスト
- Leveraging Multispectral Sensors for Color Correction in Mobile Cameras [22.93423876118074]
スナップショットマルチスペクトル(MS)イメージングの最近の進歩は、小型で低コストな分光センサを消費者やモバイルデバイス向けに実現している。
エンド・ツー・エンドの色補正を行う統合学習ベースのフレームワークを提案する。
提案手法は,RGBのみのベースラインやMS駆動ベースラインと比較して,誤差を最大50%低減する。
論文 参考訳(メタデータ) (2025-12-09T10:14:13Z) - IrisNet: Infrared Image Status Awareness Meta Decoder for Infrared Small Targets Detection [92.56025546608699]
IrisNetは、入力赤外線画像ステータスに検出戦略を適用する、新しいメタ学習フレームワークである。
提案手法は,赤外線画像特徴量とデコーダパラメータ全体の動的マッピングを確立する。
NUDT-SIRST、NUAA-SIRST、IRSTD-1Kデータセットの実験は、我々のIrisNetの優位性を示している。
論文 参考訳(メタデータ) (2025-11-25T13:53:54Z) - SenseShift6D: Multimodal RGB-D Benchmarking for Robust 6D Pose Estimation across Environment and Sensor Variations [4.664989082015336]
SenseShift6Dは、13のRGB露光、9のRGBゲイン、自動露光、4つのディープキャプチャモード、5つの照明レベルを物理的に掃除する最初のデータセットである。
5つの一般的な家庭用オブジェクトに対して、166.4k RGBと16.7kの深度画像を取得する。
我々のデータセット上での最先端モデルによる実験により、テスト時にマルチモーダルセンサ制御を適用すると、かなりの性能向上が得られます。
論文 参考訳(メタデータ) (2025-07-08T07:54:07Z) - SimROD: A Simple Baseline for Raw Object Detection with Global and Local Enhancements [8.83849713449091]
RAWオブジェクト検出のための軽量かつ効果的なアプローチであるSimRODを提案する。
学習可能なグローバルガンマ変換を4つのパラメータで適用可能なグローバルガンマ拡張(GGE)モジュールを提案する。
我々の研究は、現実世界の物体検出のためのRAWデータの可能性を強調している。
論文 参考訳(メタデータ) (2025-03-10T09:23:14Z) - MSSIDD: A Benchmark for Multi-Sensor Denoising [55.41612200877861]
我々は,マルチセンサSIDDデータセットという新しいベンチマークを導入する。これは,認知モデルのセンサ伝達性を評価するために設計された,最初の生ドメインデータセットである。
そこで本研究では,センサに不変な特徴を認知モデルで学習することのできるセンサ一貫性トレーニングフレームワークを提案する。
論文 参考訳(メタデータ) (2024-11-18T13:32:59Z) - Multi-Modal Neural Radiance Field for Monocular Dense SLAM with a
Light-Weight ToF Sensor [58.305341034419136]
単眼カメラと軽量ToFセンサを備えた初の高密度SLAMシステムを提案する。
本稿では,RGBカメラと軽量ToFセンサの両方の信号のレンダリングをサポートするマルチモーダル暗黙のシーン表現を提案する。
実験により,本システムは軽量なToFセンサの信号をうまく利用し,競合的な結果が得られることが示された。
論文 参考訳(メタデータ) (2023-08-28T07:56:13Z) - Reversed Image Signal Processing and RAW Reconstruction. AIM 2022
Challenge Report [109.2135194765743]
本稿では,AIM 2022 Challenge on Reversed Image Signal Processing and RAW Reconstructionを紹介する。
我々は,メタデータを使わずにRGBから生のセンサイメージを回収し,ISP変換を「逆」することを目的としている。
論文 参考訳(メタデータ) (2022-10-20T10:43:53Z) - GenISP: Neural ISP for Low-Light Machine Cognition [19.444297600977546]
低照度環境では、原画像データを用いた物体検出器は、ISPパイプラインで処理された画像データを用いた検出器よりも堅牢である。
我々は、デバイスに依存しないカラー空間にカラー空間変換を明示的に組み込んだ、マシン認知のための最小限のニューラルISPパイプラインGenISPを提案する。
論文 参考訳(メタデータ) (2022-05-07T17:17:24Z) - Learning Enriched Illuminants for Cross and Single Sensor Color
Constancy [182.4997117953705]
ネットワークをトレーニングするためのクロスセンサ自己教師型トレーニングを提案する。
センサに依存しない方法で人工発光体をランダムにサンプリングすることでネットワークを訓練する。
実験により、我々のクロスセンサモデルとシングルセンサーモデルは、他の最先端手法よりも大きなマージンで優れていることが示された。
論文 参考訳(メタデータ) (2022-03-21T15:45:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。