論文の概要: Towards All-Day Perception for Off-Road Driving: A Large-Scale Multispectral Dataset and Comprehensive Benchmark
- arxiv url: http://arxiv.org/abs/2604.27499v1
- Date: Thu, 30 Apr 2026 06:50:25 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-01 16:31:53.962786
- Title: Towards All-Day Perception for Off-Road Driving: A Large-Scale Multispectral Dataset and Comprehensive Benchmark
- Title(参考訳): オフロード運転における全日知覚に向けて:大規模マルチスペクトルデータセットと総合ベンチマーク
- Authors: Shuo Wang, Jilin Mei, Wenfei Guan, Shuai Wang, Yan Xing, Chen Min, Yu Hu,
- Abstract要約: IRONは、オールデイ条件下での時間的自由空間検出のための最初の大規模な赤外線データセットである。
IRONetは時間的自由空間検出のための新しいフローフリーフレームワークである。
- 参考スコア(独自算出の注目度): 14.038383477789603
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Off-road nighttime autonomous driving suffers from unreliable visible-light perception, making infrared modality crucial for accurate freespace detection. However, progress remains limited due to the scarcity of annotated infrared off-road datasets and the inter-frame inconsistencies inherent to current single-frame methods. To address these gaps, we present the IRON dataset, which, to our knowledge, is the first large-scale infrared dataset for off-road temporal freespace detection under all-day conditions, with strong support for nighttime perception. The dataset comprises 24,314 densely annotated infrared images with synchronized RGB images in diverse scenes and different light conditions. Building upon this dataset, we propose IRONet, a novel flow-free framework for temporal freespace detection that addresses inter-frame inconsistencies by aggregating historical context via a memory-attention mechanism and a carefully designed mask decoder. On our IRON dataset, IRONet achieves state-of-the-art performance, reaching 82.93%(+1.19%) IoU and 90.66%(+0.71%) F1 score at real-time inference. Remarkably, IRONet also exhibits robust generalization to RGB modalities on ORFD and Rellis datasets. Overall, our work establishes a foundation for reliable all-day off-road autonomous driving and future research in infrared temporal perception. The code and IRON dataset are available at https://github.com/wsnbws/IRON.
- Abstract(参考訳): オフロード夜間の自律走行は、信頼性の低い可視光知覚に悩まされ、正確な自由空間検出には赤外線モダリティが不可欠である。
しかし、アノテートされた赤外線オフロードデータセットの不足と、現在の単一フレームメソッドに固有のフレーム間の不整合のため、進歩は依然として限られている。
これらのギャップに対処するため、我々の知る限り、IRONデータセットは、夜間の知覚を強く支援し、オフロード時空検出のための最初の大規模赤外線データセットである。
データセットは、24,314個の濃密に注釈付けされた赤外線画像と、多様なシーンと異なる光条件で同期されたRGB画像からなる。
このデータセットに基づいてIRONetを提案する。これは時間的自由空間検出のための新しいフローフリーフレームワークで、メモリアテンション機構と慎重に設計されたマスクデコーダを介して過去のコンテキストを集約することでフレーム間不整合に対処する。
我々のIRONデータセットで、IRONetは最先端のパフォーマンスを達成し、82.93%(+1.19%)のIoUと90.66%(+0.71%)のF1スコアをリアルタイム推論で達成した。
注目すべきことに、IRONetはORFDとRellisデータセット上でRGBモダリティを堅牢に一般化している。
全体として、我々の研究は、信頼できる全日オフロード自動運転と、赤外線時間知覚における将来の研究の基礎を確立している。
コードとIRONデータセットはhttps://github.com/wsnbws/IRONで公開されている。
関連論文リスト
- Decoupling Amplitude and Phase Attention in Frequency Domain for RGB-Event based Visual Object Tracking [51.31378940976401]
既存のRGB-Eventトラッキングアプローチでは、イベントカメラのユニークな利点を完全に活用できない。
本稿では,周波数領域の早期融合を実現する新しい追跡フレームワークを提案する。
FE108, FELT, COESOTなど, 広く使用されている3つのRGB-Event追跡ベンチマークデータセットの実験により, 提案手法の性能と効率を実証した。
論文 参考訳(メタデータ) (2026-01-03T01:10:17Z) - IrisNet: Infrared Image Status Awareness Meta Decoder for Infrared Small Targets Detection [92.56025546608699]
IrisNetは、入力赤外線画像ステータスに検出戦略を適用する、新しいメタ学習フレームワークである。
提案手法は,赤外線画像特徴量とデコーダパラメータ全体の動的マッピングを確立する。
NUDT-SIRST、NUAA-SIRST、IRSTD-1Kデータセットの実験は、我々のIrisNetの優位性を示している。
論文 参考訳(メタデータ) (2025-11-25T13:53:54Z) - RASMD: RGB And SWIR Multispectral Driving Dataset for Robust Perception in Adverse Conditions [0.3141085922386211]
短波長赤外線(SWIR)イメージングは、NIRとLWIRに対していくつかの利点がある。
現在の自律走行アルゴリズムは可視光スペクトルに大きく依存しており、悪条件下での性能劣化を招きやすい。
RGB と SWIR のマルチスペクトル駆動データセットを導入し,RGB-SWIR 画像ペアの同期化と空間整合化を実現した。
論文 参考訳(メタデータ) (2025-04-10T09:54:57Z) - NIR-Assisted Image Denoising: A Selective Fusion Approach and A Real-World Benchmark Dataset [53.79524776100983]
近赤外(NIR)画像を活用して、視認可能なRGB画像の復調を支援することで、この問題に対処する可能性を示している。
既存の作品では、NIR情報を効果的に活用して現実のイメージを飾ることに苦戦している。
先進デノナイジングネットワークにプラグイン・アンド・プレイ可能な効率的な選択核融合モジュール(SFM)を提案する。
論文 参考訳(メタデータ) (2024-04-12T14:54:26Z) - Caltech Aerial RGB-Thermal Dataset in the Wild [14.699908177967181]
本稿では,自然環境下での航空ロボットのためのRGB熱水モデルについて紹介する。
私たちのデータセットは、川、湖、海岸線、砂漠、森林など、米国中のさまざまな地形を捉えています。
自然設定でよく見られる10のクラスに対してセマンティックセグメンテーションアノテーションを提供する。
論文 参考訳(メタデータ) (2024-03-13T23:31:04Z) - Chasing Day and Night: Towards Robust and Efficient All-Day Object Detection Guided by an Event Camera [8.673063170884591]
EOLOは、RGBとイベントモダリティの両方を融合させることで、堅牢で効率的な全日検出を実現する、新しいオブジェクト検出フレームワークである。
我々のEOLOフレームワークは、イベントの非同期特性を効率的に活用するために、軽量スパイキングニューラルネットワーク(SNN)に基づいて構築されている。
論文 参考訳(メタデータ) (2023-09-17T15:14:01Z) - Drone-based RGB-Infrared Cross-Modality Vehicle Detection via
Uncertainty-Aware Learning [59.19469551774703]
ドローンによる車両検出は、空中画像中の車両の位置とカテゴリーを見つけることを目的としている。
我々はDroneVehicleと呼ばれる大規模ドローンベースのRGB赤外線車両検出データセットを構築した。
私たちのDroneVehicleは28,439RGBの赤外線画像を収集し、都市道路、住宅地、駐車場、その他のシナリオを昼から夜までカバーしています。
論文 参考訳(メタデータ) (2020-03-05T05:29:44Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。