論文の概要: Navigating in the Dark: A Multimodal Framework and Dataset for Nighttime Traffic Sign Recognition
- arxiv url: http://arxiv.org/abs/2511.17183v1
- Date: Fri, 21 Nov 2025 12:04:53 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-24 18:08:19.003658
- Title: Navigating in the Dark: A Multimodal Framework and Dataset for Nighttime Traffic Sign Recognition
- Title(参考訳): 暗闇の中をナビゲートする - 夜間交通信号認識のためのマルチモーダルフレームワークとデータセット
- Authors: Aditya Mishra, Akshay Agarwal, Haroon Lone,
- Abstract要約: INTSDは、インドの様々な地域で収集された交通標識の街路レベルの夜間画像の大規模なデータセットである。
共同照明の補正と信号の局所化のための適応画像強調検出器を組み込んだLENS-Netを提案する。
本手法は既存のフレームワークを超越し,その重要な構成要素の有効性を検証した。
- 参考スコア(独自算出の注目度): 9.151417330446591
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Traffic signboards are vital for road safety and intelligent transportation systems, enabling navigation and autonomous driving. Yet, recognizing traffic signs at night remains challenging due to visual noise and scarcity of public nighttime datasets. Despite advances in vision architectures, existing methods struggle with robustness under low illumination and fail to leverage complementary mutlimodal cues effectively. To overcome these limitations, firstly, we introduce INTSD, a large-scale dataset comprising street-level night-time images of traffic signboards collected across diverse regions of India. The dataset spans 41 traffic signboard classes captured under varying lighting and weather conditions, providing a comprehensive benchmark for both detection and classification tasks. To benchmark INTSD for night-time sign recognition, we conduct extensive evaluations using state-of-the-art detection and classification models. Secondly, we propose LENS-Net, which integrates an adaptive image enhancement detector for joint illumination correction and sign localization, followed by a structured multimodal CLIP-GCNN classifier that leverages cross-modal attention and graph-based reasoning for robust and semantically consistent recognition. Our method surpasses existing frameworks, with ablation studies confirming the effectiveness of its key components. The dataset and code for LENS-Net is publicly available for research.
- Abstract(参考訳): 交通標識は道路の安全とインテリジェントな交通システムにとって不可欠であり、ナビゲーションと自動運転を可能にしている。
しかし、夜間の交通信号の認識は、公共の夜間データセットの視覚的ノイズと不足のため、依然として困難である。
視覚アーキテクチャの進歩にもかかわらず、既存の手法は低照度下で頑丈さに苦慮し、相補的な変異の手がかりを効果的に活用できない。
これらの制限を克服するために、まずインド各地の交通標識の街路レベルの夜間画像からなる大規模なデータセットINTSDを導入する。
データセットは、様々な照明と気象条件下でキャプチャされた41のトラフィックサインボードクラスにまたがっており、検出と分類の両方のタスクの包括的なベンチマークを提供する。
夜間符号認識のためのINTSDのベンチマークを行うために,最先端検出モデルと分類モデルを用いて広範囲な評価を行う。
次に,LENS-Netを提案する。このLENS-Netは,共同照明の補正と信号の局所化のための適応画像強調検出器と,多モードのCLIP-GCNN分類器と,頑健で意味論的に一貫した認識のためのグラフベースの推論を併用した構造化多モードCLIP-GCNN分類器である。
本手法は既存のフレームワークを超越し,その重要な構成要素の有効性を検証した。
LENS-Netのデータセットとコードは、研究のために公開されている。
関連論文リスト
- The ATLAS of Traffic Lights: A Reliable Perception Framework for Autonomous Driving [9.932968493913357]
本稿では,最先端検出モデルと新たなリアルタイムアソシエーションと意思決定フレームワークを統合したモジュール化された認識フレームワークを提案する。
我々は、交通信号状態とピクトグラムの包括的なアノテーションを提供するATLASデータセットを紹介した。
我々は、ATLAS上のいくつかの最先端の信号検出アーキテクチャを訓練し、評価し、精度とロバスト性の両方において顕著な性能向上を示す。
論文 参考訳(メタデータ) (2025-04-28T12:15:42Z) - Detection of Anomalous Vehicular Traffic and Sensor Failures Using Data Clustering Techniques [0.0]
本研究では,高速道路センサからの交通流データの解析にクラスタリング手法を用いる。
複数のクラスタリング手法、すなわちパーティショニングと階層的手法を、様々な時系列表現と類似度尺度と組み合わせて検討する。
本手法は高速道路センサのリアルタイムデータに適用し,異なるクラスタリングフレームワークが交通パターン認識に与える影響を評価する。
論文 参考訳(メタデータ) (2025-04-01T15:09:39Z) - Salient Object Detection in Traffic Scene through the TSOD10K Dataset [22.615252113004402]
Traffic Salient Object Detection (TSOD) は、セマンティック(衝突リスクなど)と視覚的サリエンスを組み合わせることで、安全を運転する上で重要なオブジェクトを分割することを目的としている。
本研究は,インテリジェントトランスポートシステムにおける安全対応型サリエンシ分析の基盤を初めて確立するものである。
論文 参考訳(メタデータ) (2025-03-21T07:21:24Z) - Towards Intelligent Transportation with Pedestrians and Vehicles In-the-Loop: A Surveillance Video-Assisted Federated Digital Twin Framework [62.47416496137193]
本稿では,歩行者や車いすによるITSを支援するための監視ビデオ支援型デジタルツイン(SV-FDT)フレームワークを提案する。
i)複数のソースからトラフィック監視ビデオを収集するエンドレイヤ、(ii)セマンティックセグメンテーションに基づく視覚理解、ツインエージェントベースのインタラクションモデリング、およびローカルデジタルツインシステム(LDTS)をローカルで作成するエッジレイヤ、(iii)異なるリージョンにわたるLDTSを統合してグローバルDTモデルをリアルタイムで構築するクラウドレイヤの3層で構成されている。
論文 参考訳(メタデータ) (2025-03-06T07:36:06Z) - Interaction Dataset of Autonomous Vehicles with Traffic Lights and Signs [11.127555705122283]
本稿では,自動走行車(AV)と交通制御装置,特に信号機と停止標識の相互作用を総合的に把握するデータセットの開発について述べる。
我々の研究は、AVがこれらの交通制御装置をどのようにナビゲートするかの実際の軌跡データを提供することによって、既存の文献における重要なギャップに対処する。
本研究では,交通信号を用いた37,000以上のインスタンスと,停止標識を用いた44,000のインスタンスを組み込んで,関連する対話軌跡データをMotionデータセットから同定し抽出する手法を提案する。
論文 参考訳(メタデータ) (2025-01-21T22:59:50Z) - Homography Guided Temporal Fusion for Road Line and Marking Segmentation [73.47092021519245]
道路線やマーキングは、移動車両、影、グレアの存在下でしばしば閉鎖される。
本稿では,映像フレームを補足的に利用するHomography Guided Fusion (HomoFusion) モジュールを提案する。
カメラ固有のデータと地上平面の仮定をクロスフレーム対応に利用することにより,高速・高精度性能が向上した軽量ネットワークの実現が期待できることを示す。
論文 参考訳(メタデータ) (2024-04-11T10:26:40Z) - Elastic Interaction Energy-Informed Real-Time Traffic Scene Perception [8.429178814528617]
EIEGSegという名前のトポロジ対応エネルギー損失関数に基づくネットワークトレーニング戦略を提案する。
EIEGSegは、リアルタイムの交通シーン認識におけるマルチクラスセグメンテーションのために設計されている。
以上の結果から,EIEGSegは,特にリアルタイム軽量ネットワークにおいて,性能を継続的に向上することを示す。
論文 参考訳(メタデータ) (2023-10-02T01:30:42Z) - OpenLane-V2: A Topology Reasoning Benchmark for Unified 3D HD Mapping [84.65114565766596]
交通シーン構造を考慮したトポロジ推論のための最初のデータセットであるOpenLane-V2を提案する。
OpenLane-V2は2000のアノテートされた道路シーンで構成され、交通要素と車線との関係を記述している。
様々な最先端手法を評価し,OpenLane-V2の定量的,定性的な結果を示し,交通現場におけるトポロジ推論の今後の道筋を示す。
論文 参考訳(メタデータ) (2023-04-20T16:31:22Z) - Correlating sparse sensing for large-scale traffic speed estimation: A
Laplacian-enhanced low-rank tensor kriging approach [76.45949280328838]
本稿では,Laplacian enhanced Low-rank tensor (LETC) フレームワークを提案する。
次に,提案したモデルをネットワークワイド・クリグにスケールアップするために,複数の有効な数値手法を用いて効率的な解アルゴリズムを設計する。
論文 参考訳(メタデータ) (2022-10-21T07:25:57Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。