論文の概要: Traffic Sign Recognition in Autonomous Driving: Dataset, Benchmark, and Field Experiment
- arxiv url: http://arxiv.org/abs/2603.23034v1
- Date: Tue, 24 Mar 2026 10:11:27 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-25 19:53:37.427773
- Title: Traffic Sign Recognition in Autonomous Driving: Dataset, Benchmark, and Field Experiment
- Title(参考訳): 自動運転における交通信号認識:データセット,ベンチマーク,フィールド実験
- Authors: Guoyang Zhao, Weiqing Qi, Kai Zhang, Chenguang Zhang, Zeying Gong, Zhihai Bi, Kai Chen, Benshan Ma, Ming Liu, Jun Ma,
- Abstract要約: 交通信号認識(TSR)は、自動運転における中核的な認識能力である。
本稿では,大規模かつグローバルなトラフィックサインデータセットTS-1Mを提案する。
3つの代表的な学習パラダイムにまたがって統一されたベンチマークを実施します。
- 参考スコア(独自算出の注目度): 15.782194207723975
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Traffic Sign Recognition (TSR) is a core perception capability for autonomous driving, where robustness to cross-region variation, long-tailed categories, and semantic ambiguity is essential for reliable real-world deployment. Despite steady progress in recognition accuracy, existing traffic sign datasets and benchmarks offer limited diagnostic insight into how different modeling paradigms behave under these practical challenges. We present TS-1M, a large-scale and globally diverse traffic sign dataset comprising over one million real-world images across 454 standardized categories, together with a diagnostic benchmark designed to analyze model capability boundaries. Beyond standard train-test evaluation, we provide a suite of challenge-oriented settings, including cross-region recognition, rare-class identification, low-clarity robustness, and semantic text understanding, enabling systematic and fine-grained assessment of modern TSR models. Using TS-1M, we conduct a unified benchmark across three representative learning paradigms: classical supervised models, self-supervised pretrained models, and multimodal vision-language models (VLMs). Our analysis reveals consistent paradigm-dependent behaviors, showing that semantic alignment is a key factor for cross-region generalization and rare-category recognition, while purely visual models remain sensitive to appearance shift and data imbalance. Finally, we validate the practical relevance of TS-1M through real-scene autonomous driving experiments, where traffic sign recognition is integrated with semantic reasoning and spatial localization to support map-level decision constraints. Overall, TS-1M establishes a reference-level diagnostic benchmark for TSR and provides principled insights into robust and semantic-aware traffic sign perception. Project page: https://guoyangzhao.github.io/projects/ts1m.
- Abstract(参考訳): 交通信号認識(Traffic Sign Recognition, TSR)は、自律運転における中核的な認識能力である。
認識精度は着実に向上しているが、既存のトラフィックサインデータセットとベンチマークは、これらの実践的な課題の下で異なるモデリングパラダイムがどのように振る舞うかについて、限られた診断洞察を提供する。
TS-1Mは,454の標準化カテゴリにまたがる100万以上の実世界の画像からなる大規模かつ多種多様なトラフィックサインデータセットであり,モデル能力境界を解析するための診断ベンチマークである。
標準列車試験の評価以外にも、クロスリージョン認識、レアクラス識別、低明度頑健性、意味的テキスト理解など、最新のTSRモデルの体系的かつきめ細かな評価を可能にする、課題指向の一連の設定を提供する。
TS-1Mを用いて、古典的教師付きモデル、自己教師付き事前学習モデル、マルチモーダル視覚言語モデル(VLM)の3つの代表的な学習パラダイムの統一ベンチマークを行う。
分析の結果, セマンティックアライメントは地域横断の一般化と希少なカテゴリー認識の鍵となる要因であり, 外観変化やデータの不均衡に対して純粋に視覚モデルが敏感であることが判明した。
最後に,交通標識認識と意味論的推論と空間的位置決めを統合し,マップレベルの決定制約をサポートする実環境自律運転実験を通じて,TS-1Mの実用的妥当性を検証する。
全体としてTS-1Mは、TSRの基準レベル診断ベンチマークを確立し、ロバストでセマンティックなトラフィックサインの認識に関する原則的な洞察を提供する。
プロジェクトページ: https://guoyangzhao.github.io/projects/ts1m。
関連論文リスト
- VISAT: Benchmarking Adversarial and Distribution Shift Robustness in Traffic Sign Recognition with Visual Attributes [18.89029074477177]
本稿では,視覚的属性のある交通標識認識タスクにおいて,モデルロバスト性を評価するための新しいオープンデータセットとベンチマークスイートを提案する。
当社のデータセットでは,敵攻撃と分散シフトに対する堅牢性をそれぞれ強調する2つのベンチマークを導入している。
本研究では,ResNet-152 と ViT-B/32 の2つの主要なバックボーンに着目し,ベースモデルと MTL モデルの比較を行った。
論文 参考訳(メタデータ) (2025-10-29T18:31:21Z) - Contrastive Learning-Driven Traffic Sign Perception: Multi-Modal Fusion of Text and Vision [2.0720154517628417]
オープン語彙検出とクロスモーダル学習を組み合わせた新しいフレームワークを提案する。
交通信号検出のために,NanoVerse YOLOモデルは視覚言語パス集約ネットワーク(RepVL-PAN)とSPD-Convモジュールを統合している。
交通標識分類のための交通信号認識マルチモーダルコントラスト学習モデル(TSR-MCL)を設計した。
TT100Kデータセットでは,全クラス認識のためのロングテール検出タスクにおいて,最先端の78.4%mAPを実現する。
論文 参考訳(メタデータ) (2025-07-31T08:23:30Z) - Cross-domain Multi-step Thinking: Zero-shot Fine-grained Traffic Sign Recognition in the Wild [49.20086587208214]
クロスドメイン マルチステップシンキング (CdMT) は、野生におけるゼロショットきめ細かなトラフィックサイン認識(TSR)の性能を改善することを提案した。
CdMTはトレーニングデータとは独立であり、単純で均一な命令のみを必要とするため、クロスカントリーのTSRを実現することができる。
フレームワークは5つのデータセット上の他の最先端メソッドよりも優れたパフォーマンスを実現した。
論文 参考訳(メタデータ) (2024-09-03T02:08:47Z) - Spatiotemporal Implicit Neural Representation as a Generalized Traffic Data Learner [46.866240648471894]
時空間交通データ(STTD)は、マルチスケール交通システムの複雑な動的挙動を測定する。
本稿では,STTDを暗黙的ニューラル表現としてパラメータ化することで,STTD学習問題に対処する新しいパラダイムを提案する。
実世界のシナリオにおける広範な実験を通じて,その有効性を検証し,廊下からネットワークスケールへの応用を示す。
論文 参考訳(メタデータ) (2024-05-06T06:23:06Z) - Trajeglish: Traffic Modeling as Next-Token Prediction [67.28197954427638]
自動運転開発における長年の課題は、記録された運転ログからシードされた動的運転シナリオをシミュレートすることだ。
車両、歩行者、サイクリストが運転シナリオでどのように相互作用するかをモデル化するために、離散シーケンスモデリングのツールを適用します。
我々のモデルはSim Agents Benchmarkを上回り、リアリズムメタメトリックの先行作業の3.3%、インタラクションメトリックの9.9%を上回ります。
論文 参考訳(メタデータ) (2023-12-07T18:53:27Z) - Benchmarking the Robustness of LiDAR Semantic Segmentation Models [78.6597530416523]
本稿では,LiDARセマンティックセグメンテーションモデルのロバスト性を,様々な汚職の下で包括的に解析することを目的とする。
本稿では,悪天候,計測ノイズ,デバイス間不一致という3つのグループで16のドメイン外LiDAR破損を特徴とするSemanticKITTI-Cというベンチマークを提案する。
我々は、単純だが効果的な修正によってロバスト性を大幅に向上させるロバストLiDARセグメンテーションモデル(RLSeg)を設計する。
論文 参考訳(メタデータ) (2023-01-03T06:47:31Z) - A Driving Behavior Recognition Model with Bi-LSTM and Multi-Scale CNN [59.57221522897815]
運転行動認識のための軌道情報に基づくニューラルネットワークモデルを提案する。
提案手法を公開BLVDデータセット上で評価し,満足な性能を実現する。
論文 参考訳(メタデータ) (2021-03-01T06:47:29Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。