論文の概要: Hierarchically Decoupled Mixture-of-Experts for Robust Traffic Sign Recognition in Complex Driving Scenarios
- arxiv url: http://arxiv.org/abs/2606.01822v2
- Date: Thu, 04 Jun 2026 03:22:58 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-05 19:21:33.001982
- Title: Hierarchically Decoupled Mixture-of-Experts for Robust Traffic Sign Recognition in Complex Driving Scenarios
- Title(参考訳): 複合運転シナリオにおけるロバスト交通信号認識のための階層的分離混合処理
- Authors: Mingxiao Wang, Xiaozhen Qu, Bolin Gao, Tong Wang, Lei He,
- Abstract要約: CBDES MoE TSRは、交通信号認識のための階層的に分離されたヘテロジニアス混合物(MoE)フレームワークである。
ゲーティングモジュールは、入力画像の意味特性に基づいて、エキスパートプールから最も適したエキスパートモデルを選択的に活性化する。
実験結果から,本手法は検出精度と効率の相違が顕著であることがわかった。
- 参考スコア(独自算出の注目度): 6.121863091287242
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Traffic sign detection is a fundamental component of environmental perception in autonomous driving and intelligent transportation systems. However, most existing detectors rely on static inference with globally shared parameters, limiting their ability to adapt to diverse and unstructured traffic scenarios. As a result, a single static model often struggles to simultaneously handle both clear near-range samples and challenging conditions such as distant small targets or adverse weather environments. To address this limitation, we propose CBDES MoE TSR, a hierarchically decoupled heterogeneous mixture-of-experts(MoE) framework for traffic sign recognition. The proposed framework departs from the conventional globally shared parameter paradigm by introducing a heterogeneous You Only Look Once (YOLO) expert pool together with a lightweight gating network, enabling an image-level dynamic routing mechanism. Based on the semantic characteristics of the input image, the gating module selectively activates the most suitable expert model from the expert pool, enabling a shift from fixed parameter fitting to on-demand dynamic representation. This design enhances feature extraction capability for specific scenarios while maintaining controlled inference overhead. Experimental results demonstrate that the proposed method achieves a remarkable balance between detection accuracy and efficiency on the composite traffic sign dataset. Specifically, our method attains an mAP50-95 of 76.8%, yielding a 2.3% improvement over the baseline method (74.5%) while simultaneously reducing computational overhead by approximately 39.4%. These findings robustly validate the effectiveness of the proposed approach.
- Abstract(参考訳): 交通標識検出は、自動運転とインテリジェント交通システムにおける環境認識の基本的な構成要素である。
しかし、既存の検出器のほとんどは、グローバルに共有されるパラメータによる静的推論に依存しており、多様な非構造的なトラフィックシナリオに適応する能力を制限する。
結果として、単一の静的モデルはしばしば、明確な近距離サンプルと、遠くの小さな目標や悪天候環境のような困難な条件の両方を同時に扱うのに苦労する。
この制限に対処するために、交通信号認識のための階層的に分離された異種混合(MoE)フレームワークCBDES MoE TSRを提案する。
提案フレームワークは,異質なYou Only Look Once (YOLO)エキスパートプールと軽量ゲーティングネットワークを導入し,画像レベルの動的ルーティング機構を実現することで,従来のグローバルなパラメータパラダイムから脱却する。
ゲーティングモジュールは、入力画像のセマンティック特性に基づいて、専門家プールから最も適したエキスパートモデルを選択的に活性化し、固定パラメータ適合からオンデマンド動的表現へのシフトを可能にする。
この設計は、制御された推論オーバーヘッドを維持しながら、特定のシナリオの機能抽出機能を強化する。
実験により, 提案手法は, 複合交通標識データセットにおいて, 検出精度と効率の相違が顕著であることを示す。
具体的には,mAP50-95の76.8%を達成し,ベースライン法(74.5%)よりも2.3%向上し,計算オーバーヘッドを約39.4%削減した。
これらの結果は,提案手法の有効性を確実に検証した。
関連論文リスト
- SEATrack: Simple, Efficient, and Adaptive Multimodal Tracker [48.348918789044]
本稿では, 単純, 効率的, 適応的な2ストリームマルチモーダルトラッカーSEATrackを紹介する。
AMG-LoRAは、AMG(Adaptive Mutual Guidance)とドメイン適応のためのLow-Rank Adaptation (LoRA)をシームレスに統合し、注意マップを動的に洗練・調整する。
そして、効率的なグローバルな関係モデリングを可能にする階層型エキスパート混合(HMoE)を導入することで、従来の局所融合アプローチから脱却する。
論文 参考訳(メタデータ) (2026-04-14T09:27:50Z) - TrafficMoE: Heterogeneity-aware Mixture of Experts for Encrypted Traffic Classification [12.748275751587363]
暗号化されたトラフィック分類は、ネットワークセキュリティにとって重要なタスクである。
一つのサイズにフィットする静的デザインは、本質的に欠陥がある。
静的モデリングのボトルネックを突破するフレームワークであるTrafficMoEを提案する。
論文 参考訳(メタデータ) (2026-03-31T10:05:54Z) - TopoCurate:Modeling Interaction Topology for Tool-Use Agent Training [53.93696896939915]
訓練用ツール使用エージェントは一般的に、パスレート選択されたタスクに対して、軌道変更の成功と強化学習(RL)に依存している。
TopoCurateは,同一タスクから多段階的なロールアウトを統一的な意味的商トポロジに投影する対話型フレームワークである。
TopoCurateは最先端のベースラインに対して4.2%(SFT)と6.9%(RL)という一貫したゲインを達成している。
論文 参考訳(メタデータ) (2026-03-02T10:38:54Z) - Optimization-Guided Diffusion for Interactive Scene Generation [52.23368750264419]
本稿では,拡散型サンプリングにおける構造的一貫性と相互作用認識を実現するための,最適化誘導型トレーニングフリーフレームワークであるOMEGAを提案する。
OMEGAは生成リアリズム,一貫性,可制御性を向上し,身体的および行動学的に有効なシーンの比率を増大させることを示す。
当社のアプローチでは,3秒未満の時間対コリションで,より近いコリジョンフレームを5ドル(約5,500円)で生成することも可能だ。
論文 参考訳(メタデータ) (2025-12-08T15:56:18Z) - Grounded Test-Time Adaptation for LLM Agents [75.62784644919803]
大規模言語モデル(LLM)ベースのエージェントは、新規で複雑な環境への一般化に苦慮している。
環境特化情報を活用することで, LLMエージェントを適応するための2つの戦略を提案する。
論文 参考訳(メタデータ) (2025-11-06T22:24:35Z) - Contrastive Learning-Driven Traffic Sign Perception: Multi-Modal Fusion of Text and Vision [2.0720154517628417]
オープン語彙検出とクロスモーダル学習を組み合わせた新しいフレームワークを提案する。
交通信号検出のために,NanoVerse YOLOモデルは視覚言語パス集約ネットワーク(RepVL-PAN)とSPD-Convモジュールを統合している。
交通標識分類のための交通信号認識マルチモーダルコントラスト学習モデル(TSR-MCL)を設計した。
TT100Kデータセットでは,全クラス認識のためのロングテール検出タスクにおいて,最先端の78.4%mAPを実現する。
論文 参考訳(メタデータ) (2025-07-31T08:23:30Z) - Lane-Wise Highway Anomaly Detection [8.086502588472783]
本稿では,車線道路交通異常検出のためのスケーラブルかつ解釈可能なフレームワークを提案する。
従来のセンサ依存の手法とは異なり、我々の手法はAIを利用した視覚モデルを用いて車線固有の特徴を抽出する。
我々のフレームワークは、精度、リコール、F1スコアにおいて最先端の手法より優れています。
論文 参考訳(メタデータ) (2025-05-05T12:32:23Z) - A Parallel Hybrid Action Space Reinforcement Learning Model for Real-world Adaptive Traffic Signal Control [10.9431172488753]
本稿では,交通信号の位相と所要時間を同時に最適化する並列ハイブリッド行動空間強化学習モデル(PH-DDPG)を提案する。
本モデルでは,個別位相選択と関連する継続時間パラメータを並列に出力する適応的トラフィック制御に適したタスク固有並列ハイブリッド動作空間を特徴とする。
論文 参考訳(メタデータ) (2025-03-18T13:38:53Z) - SAFE-SIM: Safety-Critical Closed-Loop Traffic Simulation with Diffusion-Controllable Adversaries [94.84458417662407]
制御可能なクローズドループ安全クリティカルシミュレーションフレームワークであるSAFE-SIMを紹介する。
提案手法は,1)現実の環境を深く反映した現実的な長距離安全クリティカルシナリオの生成,2)より包括的でインタラクティブな評価のための制御可能な敵行動の提供,の2つの利点をもたらす。
複数のプランナにまたがるnuScenesとnuPlanデータセットを使用して、我々のフレームワークを実証的に検証し、リアリズムと制御性の両方の改善を実証した。
論文 参考訳(メタデータ) (2023-12-31T04:14:43Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。