論文の概要: AFFormer: Adaptive Feature Fusion Transformer for V2X Cooperative Perception under Channel Impairments
- arxiv url: http://arxiv.org/abs/2605.01888v1
- Date: Sun, 03 May 2026 14:10:03 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-05 20:33:49.981172
- Title: AFFormer: Adaptive Feature Fusion Transformer for V2X Cooperative Perception under Channel Impairments
- Title(参考訳): AFFormer:チャネル障害下でのV2X協調知覚のための適応型特徴融合変換器
- Authors: Xi Zhou, Tao Huang, Qing-Long Han, Rana Abbas, Mostafa Rahimi Azghadi,
- Abstract要約: 本稿では, 劣化した特徴の悪影響を緩和する適応型特徴融合変換器 (AFFormer) を提案する。
AFFormerはV2XSetとDAIR-V2Xデータセットで検証されている。
- 参考スコア(独自算出の注目度): 27.909296916403346
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Accurate 3D object detection is essential for ensuring the safety of autonomous vehicles. Cooperative perception, which leverages vehicle-to-everything (V2X) communication to share perceptual data, enhances detection but is vulnerable to channel impairments, such as noise, fading, and interference. To strengthen the reliability of intelligent transportation systems, this work improves the robustness of V2X cooperative perception under communication conditions that reflect common channel impairments. This paper proposes an Adaptive Feature Fusion Transformer (AFFormer), a Transformer-based framework that mitigates the adverse effects of corrupted features by modeling temporal, inter-agent, and spatial correlations. AFFormer introduces three key modules: Multi-Agent and Temporal Aggregation for context-aware fusion across agents and over time, Dual Spatial Attention for efficient modeling of spatial dependencies, and Uncertainty-Guided Fusion for entropy-driven refinement of fused features. A teacher-student knowledge distillation strategy further enhances robustness by aligning fused features with reliable early-collaboration supervision. AFFormer is validated on the V2XSet and DAIR-V2X datasets, where it consistently outperforms existing methods under both ideal and impaired communication conditions, demonstrating improved robustness to communication-induced feature degradation while maintaining a competitive efficiency-accuracy trade-off.
- Abstract(参考訳): 自動運転車の安全性を確保するためには、正確な3Dオブジェクト検出が不可欠である。
車両間通信(V2X)を利用して知覚データを共有する協調認識は、検出を増強するが、ノイズ、フェージング、干渉などのチャネル障害に対して脆弱である。
本研究は,知的輸送システムの信頼性を高めるため,共通チャネル障害を反映した通信条件下でのV2X協調認識の堅牢性を向上させる。
本稿では, 時間的, エージェント間, 空間的相関をモデル化することにより, 劣化した特徴の悪影響を緩和する適応的特徴融合変換器 (AFFormer) を提案する。
AFFormerは3つの重要なモジュールを紹介している。マルチエージェントとテンポラルアグリゲーション エージェントと時間とともにコンテキスト認識の融合、空間依存の効率的なモデリングのためのデュアル空間アテンション エントロピー駆動による特徴の洗練のための不確実性誘導フュージョン。
教師-学生の知識蒸留戦略は、融合した特徴と信頼性の高い早期協力の監督を整合させることにより、より堅牢性を高める。
AFFormerはV2XSetとDAIR-V2Xデータセットで検証されており、理想的な通信条件と障害のある通信条件の両方で既存の手法を一貫して上回り、競争効率と精度のトレードオフを維持しながら、通信による特徴劣化に対する堅牢性の向上を実証している。
関連論文リスト
- Communication-Efficient Multi-Modal Edge Inference via Uncertainty-Aware Distributed Learning [60.650628083185616]
トレーニングと推論効率を向上させるために,3段階のコミュニケーション対応分散学習フレームワークを提案する。
StageIでは、デバイスがローカルなマルチモーダルな自己教師型学習を行い、デバイス-サーバ交換なしで共有およびモダリティ固有のエンコーダを得る。
集中的な顕在的融合校正による分散微調整は、モダリティごとの不確かさを解消し、ノイズやチャネルのフェーディングによって歪んだ特徴を確実に集約する。
不確実性誘導フィードバック機構であるStageIIIは、分散環境での通信精度のトレードオフを最適化し、不確実なサンプルに対する追加機能を選択的に要求する。
論文 参考訳(メタデータ) (2026-01-21T12:38:02Z) - Attention in Motion: Secure Platooning via Transformer-based Misbehavior Detection [0.6999740786886536]
車両小隊は、多車編成の調整を通じて、輸送効率と安全性の変革的な改善を約束する。
確率チェックや統計的手法に依存する従来の誤動作検出手法は、偽陽性(FP)率が高い。
Intention In Motion (AIMformer) は、車体プラトンにおけるリアルタイムな誤動作検出に適したトランスフォーマーベースのフレームワークである。
論文 参考訳(メタデータ) (2025-12-17T14:45:33Z) - DRCP: Diffusion on Reinforced Cooperative Perception for Perceiving Beyond Limits [11.34052678290095]
Diffusion on Reinforced Cooperative Perception (DRCP)は動的運転環境における問題に対処するために設計されたリアルタイムデプロイ可能なフレームワークである。
提案システムは,モバイルプラットフォーム上でのリアルタイムなパフォーマンスを実現するとともに,困難な条件下でのロバスト性を大幅に向上させる。
論文 参考訳(メタデータ) (2025-09-29T15:13:03Z) - Adaptive Dual Uncertainty Optimization: Boosting Monocular 3D Object Detection under Test-Time Shifts [80.32933059529135]
TTA(Test-Time Adaptation)メソッドが出現し、推論中にターゲット分布に適応する。
我々は、堅牢なM3ODの両不確実性を共同で最小化するために設計された、最初のTTAフレームワークであるDual Uncertainity Optimization (DUO)を提案する。
並列に,明瞭な意味的手がかりを持つ領域における幾何学的コヒーレンスを保存する意味認識型正規場制約を設計する。
論文 参考訳(メタデータ) (2025-08-28T07:09:21Z) - Edge-Based Multimodal Sensor Data Fusion with Vision Language Models (VLMs) for Real-time Autonomous Vehicle Accident Avoidance [12.513296074529727]
本稿では,自律走行のためのリアルタイムエッジベース自律走行軌道プランナ(REACT)を提案する。
REACTは、微調整軽量ビジョンランゲージモデル(VLM)に基づくADのためのV2X統合軌道最適化フレームワークである。
DeepAccidentベンチマークで評価されたREACTは、最先端の性能、77%の衝突率の低減、48.2%のビデオパノプティクス品質(VPQ)、およびJetson AGX Orinでの0.57秒の推論遅延を実現している。
論文 参考訳(メタデータ) (2025-08-01T20:16:04Z) - V2X-DGPE: Addressing Domain Gaps and Pose Errors for Robust Collaborative 3D Object Detection [18.694510415777632]
V2X-DGPEは高精度で堅牢なV2X特徴レベルの協調認識フレームワークである。
提案手法は既存の手法より優れ、最先端検出性能を実現する。
論文 参考訳(メタデータ) (2025-01-04T19:28:55Z) - Interruption-Aware Cooperative Perception for V2X Communication-Aided
Autonomous Driving [49.42873226593071]
本稿では,V2X通信支援自律運転のためのV2X通信入出力対応協調知覚(V2X-INCOP)を提案する。
我々は、過去の協力情報を用いて、割り込みによる行方不明情報を復元し、割り込み問題の影響を軽減する。
3つの公的な協調認識データセットの実験から,コミュニケーション中断が協調知覚に与える影響を緩和するために提案手法が有効であることが示された。
論文 参考訳(メタデータ) (2023-04-24T04:59:13Z) - Reliable Federated Disentangling Network for Non-IID Domain Feature [62.73267904147804]
本稿では、RFedDisと呼ばれる新しい信頼性のあるフェデレーション・ディエンタングリング・ネットワークを提案する。
我々の知る限り、提案するRFedDisは、明らかな不確実性と特徴の混在に基づくFLアプローチを開発する最初の試みである。
提案するRFedDisは,他の最先端FL手法と比較して信頼性の高い優れた性能を提供する。
論文 参考訳(メタデータ) (2023-01-30T11:46:34Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。