論文の概要: V2X-M2C: Efficient Multi-Module Collaborative Perception with Two Connections
- arxiv url: http://arxiv.org/abs/2407.11546v1
- Date: Tue, 16 Jul 2024 09:51:52 GMT
- ステータス: 処理完了
- システム内更新日: 2024-07-17 15:42:36.533716
- Title: V2X-M2C: Efficient Multi-Module Collaborative Perception with Two Connections
- Title(参考訳): V2X-M2C:2つの接続を持つ効率的な多モジュール協調知覚
- Authors: Hyunchul Bae, Minhee Kang, Heejin Ahn,
- Abstract要約: 複数モジュールからなる協調認識モデル $textbfV2X-M2C$ を導入する。
実験により、V2X-M2Cは最先端の知覚性能を達成することが示された。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In this paper, we investigate improving the perception performance of autonomous vehicles through communication with other vehicles and road infrastructures. To this end, we introduce a collaborative perception model $\textbf{V2X-M2C}$, consisting of multiple modules, each generating inter-agent complementary information, spatial global context, and spatial local information. Inspired by the question of why most existing architectures are sequential, we analyze both the $\textit{sequential}$ and $\textit{parallel}$ connections of the modules. The sequential connection synergizes the modules, whereas the parallel connection independently improves each module. Extensive experiments demonstrate that V2X-M2C achieves state-of-the-art perception performance, increasing the detection accuracy by 8.00% to 10.87% and decreasing the FLOPs by 42.81% to 52.64%.
- Abstract(参考訳): 本稿では、他の車両や道路インフラとの通信による自動運転車の認識性能の向上について検討する。
この目的のために、複数のモジュールからなる協調認識モデル$\textbf{V2X-M2C}$を導入し、それぞれがエージェント間補完情報、空間的グローバルコンテキスト、空間的局所情報を生成する。
既存のアーキテクチャがなぜシーケンシャルなのかという疑問に触発され、$\textit{sequential}$と$\textit{parallel}$モジュールの接続の両方を分析します。
逐次接続はモジュールを相乗化するが、並列接続は各モジュールを独立的に改善する。
大規模な実験により、V2X-M2Cは最先端の知覚性能を達成し、検出精度は8.00%から10.87%に向上し、FLOPは42.81%から52.64%に低下した。
関連論文リスト
- Assume-Guarantee Reinforcement Learning [10.232750419662585]
本稿では, 並列に進化する単純なコンポーネントからなる環境において, RL (Emphreinforcement Learning) に対するモジュラーアプローチを提案する。
論文 参考訳(メタデータ) (2023-12-15T16:49:57Z) - UniTR: A Unified and Efficient Multi-Modal Transformer for
Bird's-Eye-View Representation [113.35352122662752]
屋外3次元知覚のためのマルチモーダルバックボーンUniTRを提案する。
UniTRは、統一されたモデリングと共有パラメータで様々なモダリティを処理する。
UniTRは基本的にタスクに依存しないバックボーンであり、異なる3D知覚タスクを自然にサポートする。
論文 参考訳(メタデータ) (2023-08-15T12:13:44Z) - Small logical qubit architecture based on strong interactions and
many-body dynamical decoupling [0.0]
我々はCold Echo Qubit (CEQ)と呼ばれる新しい超伝導論理量子ビットアーキテクチャを提案する。
CEQは完全に自律的に動作し、測定やフィードバックを必要とせず、比較的強力な相互作用要素と互換性がある。
2つのフルオキソニウムのコヒーレンスは約2倍になると予想されている。
論文 参考訳(メタデータ) (2022-12-08T22:33:01Z) - ECO-TR: Efficient Correspondences Finding Via Coarse-to-Fine Refinement [80.94378602238432]
粗大な処理で対応性を見出すことにより、ECO-TR(Correspondence Efficient Transformer)と呼ばれる効率的な構造を提案する。
これを実現するために、複数の変圧器ブロックは段階的に連結され、予測された座標を徐々に洗練する。
種々のスパースタスクと密マッチングタスクの実験は、既存の最先端技術に対する効率性と有効性の両方において、我々の手法の優位性を実証している。
論文 参考訳(メタデータ) (2022-09-25T13:05:33Z) - Integrative Feature and Cost Aggregation with Transformers for Dense
Correspondence [63.868905184847954]
現在の最先端はTransformerベースのアプローチで、機能記述子やコストボリュームアグリゲーションに重点を置いている。
本稿では,両形態のアグリゲーションを相互にインターリーブするトランスフォーマーネットワークを提案する。
提案手法が密マッチングタスクに与える影響を評価し,全ての主要なベンチマークで最先端性能を実現する。
論文 参考訳(メタデータ) (2022-09-19T03:33:35Z) - TR-MOT: Multi-Object Tracking by Reference [42.45614650498083]
本稿では、変形可能なトランス構造に基づくより信頼性の高いアソシエーションを提供するための新しい参照探索(RS)モジュールを提案する。
提案手法は,MOT17およびMOT20データセット上での競合結果を実現する。
論文 参考訳(メタデータ) (2022-03-30T19:07:26Z) - Disentangled Representation Learning for Text-Video Retrieval [51.861423831566626]
テキスト・ビデオ検索(TVR)における相互モダリティの相互作用
我々は相互作用のパラダイムを深く研究し、その計算を2つの項に分けることができることを示した。
本稿では,逐次的かつ階層的な表現を捉えるための非絡み合いフレームワークを提案する。
論文 参考訳(メタデータ) (2022-03-14T13:55:33Z) - Cost Aggregation Is All You Need for Few-Shot Segmentation [28.23753949369226]
本稿では,数発のセグメンテーションタスクに取り組むために,変圧器を用いたボリュームアグリゲーション(VAT)を提案する。
VATは畳み込みとトランスフォーマーの両方を使用して、クエリとサポートの間の高次元相関マップを効率的に処理する。
提案手法は,意味対応タスクにおける標準ベンチマークにおいても,最先端の性能を実現する。
論文 参考訳(メタデータ) (2021-12-22T06:18:51Z) - Modular Interactive Video Object Segmentation: Interaction-to-Mask,
Propagation and Difference-Aware Fusion [68.45737688496654]
本稿では,マスク間相互作用とマスク伝搬を分離するモジュール型対話型VOSフレームワークを提案する。
提案手法は,フレーム間インタラクションを少なくしつつ,現在の最先端アルゴリズムよりも優れることを示す。
論文 参考訳(メタデータ) (2021-03-14T14:39:08Z) - Centralized Information Interaction for Salient Object Detection [68.8587064889475]
U字型構造は、多スケールの機能を効率的に組み合わせるサリエント物体検出に長けている。
本稿では,これらの接続を集中化することにより,相互に相互に情報交換を行うことができることを示す。
本手法は, ボトムアップ経路とトップダウン経路の接続を置換することにより, 既存のU字型サルエント物体検出手法と協調することができる。
論文 参考訳(メタデータ) (2020-12-21T12:42:06Z) - Asynchronous Interaction Aggregation for Action Detection [43.34864954534389]
本稿では,異なるインタラクションを活用して動作検出を促進する非同期インタラクション集約ネットワーク(AIA)を提案する。
ひとつはインタラクション集約構造(IA)で、複数のタイプのインタラクションをモデル化し統合するための一様パラダイムを採用し、もうひとつはパフォーマンス向上を実現するための非同期メモリ更新アルゴリズム(AMU)です。
論文 参考訳(メタデータ) (2020-04-16T07:03:20Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。