論文の概要: V2X-PC: Vehicle-to-everything Collaborative Perception via Point Cluster
- arxiv url: http://arxiv.org/abs/2403.16635v1
- Date: Mon, 25 Mar 2024 11:24:02 GMT
- ステータス: 処理完了
- システム内更新日: 2024-03-26 15:08:28.633946
- Title: V2X-PC: Vehicle-to-everything Collaborative Perception via Point Cluster
- Title(参考訳): V2X-PC:ポイントクラスタによる全車間協調認識
- Authors: Si Liu, Zihan Ding, Jiahui Fu, Hongyu Li, Siheng Chen, Shifeng Zhang, Xu Zhou,
- Abstract要約: 我々は,低レベル構造情報と高レベル意味情報を組み合わせて,シーンを疎結合に表現する新しいメッセージユニット,すなわちポイントクラスタを導入する。
このフレームワークには、オブジェクトの機能を維持し、帯域幅を管理するためのポイントクラスタパッキング(PCP)モジュールが含まれている。
2つの広く認識されている協調認識ベンチマークの実験は、従来の最先端の手法と比較して、我々の手法の優れた性能を示している。
- 参考スコア(独自算出の注目度): 58.79477191603844
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The objective of the collaborative vehicle-to-everything perception task is to enhance the individual vehicle's perception capability through message communication among neighboring traffic agents. Previous methods focus on achieving optimal performance within bandwidth limitations and typically adopt BEV maps as the basic collaborative message units. However, we demonstrate that collaboration with dense representations is plagued by object feature destruction during message packing, inefficient message aggregation for long-range collaboration, and implicit structure representation communication. To tackle these issues, we introduce a brand new message unit, namely point cluster, designed to represent the scene sparsely with a combination of low-level structure information and high-level semantic information. The point cluster inherently preserves object information while packing messages, with weak relevance to the collaboration range, and supports explicit structure modeling. Building upon this representation, we propose a novel framework V2X-PC for collaborative perception. This framework includes a Point Cluster Packing (PCP) module to keep object feature and manage bandwidth through the manipulation of cluster point numbers. As for effective message aggregation, we propose a Point Cluster Aggregation (PCA) module to match and merge point clusters associated with the same object. To further handle time latency and pose errors encountered in real-world scenarios, we propose parameter-free solutions that can adapt to different noisy levels without finetuning. Experiments on two widely recognized collaborative perception benchmarks showcase the superior performance of our method compared to the previous state-of-the-art approaches relying on BEV maps.
- Abstract(参考訳): 本研究の目的は、近隣の交通機関間のメッセージ通信を通じて、各車両の知覚能力を高めることである。
従来の手法では帯域幅制限内での最適性能の実現に重点を置いており、BEVマップを基本的なコラボレーティブメッセージユニットとして採用するのが一般的である。
しかし、高密度表現との協調は、メッセージパッキング中のオブジェクトの特徴破壊、長距離協調のための非効率なメッセージアグリゲーション、暗黙的な構造表現通信に悩まされていることを実証する。
これらの課題に対処するために,低レベルの構造情報と高レベルの意味情報を組み合わせたシーンを疎結合に表現するために設計された,新たなメッセージユニット,すなわちポイントクラスタを導入する。
ポイントクラスタは、メッセージのパッキング中にオブジェクト情報を本質的に保存し、コラボレーション範囲に弱い関係を持ち、明示的な構造モデリングをサポートする。
この表現に基づいて,協調認識のための新しいフレームワークV2X-PCを提案する。
このフレームワークにはポイント・クラスタ・パッキング(PCP)モジュールが含まれており、オブジェクトの特徴を維持し、クラスタ・ポイント・ナンバーを操作することで帯域幅を管理する。
効果的なメッセージアグリゲーションについては,同じオブジェクトに関連付けられたポイントクラスタをマッチングしマージするためのポイントクラスタアグリゲーション(PCA)モジュールを提案する。
実世界のシナリオで遭遇したエラーに対処するため,我々はパラメータフリーで様々なノイズレベルに適応できる手法を提案する。
2つの広く認識されている協調認識ベンチマークの実験は、BEVマップに依存する従来の最先端アプローチと比較して、我々の手法の優れた性能を示している。
関連論文リスト
- Optimal Transport Aggregation for Visual Place Recognition [9.192660643226372]
SALADは,NetVLADの局所的特徴のソフトアサインを最適な輸送問題としてクラスタに再配置する。
SALADでは,機能間クラスタ関係とクラスタ間クラスタ関係の両方を考慮するとともに,非形式的と考えられる特徴を選択的に破棄する'ダストビン'クラスタも導入する。
我々のシングルステージ手法は、パブリックなVPRデータセットの単一ステージベースラインを超えるだけでなく、2段階の手法を超越し、コストを大幅に高めに再ランク付けする。
論文 参考訳(メタデータ) (2023-11-27T15:46:19Z) - Select2Col: Leveraging Spatial-Temporal Importance of Semantic
Information for Efficient Collaborative Perception [21.043094544649733]
共有意味情報の活用による協調的認識は、孤立したエージェントの個々人の限界を克服する上で重要な役割を担っている。
既存の協調認識手法は、時間次元の重要性を無視しながら、意味情報の空間的特徴にのみ焦点をあてる傾向がある。
Select2Colは,セマンティアンダーラインの情報アンダーラインを考慮した新しい協調認識フレームワークである。
論文 参考訳(メタデータ) (2023-07-31T09:33:19Z) - Holistic Prototype Attention Network for Few-Shot VOS [74.25124421163542]
FSVOS(Few-shot Video Object segmentation)は、少数のサポートイメージに頼って、目に見えないクラスの動的オブジェクトをセグメントすることを目的としている。
本稿では,FSVOS を前進させるための総合プロトタイプアテンションネットワーク (HPAN) を提案する。
論文 参考訳(メタデータ) (2023-07-16T03:48:57Z) - CPSeg: Cluster-free Panoptic Segmentation of 3D LiDAR Point Clouds [2.891413712995641]
CPSegと呼ばれるLiDAR点雲のための新しいリアルタイム・エンド・エンド・エンド・パノプティクス・セグメンテーション・ネットワークを提案する。
CPSegは、共有エンコーダ、デュアルデコーダ、タスク認識アテンションモジュール(TAM)、クラスタフリーインスタンスセグメンテーションヘッドを備える。
論文 参考訳(メタデータ) (2021-11-02T16:44:06Z) - Unveiling the Potential of Structure-Preserving for Weakly Supervised
Object Localization [71.79436685992128]
本稿では,WSOLの畳み込み機能に組み込まれた構造情報を完全に活用するための2段階構造保存アクティベーション(SPA)を提案する。
第1段階では、分類ネットワークによって引き起こされる構造ミス問題を軽減するために制限アクティベーションモジュール(ram)が設計されている。
第2段階では, 自己相関マップ生成(SCG)モジュールと呼ばれるプロセス後アプローチを提案し, 構造保存ローカライゼーションマップを得る。
論文 参考訳(メタデータ) (2021-03-08T03:04:14Z) - CoADNet: Collaborative Aggregation-and-Distribution Networks for
Co-Salient Object Detection [91.91911418421086]
Co-Salient Object Detection (CoSOD)は、2つ以上の関連する画像を含む所定のクエリグループに繰り返し現れる健全なオブジェクトを発見することを目的としている。
課題の1つは、画像間の関係をモデリングし、活用することによって、コ・サリヤ・キューを効果的にキャプチャする方法である。
我々は,複数画像から有能かつ反復的な視覚パターンを捉えるために,エンドツーエンドの協調集約配信ネットワーク(CoADNet)を提案する。
論文 参考訳(メタデータ) (2020-11-10T04:28:11Z) - Mixup-CAM: Weakly-supervised Semantic Segmentation via Uncertainty
Regularization [73.03956876752868]
我々は、ネットワークがオブジェクトの他の部分に注意を払うことを可能にする、原則的でエンドツーエンドのトレーニング可能なフレームワークを提案する。
具体的には、ミックスアップデータ拡張方式を分類ネットワークに導入し、2つの不確実な正規化項を設計し、ミックスアップ戦略をよりよく扱う。
論文 参考訳(メタデータ) (2020-08-03T21:19:08Z) - Cascaded Human-Object Interaction Recognition [175.60439054047043]
マルチステージで粗大なHOI理解のためのカスケードアーキテクチャを提案する。
各段階で、インスタンスローカライゼーションネットワークは、HOI提案を段階的に洗練し、インタラクション認識ネットワークにフィードする。
慎重に設計された人間中心の関係機能により、これらの2つのモジュールは効果的な相互作用理解に向けて協調的に機能する。
論文 参考訳(メタデータ) (2020-03-09T17:05:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。