論文の概要: Communication-Efficient Multi-Agent 3D Detection via Hybrid Collaboration
- arxiv url: http://arxiv.org/abs/2508.07092v1
- Date: Sat, 09 Aug 2025 20:33:37 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-12 21:23:28.696806
- Title: Communication-Efficient Multi-Agent 3D Detection via Hybrid Collaboration
- Title(参考訳): ハイブリッドコラボレーションによる通信効率の良いマルチエージェント3次元検出
- Authors: Yue Hu, Juntong Peng, Yunqiao Yang, Siheng Chen,
- Abstract要約: 協調3D検出は、エージェントが相補的な情報を交換できるようにすることで、検出性能を大幅に向上させることができる。
本稿では,2種類のコミュニケーションメッセージを適応的に統合する新しいハイブリッドコラボレーションを提案する。
We present textttHyComm, a communication- efficient LiDAR based collaborative 3D detection system。
- 参考スコア(独自算出の注目度): 34.67157102711333
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Collaborative 3D detection can substantially boost detection performance by allowing agents to exchange complementary information. It inherently results in a fundamental trade-off between detection performance and communication bandwidth. To tackle this bottleneck issue, we propose a novel hybrid collaboration that adaptively integrates two types of communication messages: perceptual outputs, which are compact, and raw observations, which offer richer information. This approach focuses on two key aspects: i) integrating complementary information from two message types and ii) prioritizing the most critical data within each type. By adaptively selecting the most critical set of messages, it ensures optimal perceptual information and adaptability, effectively meeting the demands of diverse communication scenarios.Building on this hybrid collaboration, we present \texttt{HyComm}, a communication-efficient LiDAR-based collaborative 3D detection system. \texttt{HyComm} boasts two main benefits: i) it facilitates adaptable compression rates for messages, addressing various communication requirements, and ii) it uses standardized data formats for messages. This ensures they are independent of specific detection models, fostering adaptability across different agent configurations. To evaluate HyComm, we conduct experiments on both real-world and simulation datasets: DAIR-V2X and OPV2V. HyComm consistently outperforms previous methods and achieves a superior performance-bandwidth trade-off regardless of whether agents use the same or varied detection models. It achieves a lower communication volume of more than 2,006$\times$ and still outperforms Where2comm on DAIR-V2X in terms of AP50. The related code will be released.
- Abstract(参考訳): 協調3D検出は、エージェントが相補的な情報を交換できるようにすることで、検出性能を大幅に向上させることができる。
これは本質的には、検出性能と通信帯域間の根本的なトレードオフをもたらす。
このボトルネックに対処するため、我々は、よりリッチな情報を提供する知覚出力と生観測の2つのタイプのコミュニケーションメッセージを適応的に統合する、新しいハイブリッドコラボレーションを提案する。
このアプローチは2つの重要な側面に焦点を当てている。
i)2種類のメッセージから補完情報を統合し、
二 各型において最重要データを優先すること。
メッセージの最も重要なセットを適応的に選択することにより、最適な知覚情報と適応性を確保し、多様なコミュニケーションシナリオの要求を効果的に満たし、コミュニケーション効率の高いLiDARベースの協調3D検出システムである「texttt{HyComm}」を提示する。
\texttt{HyComm} の主な利点は2つある。
一 メッセージの適応圧縮率、各種通信要件の対応、及び
二 メッセージの標準化されたデータフォーマットを使用すること。
これにより、特定の検出モデルから独立して、異なるエージェント構成間の適応性を促進することができる。
HyCommを評価するために、実世界とシミュレーションの両方のデータセット(DAIR-V2XとOPV2V)で実験を行う。
HyCommは従来手法を一貫して上回り、エージェントが同じまたは様々な検出モデルを使用するかどうかに関わらず、優れたパフォーマンス帯域トレードオフを実現する。
通信容量は2,006$\times$より低く、AP50の点ではDAIR-V2XのWhere2commよりも高い。
関連コードはリリースされます。
関連論文リスト
- AnyMAC: Cascading Flexible Multi-Agent Collaboration via Next-Agent Prediction [70.60422261117816]
本稿では,グラフ構造ではなくシーケンシャル構造を用いて,マルチエージェント協調を再考するフレームワークを提案する。
提案手法は,(1)各ステップで最も適したエージェントロールを選択するNext-Agent Predictionと,(2)各エージェントが前ステップから関連する情報にアクセスできるようにするNext-Context Selectionの2つの重要な方向に焦点を当てる。
論文 参考訳(メタデータ) (2025-06-21T18:34:43Z) - Prototype-Based Information Compensation Network for Multi-Source Remote Sensing Data Classification [56.065032039986725]
マルチソースリモートセンシングデータ共同分類は、土地被覆分類の精度と信頼性を提供することを目的としている。
既存の手法では、周波数間マルチソース特徴結合と相補的な情報探索の不整合という2つの課題に直面している。
HSIとSAR/LiDARデータに基づく土地被覆分類のためのプロトタイプベース情報補償ネットワーク(PICNet)を提案する。
論文 参考訳(メタデータ) (2025-05-06T22:30:23Z) - CoCMT: Communication-Efficient Cross-Modal Transformer for Collaborative Perception [14.619784179608361]
マルチエージェント協調知覚は、ロボット知覚タスクを協調的に行うために、知覚情報を共有することによって、各エージェントの能力を高める。
既存の代表的な協調認識システムは、大量の非臨界情報を含む中間特徴写像を伝達する。
本稿では,オブジェクトクエリをベースとした協調フレームワークであるCoCMTを紹介し,重要な特徴を選択的に抽出し伝達することによって,通信帯域幅を最大化する。
論文 参考訳(メタデータ) (2025-03-13T06:41:25Z) - Communication-Efficient Collaborative Perception via Information Filling with Codebook [48.087934650038044]
協調的知覚は、他のエージェントと知覚的メッセージの交換を通じて、各エージェントに知覚能力を向上させる権限を与える。
このボトルネック問題に対処するため、私たちの中核となる考え方は、協調メッセージを2つの重要な側面、すなわち表現と選択から最適化することにあります。
これら2つの設計を統合することで,新しいコミュニケーション効率の協調認識システムであるCodeFillingを提案する。
論文 参考訳(メタデータ) (2024-05-08T11:12:37Z) - Pragmatic Communication in Multi-Agent Collaborative Perception [80.14322755297788]
協調的な知覚は、知覚能力とコミュニケーションコストのトレードオフをもたらす。
PragCommは2つの重要なコンポーネントを持つマルチエージェント協調認識システムである。
PragCommは、32.7K以上の通信量で従来手法より一貫して優れていた。
論文 参考訳(メタデータ) (2024-01-23T11:58:08Z) - Where2comm: Communication-Efficient Collaborative Perception via Spatial
Confidence Maps [24.47241495415147]
マルチエージェント協調知覚は、知覚性能を大幅に向上させる可能性がある。
これは必然的に、知覚性能と通信帯域間の根本的なトレードオフをもたらす。
本稿では,知覚情報の空間的不均一性を反映した空間信頼マップを提案する。
コミュニケーション効率の良い協調認識フレームワークであるWhere2commを提案する。
論文 参考訳(メタデータ) (2022-09-26T16:41:18Z) - Multi-agent Communication with Graph Information Bottleneck under
Limited Bandwidth (a position paper) [92.11330289225981]
多くの実世界のシナリオでは、通信は高価であり、マルチエージェントシステムの帯域幅には一定の制約がある。
通信資源を占有する冗長なメッセージは、情報的メッセージの送信をブロックし、パフォーマンスを損なう。
本稿では,通信グラフ内の構造情報とノード情報を効果的に圧縮し,帯域幅に制約のある設定に対処する,新しいマルチエージェント通信モジュールCommGIBを提案する。
論文 参考訳(メタデータ) (2021-12-20T07:53:44Z) - A Co-Interactive Transformer for Joint Slot Filling and Intent Detection [61.109486326954205]
音声言語理解システム(SLU)を構築する上では,インテント検出とスロットフィリングが主要な2つのタスクである。
以前の研究では、2つのタスクを個別にモデル化するか、インテントからスロットへの単一の情報フローのみを考慮していた。
本稿では,2つのタスク間の相互影響を同時に検討するコ・インターアクティブ・トランスフォーマーを提案する。
論文 参考訳(メタデータ) (2020-10-08T10:16:52Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。