論文の概要: Rate-Distortion Optimized Communication for Collaborative Perception
- arxiv url: http://arxiv.org/abs/2509.21994v1
- Date: Fri, 26 Sep 2025 07:21:32 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-29 20:57:54.268068
- Title: Rate-Distortion Optimized Communication for Collaborative Perception
- Title(参考訳): 協調知覚のための速度歪み最適化通信
- Authors: Genjia Liu, Anning Hu, Yue Hu, Wenjun Zhang, Siheng Chen,
- Abstract要約: 本稿では,多エージェント協調のための実用的速度歪み理論を導入し,特に性能・コミュニケーションのトレードオフを解析するために定式化した。
本稿では,コミュニケーション効率のよい協調認識フレームワークRDcommを提案する。
3Dオブジェクト検出とBEVセグメンテーションの実験により、RDcommはDAIR-V2XとOPV2Vの最先端精度を実現し、通信容量を最大108倍に削減した。
- 参考スコア(独自算出の注目度): 47.737814518681326
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Collaborative perception emphasizes enhancing environmental understanding by enabling multiple agents to share visual information with limited bandwidth resources. While prior work has explored the empirical trade-off between task performance and communication volume, a significant gap remains in the theoretical foundation. To fill this gap, we draw on information theory and introduce a pragmatic rate-distortion theory for multi-agent collaboration, specifically formulated to analyze performance-communication trade-off in goal-oriented multi-agent systems. This theory concretizes two key conditions for designing optimal communication strategies: supplying pragmatically relevant information and transmitting redundancy-less messages. Guided by these two conditions, we propose RDcomm, a communication-efficient collaborative perception framework that introduces two key innovations: i) task entropy discrete coding, which assigns features with task-relevant codeword-lengths to maximize the efficiency in supplying pragmatic information; ii) mutual-information-driven message selection, which utilizes mutual information neural estimation to approach the optimal redundancy-less condition. Experiments on 3D object detection and BEV segmentation demonstrate that RDcomm achieves state-of-the-art accuracy on DAIR-V2X and OPV2V, while reducing communication volume by up to 108 times. The code will be released.
- Abstract(参考訳): 協調的認識は、複数のエージェントが限られた帯域幅のリソースで視覚情報を共有できるようにすることにより、環境理解の向上を強調する。
以前の研究では、タスクパフォーマンスと通信量の間の実証的なトレードオフを探求してきたが、理論上の基礎には大きなギャップが残っている。
このギャップを埋めるために、私たちは情報理論を描き、特にゴール指向マルチエージェントシステムにおけるパフォーマンス・コミュニケーションのトレードオフを分析するために定式化されたマルチエージェント協調のための実用的レート・歪み理論を導入する。
この理論は、実用的な情報の提供と冗長なメッセージの送信という、最適な通信戦略を設計するための2つの重要な条件を立証する。
これら2つの条件に則って,コミュニケーション効率の良い協調認識フレームワークRDcommを提案する。
一 課題エントロピー離散符号化であって、課題関連符号語長を割り当てて、実用情報の提供の効率を最大化すること。
二 相互情報駆動型メッセージ選択で、相互情報ニューラル推定を用いて最適な冗長性のない状態にアプローチすること。
3Dオブジェクト検出とBEVセグメンテーションの実験により、RDcommはDAIR-V2XとOPV2Vの最先端精度を実現し、通信容量を最大108倍に削減した。
コードはリリースされます。
関連論文リスト
- Communication-Efficient Multi-Agent 3D Detection via Hybrid Collaboration [34.67157102711333]
協調3D検出は、エージェントが相補的な情報を交換できるようにすることで、検出性能を大幅に向上させることができる。
本稿では,2種類のコミュニケーションメッセージを適応的に統合する新しいハイブリッドコラボレーションを提案する。
We present textttHyComm, a communication- efficient LiDAR based collaborative 3D detection system。
論文 参考訳(メタデータ) (2025-08-09T20:33:37Z) - Task-Oriented Semantic Communication in Large Multimodal Models-based Vehicle Networks [55.32199894495722]
LMMに基づく車両用AIアシスタントLarge Language and Vision Assistant(LLaVA)について検討する。
計算要求を減らし、応答時間を短縮するため、LLaVAの画像スライシングを最適化し、ユーザにとって最も関心のある領域に選択的にフォーカスする。
交通シナリオに対する視覚質問応答(VQA)データセットを構築し,有効性を評価する。
論文 参考訳(メタデータ) (2025-05-05T07:18:47Z) - Multi-Modal Self-Supervised Semantic Communication [52.76990720898666]
本稿では,マルチモーダルな自己教師型学習を活用し,タスク非依存の特徴抽出を強化するマルチモーダルセマンティックコミュニケーションシステムを提案する。
提案手法は,訓練関連通信オーバーヘッドを最小限に抑えつつ,モダリティの不変性とモダリティ特有の特徴の両方を効果的に捉えている。
この結果は、セマンティックコミュニケーションにおけるマルチモーダルな自己教師型学習の利点を浮き彫りにし、より効率的でスケーラブルなエッジ推論システムへの道を開いた。
論文 参考訳(メタデータ) (2025-03-18T06:13:02Z) - CoSDH: Communication-Efficient Collaborative Perception via Supply-Demand Awareness and Intermediate-Late Hybridization [23.958663737034318]
本稿では,供給需要の認識と中間段階のハイブリダイゼーションに基づく,コミュニケーション効率の高い協調認識フレームワークを提案する。
シミュレーションと実世界のシナリオを含む複数のデータセットの実験は、mymethodnameが最先端の検出精度と最適な帯域幅のトレードオフを達成することを実証している。
論文 参考訳(メタデータ) (2025-03-05T12:02:04Z) - Deep Reinforcement Learning-Based User Scheduling for Collaborative Perception [24.300126250046894]
車両間通信(V2X)を用いて、協調的知覚が知覚精度を向上させることを想定する。
通信資源が限られているため、すべてのユニットが点雲や高精細ビデオなどのセンシングデータを送信するのは現実的ではない。
協調認識のための深層強化学習に基づくV2Xユーザスケジューリングアルゴリズムを提案する。
論文 参考訳(メタデータ) (2025-02-12T04:45:00Z) - Communication Learning in Multi-Agent Systems from Graph Modeling Perspective [62.13508281188895]
本稿では,エージェント間の通信アーキテクチャを学習可能なグラフとして概念化する手法を提案する。
本稿では,各エージェントに対して時間的ゲーティング機構を導入し,ある時間に共有情報を受信するかどうかの動的決定を可能にする。
論文 参考訳(メタデータ) (2024-11-01T05:56:51Z) - Semantic Communication for Cooperative Perception using HARQ [51.148203799109304]
我々は重要セマンティック情報を抽出するために重要地図を活用し、協調的な知覚セマンティックコミュニケーションフレームワークを導入する。
周波数分割多重化(OFDM)とチャネル推定と等化戦略を併用して,時間変化によるマルチパスフェーディングによる課題に対処する。
我々は,ハイブリッド自動繰り返し要求(HARQ)の精神において,我々の意味コミュニケーションフレームワークと統合された新しい意味エラー検出手法を提案する。
論文 参考訳(メタデータ) (2024-08-29T08:53:26Z) - Tackling Distribution Shifts in Task-Oriented Communication with Information Bottleneck [28.661084093544684]
本稿では,情報ボトルネック(IB)原理と不変リスク最小化(IRM)フレームワークに基づく新しいアプローチを提案する。
提案手法は,効率的な領域シフト一般化のための高機能を有するコンパクトかつ情報的特徴を抽出することを目的としている。
提案手法は最先端の手法より優れ、より優れたレート歪みトレードオフを実現することを示す。
論文 参考訳(メタデータ) (2024-05-15T17:07:55Z) - PACE: A Pragmatic Agent for Enhancing Communication Efficiency Using
Large Language Models [29.016842120305892]
本稿では,Large Language Models (LLM) を用いたPACE(Pragmatic Agent for Communication efficiency)に基づく画像実用的コミュニケーションフレームワークを提案する。
PACEは、意味認識、意図分解、意図指向コーディングを順次実行する。
実験的な検証のために,画像の実用的コミュニケーションデータセットとそれに対応する評価基準を構築した。
論文 参考訳(メタデータ) (2024-01-30T06:55:17Z) - Pragmatic Communication in Multi-Agent Collaborative Perception [80.14322755297788]
協調的な知覚は、知覚能力とコミュニケーションコストのトレードオフをもたらす。
PragCommは2つの重要なコンポーネントを持つマルチエージェント協調認識システムである。
PragCommは、32.7K以上の通信量で従来手法より一貫して優れていた。
論文 参考訳(メタデータ) (2024-01-23T11:58:08Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。