論文の概要: JigsawComm: Joint Semantic Feature Encoding and Transmission for Communication-Efficient Cooperative Perception
- arxiv url: http://arxiv.org/abs/2511.17843v1
- Date: Fri, 21 Nov 2025 23:36:24 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-25 18:34:24.469155
- Title: JigsawComm: Joint Semantic Feature Encoding and Transmission for Communication-Efficient Cooperative Perception
- Title(参考訳): JigsawComm: コミュニケーション効率の良い協調知覚のための共同意味的特徴符号化と伝達
- Authors: Chenyi Wang, Zhaowei Li, Ming F. Li, Wujie Wen,
- Abstract要約: JigsawCommはエンドツーエンドのトレーニング、セマンティックアウェア、通信効率の良いCPフレームワークである。
正規化エンコーダを使用して、意味的関連性とスパースな特徴を抽出する。
軽量のFeature Utility Estimatorを使用して、各エージェントの機能を最終認識タスクへのコントリビューションを予測する。
- 参考スコア(独自算出の注目度): 7.867653563872962
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Multi-agent cooperative perception (CP) promises to overcome the inherent occlusion and sensing-range limitations of single-agent systems (e.g., autonomous driving). However, its practicality is severely constrained by the limited communication bandwidth. Existing approaches attempt to improve bandwidth efficiency via compression or heuristic message selection, without considering the semantic relevance or cross-agent redundancy of sensory data. We argue that a practical CP system must maximize the contribution of every transmitted bit to the final perception task, by extracting and transmitting semantically essential and non-redundant data. In this paper, we formulate a joint semantic feature encoding and transmission problem, which aims to maximize CP accuracy under limited bandwidth. To solve this problem, we introduce JigsawComm, an end-to-end trained, semantic-aware, and communication-efficient CP framework that learns to ``assemble the puzzle'' of multi-agent feature transmission. It uses a regularized encoder to extract semantically-relevant and sparse features, and a lightweight Feature Utility Estimator to predict the contribution of each agent's features to the final perception task. The resulting meta utility maps are exchanged among agents and leveraged to compute a provably optimal transmission policy, which selects features from agents with the highest utility score for each location. This policy inherently eliminates redundancy and achieves a scalable $\mathcal{O}(1)$ communication cost as the number of agents increases. On the benchmarks OPV2V and DAIR-V2X, JigsawComm reduces the total data volume by up to $>$500$\times$ while achieving matching or superior accuracy compared to state-of-the-art methods.
- Abstract(参考訳): マルチエージェント協調知覚(CP)は、単一エージェントシステム(例えば自律運転)の固有の閉塞と知覚範囲の制限を克服することを約束する。
しかし、その実用性は限られた通信帯域幅によって厳しく制約されている。
既存のアプローチでは、感覚データの意味的関連性や横断的冗長性を考慮せずに、圧縮やヒューリスティックなメッセージ選択による帯域幅効率の向上を試みている。
我々は,意味論的に必須かつ非冗長なデータを抽出して伝達することにより,各送信ビットの最終的な知覚課題への寄与を最大化する必要があると論じる。
本稿では,限られた帯域幅でCPの精度を最大化することを目的とした,共同意味的特徴符号化と伝送問題を定式化する。
この問題を解決するために,マルチエージェント機能伝達の‘パズルを組み立てる’ことを学ぶ,エンドツーエンドのトレーニング,セマンティック・アウェア,通信効率の高いCPフレームワークであるJigsawCommを紹介した。
正規化エンコーダを使用して、意味的関連性とスパースな特徴を抽出し、また、各エージェントの機能を最終認識タスクに寄与させるための軽量な機能ユーティリティ推定器を使用する。
得られたメタユーティリティマップはエージェント間で交換され、証明可能な最適な送信ポリシーを計算するために利用される。
このポリシーは本質的に冗長性を排除し、エージェントの数が増えるにつれてスケーラブルな$\mathcal{O}(1)$通信コストを達成する。
OPV2V と DAIR-V2X のベンチマークでは、JigsawComm はデータの総量を$$500$\times$ まで削減すると同時に、最先端のメソッドと比較してマッチングや精度の向上を実現している。
関連論文リスト
- Task-Oriented Feature Compression for Multimodal Understanding via Device-Edge Co-Inference [54.53508601749513]
本稿では,マルチモーダル理解のためのタスク指向特徴圧縮(TOFC)手法を提案する。
圧縮効率を向上させるために、視覚特徴の特性に基づいて複数のエントロピーモデルを適応的に選択する。
その結果,TOFCはデータ転送オーバーヘッドを最大52%削減し,システム遅延を最大63%削減できることがわかった。
論文 参考訳(メタデータ) (2025-03-17T08:37:22Z) - CoCMT: Communication-Efficient Cross-Modal Transformer for Collaborative Perception [14.619784179608361]
マルチエージェント協調知覚は、ロボット知覚タスクを協調的に行うために、知覚情報を共有することによって、各エージェントの能力を高める。
既存の代表的な協調認識システムは、大量の非臨界情報を含む中間特徴写像を伝達する。
本稿では,オブジェクトクエリをベースとした協調フレームワークであるCoCMTを紹介し,重要な特徴を選択的に抽出し伝達することによって,通信帯域幅を最大化する。
論文 参考訳(メタデータ) (2025-03-13T06:41:25Z) - Communication-Efficient Federated Knowledge Graph Embedding with Entity-Wise Top-K Sparsification [49.66272783945571]
Federated Knowledge Graphs Embedding Learning (FKGE)は、パラメータのかなりのサイズと広範なコミュニケーションラウンドから生じるコミュニケーション効率の課題に直面する。
本稿では,Entity-Wise Top-K Sparsification 戦略に基づく双方向通信効率のFedSを提案する。
論文 参考訳(メタデータ) (2024-06-19T05:26:02Z) - Task-Oriented Sensing, Computation, and Communication Integration for
Multi-Device Edge AI [108.08079323459822]
本稿では,AIモデルの分割推論と統合センシング通信(ISAC)を併用した,新しいマルチインテリジェントエッジ人工レイテンシ(AI)システムについて検討する。
推定精度は近似的だが抽出可能な計量、すなわち判別利得を用いて測定する。
論文 参考訳(メタデータ) (2022-07-03T06:57:07Z) - Distributed Adaptive Learning Under Communication Constraints [54.22472738551687]
本研究では,コミュニケーション制約下での運用を目的とした適応型分散学習戦略について検討する。
我々は,ストリーミングデータの連続的な観察から,オンライン最適化問題を解決しなければならないエージェントのネットワークを考える。
論文 参考訳(メタデータ) (2021-12-03T19:23:48Z) - Task-Based Information Compression for Multi-Agent Communication
Problems with Channel Rate Constraints [28.727611928919725]
本稿では,情報圧縮アルゴリズム(SAIC)のステートアグリゲーションを導入し,定式化TBIC問題の解法を提案する。
その結果,SAICは割引報酬の総和でほぼ最適性能を達成できることが示唆された。
論文 参考訳(メタデータ) (2020-05-28T18:29:21Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。