論文の概要: INTACT: Ego-Guided Typed Sparse Evidence Retrieval for Heterogeneous Collaborative Perception
- arxiv url: http://arxiv.org/abs/2606.04437v1
- Date: Wed, 03 Jun 2026 04:34:53 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-04 20:44:18.542184
- Title: INTACT: Ego-Guided Typed Sparse Evidence Retrieval for Heterogeneous Collaborative Perception
- Title(参考訳): INTACT:Ego-Guided Typed Sparse Evidence Retrieval for Heterogeneous Collaborative Perception
- Authors: Chen Li, Shengrong Yuan, Jialong Zuo, Xinzhong Zhu, Nong Sang, Changxin Gao,
- Abstract要約: 異種知覚のためのエゴ誘導型スパースエビデンス検索フレームワークを提案する。
IntACTは、エゴの車両に、疑わしい物やエビデンスに欠ける地域を表す型付きエビデンスクエリを発行する。
シミュレーションおよび実世界の異種知覚ベンチマークの実験は、INTACTの有効性とデプロイ性を検証する。
- 参考スコア(独自算出の注目度): 50.64511548643398
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Collaborative perception extends the perceptual range of autonomous vehicles by sharing information across agents, but heterogeneous sensors and perception models make intermediate feature fusion difficult to deploy at scale. Existing heterogeneous collaboration methods typically follow a translation-first paradigm: collaborator features must be aligned, adapted, or projected into an ego-compatible space before fusion. Such feature-compatibility contracts improve fixed-system performance, but they couple deployment to collaborator-specific adaptation and make newly joined heterogeneous agents costly to integrate. To address this gap, we propose INTACT, an ego-guided typed sparse evidence retrieval framework for heterogeneous collaborative perception. Instead of translating an entire collaborator feature map, INTACT lets the ego vehicle issue typed evidence queries that express suspected objects and evidence-deficient regions. Collaborators respond only with local evidence at queried locations, and the ego selects useful responses through sparse per-query routing and injects them through gated residual write-back. This changes the compatibility requirement from global feature-map interpretability to local, typed response comparability under ego-issued queries, enabling a zero-training heterogeneous insertion protocol in which the ego interface is trained once and new collaborators join through checkpoint merging. Extensive experiments on simulated and real-world heterogeneous collaborative perception benchmarks validate the effectiveness and deployability of INTACT. On OPV2V-H, INTACT achieves 80.1 AP70 with only 0.52M additional parameters and 18.0 $\log_2$ communication volume, corresponding to about 16$\times$ compression over dense feature transmission. On DAIR-V2X, INTACT achieves 43.8 AP50 under challenging real-world conditions.
- Abstract(参考訳): 協調知覚は、エージェント間で情報を共有することによって、自動運転車の知覚範囲を広げるが、異種センサーや知覚モデルは、中間的特徴融合を大規模に展開することが困難になる。
既存の異種協調手法は一般的に翻訳優先のパラダイムに従う:コラボレータの機能は融合の前にエゴ互換の空間に整列、適応、あるいは投影されなければならない。
このような機能互換性契約は固定システムの性能を改善するが、彼らは共同作業者固有の適応に配置し、新しく結合した異種エージェントを統合するのにコストがかかる。
このギャップに対処するために、異種協調知覚のためのエゴ誘導型スパースエビデンス検索フレームワークINTACTを提案する。
INTACTは、協力者の特徴マップ全体を翻訳する代わりに、エゴの車両に、疑わしい物体やエビデンスに欠ける領域を表す型付きエビデンスクエリを発行する。
共同作業者はクエリされた場所のローカルなエビデンスにのみ反応し、egoはクエリ毎のスパースルーティングを通じて有用な応答を選択し、ゲートされた残留書き込みを通じてそれらを注入する。
これにより、グローバルな特徴マップの解釈可能性から、egoが発行したクエリ下でのローカルな型付き応答コンパビリティへの互換性要件が変更され、egoインターフェースが一度トレーニングされ、新しいコラボレータがチェックポイントマージを通じて参加するゼロトレーニングの不均一な挿入プロトコルが実現される。
シミュレーションおよび実世界の異種協調知覚ベンチマークに関する広範囲な実験は、INTACTの有効性とデプロイ性を検証する。
OPV2V-H では、INTACT は 0.52M の追加パラメータと 18.0$\log_2$ 通信ボリュームで 80.1 AP70 を達成する。
DAIR-V2Xでは、INTACTは43.8 AP50を達成する。
関連論文リスト
- BOLT: Online Lightweight Adaptation for Preparation-Free Heterogeneous Cooperative Perception [16.786867034485027]
本稿では,ego-as-Teacher蒸留により隣接する機能をオンラインに適応させる軽量なプラグイン・アンド・プレイモジュールBOLTを提案する。
わずか0.9Mのトレーニング可能なパラメータで、BOLTはAP@50を32.3ポイントまで改善した。
論文 参考訳(メタデータ) (2026-05-01T04:53:50Z) - GT-Space: Enhancing Heterogeneous Collaborative Perception with Ground Truth Feature Space [30.468574984070894]
自律運転において、マルチエージェント協調知覚は、エージェントが知覚データを共有できるようにすることで、知覚能力を高める。
既存のアプローチでは、ペアワイズ機能アライメントのためにエンコーダをリトレーニングしたり、インタプリタモジュールを設計する必要がしばしばある。
異種エージェントのための柔軟でスケーラブルな協調認識フレームワークである Em GT-Space を提案する。
論文 参考訳(メタデータ) (2026-03-13T14:39:40Z) - Pragmatic Heterogeneous Collaborative Perception via Generative Communication Mechanism [14.40993352402385]
異種マルチエージェントシステム間のシームレスな認識を容易にする新しいジェネレーティブコミュニケーション機構(GenComm)を提案する。
OPV2V-H、DAIR-V2X、V2X-Realデータセットで実施された実験は、GenCommが既存の最先端手法より優れていることを示している。
論文 参考訳(メタデータ) (2025-10-22T14:15:20Z) - Self-Localized Collaborative Perception [49.86110931859302]
我々は,新しい自己局在型協調認識システムであるMathttCoBEVGlue$を提案する。
$mathttCoBEVGlue$は、エージェント間の相対的なポーズを提供する新しい空間アライメントモジュールである。
$mathttCoBEVGlue$は任意のローカライゼーションノイズとアタックの下で最先端の検出性能を達成する。
論文 参考訳(メタデータ) (2024-06-18T15:26:54Z) - An Extensible Framework for Open Heterogeneous Collaborative Perception [58.70875361688463]
協調的な知覚は、単一エージェントの知覚の限界を緩和することを目的としている。
本稿では,新しい異種エージェントを協調認識に適応させる方法を提案する。
本稿では,新しい協調認識フレームワークであるHeterogeneous ALliance(HEAL)を提案する。
論文 参考訳(メタデータ) (2024-01-25T05:55:03Z) - Cascaded Human-Object Interaction Recognition [175.60439054047043]
マルチステージで粗大なHOI理解のためのカスケードアーキテクチャを提案する。
各段階で、インスタンスローカライゼーションネットワークは、HOI提案を段階的に洗練し、インタラクション認識ネットワークにフィードする。
慎重に設計された人間中心の関係機能により、これらの2つのモジュールは効果的な相互作用理解に向けて協調的に機能する。
論文 参考訳(メタデータ) (2020-03-09T17:05:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。