論文の概要: Adaptation-Free Heterogeneous Collaborative Perception with Unseen Agent Configurations
- arxiv url: http://arxiv.org/abs/2605.26642v1
- Date: Tue, 26 May 2026 07:26:34 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-27 17:51:41.726606
- Title: Adaptation-Free Heterogeneous Collaborative Perception with Unseen Agent Configurations
- Title(参考訳): 未確認エージェント構成による適応自由な異種協調知覚
- Authors: Hyunchul Bae, Heejin Ahn,
- Abstract要約: 協調的知覚は、エージェントが相補的な観察を共有することによって、3Dオブジェクトの検出を改善する。
既存のほとんどのメソッドは、固定または既知のコラボレータエンコーダ構成を前提としており、実際にはデプロイを制限している。
本研究では,未確認エージェント構成によるゼロ適応協調を可能にする協調認識フレームワークであるALFを提案する。
- 参考スコア(独自算出の注目度): 2.1485350418225244
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Collaborative perception improves 3D object detection by enabling agents to share complementary observations, but most existing methods assume fixed or known collaborator encoder configurations, limiting deployment in practice. In this work, we consider an open-world setting in which auxiliary agents with unseen configurations may appear after deployment, such as different LiDAR beam counts or encoder architectures. To address this challenge, we propose ALF, a collaborative perception framework that enables zero-adaptation collaboration with unseen agent configurations by lifting lightweight box-level messages into ego-compatible auxiliary features. ALF converts auxiliary box-level messages into pseudo-BEV maps and synthesizes ego-compatible latent features by combining object-centric cues with scene context from the ego feature. On V2X-Real, under a zero-shot evaluation across 64 case studies, ALF outperforms the strongest prior baseline by 35.91% in relative mAP@0.7 while requiring only 120 bytes per agent per frame (approximately 9.6 Kbps bandwidth at 10 Hz).
- Abstract(参考訳): 協調的知覚は、エージェントが補完的な観察を共有できるようにすることで3Dオブジェクトの検出を改善するが、既存のほとんどのメソッドは、固定または既知のコラボレータエンコーダ構成を前提としており、実際はデプロイを制限する。
本研究では,異なるLiDARビーム数やエンコーダアーキテクチャなど,目に見えない構成の補助エージェントが展開後に現れるようなオープンワールド設定について考察する。
この課題に対処するために,軽量なボックスレベルのメッセージをego互換の補助機能に持ち上げることで,未知のエージェント構成とのゼロ適応協調を可能にする,協調認識フレームワークであるALFを提案する。
ALFは補助的ボックスレベルのメッセージを擬似BEVマップに変換し、オブジェクト中心のキューとエゴ機能からのシーンコンテキストを組み合わせることで、エゴ互換の潜在機能を合成する。
V2X-Realでは、64のケーススタディでゼロショットの評価を受け、ALFは相対的なmAP@0.7で35.91%、フレーム当たり120バイト(約9.6Kbpsの帯域幅10Hz)で最強のベースラインを上回った。
関連論文リスト
- BOLT: Online Lightweight Adaptation for Preparation-Free Heterogeneous Cooperative Perception [16.786867034485027]
本稿では,ego-as-Teacher蒸留により隣接する機能をオンラインに適応させる軽量なプラグイン・アンド・プレイモジュールBOLTを提案する。
わずか0.9Mのトレーニング可能なパラメータで、BOLTはAP@50を32.3ポイントまで改善した。
論文 参考訳(メタデータ) (2026-05-01T04:53:50Z) - Spec Kit Agents: Context-Grounded Agentic Workflows [0.0]
Spec Kit AgentsはPMと開発者の役割を持つマルチエージェントSDDパイプラインである。
読み取り専用の調査フックは,各ステージにリポジトリのエビデンスを格納する。
検証フックは環境に対する中間成果物をチェックする。
論文 参考訳(メタデータ) (2026-04-07T00:26:49Z) - A Closer Look at Cross-Domain Few-Shot Object Detection: Fine-Tuning Matters and Parallel Decoder Helps [7.9629908861093766]
微調整時の一般化を高めるハイブリッドデコーダアンサンブルを提案する。
アンサンブル学習にインスパイアされたデコーダは、共有階層層と、複数の並列デコーダブランチから構成される。
この設計は、追加パラメータを導入することなく事前訓練された重みを完全に活用し、その結果の多様な予測を効果的に組み込んで一般化を改善することができる。
論文 参考訳(メタデータ) (2026-03-30T08:46:10Z) - IoUCert: Robustness Verification for Anchor-based Object Detectors [58.35703549470485]
IoUCertは、アンカーベースのオブジェクト検出アーキテクチャにおいて、これらのボトルネックを克服するために設計された、新しい形式的検証フレームワークである。
本手法は, SSD, YOLOv2, YOLOv3など, 現実的なアンカーベースモデルの各種入力摂動に対するロバスト性検証を可能にする。
論文 参考訳(メタデータ) (2026-03-03T14:36:46Z) - INSTINCT: Instance-Level Interaction Architecture for Query-Based Collaborative Perception [6.018757656052237]
協調認識システムは、マルチエージェントの知覚データを統合し、精度と安全性を向上させることで、単一車両の制限を克服する。
これまでの研究は、クエリベースのインスタンスレベルのインタラクションが帯域幅の要求と手作業による事前処理を減らすことを証明してきたが、協調認識におけるLiDARによる実装は未開発のままである。
InSTINCTは,(1)高品質なインスタンス特徴選択のための品質認識型フィルタリング機構,2)協調関連インスタンスと協調関連インスタンスを分離するデュアルブランチ検出ルーティングスキーム,3)クロスエージェントローカルインスタンスフュージョンモジュール,の3つのコアコンポーネントを特徴とする新しい協調認識フレームワークを提案する。
論文 参考訳(メタデータ) (2025-09-28T07:16:32Z) - CoBEVMoE: Heterogeneity-aware Feature Fusion with Dynamic Mixture-of-Experts for Collaborative Perception [21.27356211403264]
本稿では,バードアイビュー(Bird's Eye View, BEV)空間で動作する新しい協調認識フレームワークを提案する。
エキスパート間の多様性を高め、融合表現の識別性を向上させるために、ダイナミックエキスパートメトリックロス(DEML)を導入する。
論文 参考訳(メタデータ) (2025-09-21T14:56:05Z) - Agent KB: Leveraging Cross-Domain Experience for Agentic Problem Solving [62.71545696485824]
我々は,異種エージェントフレームワーク間のシームレスな体験共有を可能にするユニバーサルメモリ基盤であるAgent KBを紹介した。
Agent KBはトラジェクトリを構造化知識ベースに集約し、軽量APIを提供する。
我々は,GAIA,Humanity's Last Exam,GPQA,SWE-benchなどの主要フレームワークにまたがるエージェントを検証した。
論文 参考訳(メタデータ) (2025-07-08T17:59:22Z) - Improving Zero-Shot ObjectNav with Generative Communication [60.84730028539513]
ゼロショットObjectNavの改良手法を提案する。
私たちのアプローチは、接地エージェントが制限され、時には障害のあるビューを持つ可能性があることを考慮に入れています。
論文 参考訳(メタデータ) (2024-08-03T22:55:26Z) - Self-Localized Collaborative Perception [49.86110931859302]
我々は,新しい自己局在型協調認識システムであるMathttCoBEVGlue$を提案する。
$mathttCoBEVGlue$は、エージェント間の相対的なポーズを提供する新しい空間アライメントモジュールである。
$mathttCoBEVGlue$は任意のローカライゼーションノイズとアタックの下で最先端の検出性能を達成する。
論文 参考訳(メタデータ) (2024-06-18T15:26:54Z) - V2X-PC: Vehicle-to-everything Collaborative Perception via Point Cluster [58.79477191603844]
我々は,低レベル構造情報と高レベル意味情報を組み合わせて,シーンを疎結合に表現する新しいメッセージユニット,すなわちポイントクラスタを導入する。
このフレームワークには、オブジェクトの機能を維持し、帯域幅を管理するためのポイントクラスタパッキング(PCP)モジュールが含まれている。
2つの広く認識されている協調認識ベンチマークの実験は、従来の最先端の手法と比較して、我々の手法の優れた性能を示している。
論文 参考訳(メタデータ) (2024-03-25T11:24:02Z) - Unite-Divide-Unite: Joint Boosting Trunk and Structure for High-accuracy
Dichotomous Image Segmentation [48.995367430746086]
Dichotomous Image rendering (DIS) は、自然の風景からカテゴリーに依存しない前景の物体をピンポイントすることを目的としている。
本稿では, トランクと構造同定の有効性を高めるために, 相補的特徴を再構成し, 分割的に配置する, UDUN (Unite-Divide-Unite Network) を提案する。
1024*1024入力を用いて、ResNet-18で65.3fpsのリアルタイム推論を可能にする。
論文 参考訳(メタデータ) (2023-07-26T09:04:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。