論文の概要: Refine-and-Contrast: Adaptive Instance-Aware BEV Representations for Multi-UAV Collaborative Object Detection
- arxiv url: http://arxiv.org/abs/2508.12684v1
- Date: Mon, 18 Aug 2025 07:37:14 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-19 14:49:11.062363
- Title: Refine-and-Contrast: Adaptive Instance-Aware BEV Representations for Multi-UAV Collaborative Object Detection
- Title(参考訳): Refine-and-Contrast:マルチUAV協調物体検出のための適応型インスタンス対応BEV表現
- Authors: Zhongyao Li, Peirui Cheng, Liangjin Zhao, Chen Chen, Yundu Li, Zhechao Wang, Xue Yang, Xian Sun, Zhirui Wang,
- Abstract要約: 複数UAVコラボレーティブ3D検出は、空中プラットフォームからの多視点観測を融合させることにより、正確で堅牢な認識を可能にする。
本稿では,適応型インスタンス認識型BEV表現を洗練コントラストパラダイムにより学習する新しいフレームワークであるAdaBEVを紹介する。
- 参考スコア(独自算出の注目度): 15.494912154439367
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Multi-UAV collaborative 3D detection enables accurate and robust perception by fusing multi-view observations from aerial platforms, offering significant advantages in coverage and occlusion handling, while posing new challenges for computation on resource-constrained UAV platforms. In this paper, we present AdaBEV, a novel framework that learns adaptive instance-aware BEV representations through a refine-and-contrast paradigm. Unlike existing methods that treat all BEV grids equally, AdaBEV introduces a Box-Guided Refinement Module (BG-RM) and an Instance-Background Contrastive Learning (IBCL) to enhance semantic awareness and feature discriminability. BG-RM refines only BEV grids associated with foreground instances using 2D supervision and spatial subdivision, while IBCL promotes stronger separation between foreground and background features via contrastive learning in BEV space. Extensive experiments on the Air-Co-Pred dataset demonstrate that AdaBEV achieves superior accuracy-computation trade-offs across model scales, outperforming other state-of-the-art methods at low resolutions and approaching upper bound performance while maintaining low-resolution BEV inputs and negligible overhead.
- Abstract(参考訳): マルチUAVコラボレーティブな3D検出は、航空プラットフォームからの多視点観測を融合させることにより、正確で堅牢な認識を可能にし、カバーと閉塞処理において大きなアドバンテージを提供するとともに、資源制約されたUAVプラットフォーム上での計算に新たな課題を提起する。
本稿では,適応型インスタンス認識型BEV表現を洗練コントラストパラダイムにより学習する新しいフレームワークであるAdaBEVを提案する。
すべてのBEVグリッドを等しく扱う既存の方法とは異なり、AdaBEVは意味認識と特徴識別性を高めるために、Box-Guided Refinement Module (BG-RM) と Instance-Background Contrastive Learning (IBCL) を導入している。
BG-RMは2次元の監視と空間分割を用いて、前景のインスタンスに関連するBEVグリッドのみを洗練し、IBCLはBEV空間における対照的な学習を通じて、前景と背景の特徴のより強力な分離を促進する。
Air-Co-Predデータセットの大規模な実験により、AdaBEVはモデルスケール全体にわたって優れた精度計算トレードオフを実現し、低解像度で他の最先端手法よりも優れ、低解像度のBEV入力と無視可能なオーバーヘッドを維持しながら、上限のパフォーマンスに近づいた。
関連論文リスト
- BEVCon: Advancing Bird's Eye View Perception with Contrastive Learning [39.8617381331589]
本稿では,自律運転におけるバードアイビュー(BEV)知覚を改善するために設計された,対照的な学習フレームワークであるBEVConを紹介する。
BEVConは、最先端のベースラインよりも最大2.4%のmAP改善を達成し、一貫したパフォーマンス向上を実現している。
論文 参考訳(メタデータ) (2025-08-06T17:59:37Z) - LSSInst: Improving Geometric Modeling in LSS-Based BEV Perception with Instance Representation [10.434754671492723]
本稿では,BEVおよびインスタンス表現をタンデムに組み込んだ2段階物体検出器であるLSSInstを提案する。
提案した検出器は、既存のLSSベースのBEVネットワークに柔軟に統合可能な、きめ細かいピクセルレベルの特徴を利用する。
提案するフレームワークは,高性能な一般化能力と性能を備え,ベルやホイッスルを使わずに,現代のLSSベースのBEV認識手法の性能を向上させる。
論文 参考訳(メタデータ) (2024-11-09T13:03:54Z) - Benchmarking and Improving Bird's Eye View Perception Robustness in Autonomous Driving [55.93813178692077]
本稿では,BEVアルゴリズムのレジリエンスを評価するためのベンチマークスイートであるRoboBEVを紹介する。
検出,マップセグメンテーション,深さ推定,占有予測といったタスクにまたがる33の最先端のBEVベースの知覚モデルを評価する。
また, 事前学習や深度自由なBEVトランスフォーメーションなどの戦略が, アウト・オブ・ディストリビューションデータに対するロバスト性を高める上で有効であることを示す。
論文 参考訳(メタデータ) (2024-05-27T17:59:39Z) - DA-BEV: Unsupervised Domain Adaptation for Bird's Eye View Perception [104.87876441265593]
カメラのみのBird's Eye View (BEV)は3次元空間における環境認識に大きな可能性を示した。
非教師なし領域適応型BEVは、様々な未ラベル対象データから効果的に学習するが、まだ未探索である。
DA-BEVは、画像ビュー機能とBEV機能の相補性を利用して、ドメイン適応型BEV課題に対処する、最初のドメイン適応型カメラのみのBEVフレームワークである。
論文 参考訳(メタデータ) (2024-01-13T04:21:24Z) - Diffusion-Based Particle-DETR for BEV Perception [94.88305708174796]
Bird-Eye-View (BEV)は、自律走行車(AV)における視覚知覚のための最も広く使われているシーンの1つである。
近年の拡散法は、視覚知覚のための不確実性モデリングに有望なアプローチを提供するが、BEVの広い範囲において、小さな物体を効果的に検出することができない。
本稿では,BEVにおける拡散パラダイムと最先端の3Dオブジェクト検出器を組み合わせることで,この問題に対処する。
論文 参考訳(メタデータ) (2023-12-18T09:52:14Z) - FB-BEV: BEV Representation from Forward-Backward View Transformations [131.11787050205697]
本稿では,Bird-Eye-View (BEV) 表現のためのビュートランスフォーメーションモジュール (VTM) を提案する。
我々は提案したモジュールをFB-BEVでインスタンス化し、nuScenesテストセット上で62.4%のNDSの最先端結果を達成する。
論文 参考訳(メタデータ) (2023-08-04T10:26:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。