論文の概要: Long-SCOPE: Fully Sparse Long-Range Cooperative 3D Perception
- arxiv url: http://arxiv.org/abs/2604.09206v1
- Date: Fri, 10 Apr 2026 10:47:49 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-13 17:57:53.827814
- Title: Long-SCOPE: Fully Sparse Long-Range Cooperative 3D Perception
- Title(参考訳): Long-SCOPE:完全スパースロングラウンジ3D知覚
- Authors: Jiahao Wang, Zikun Xu, Yuner Zhang, Zhongwei Jiang, Chenyang Lu, Shuocheng Yang, Yuxuan Wang, Jiaru Zhong, Chuang Zhang, Shaobing Xu, Jianqiang Wang,
- Abstract要約: Long-SCOPEは、堅牢な長距離協調3D知覚のために設計された完全にスパースなフレームワークである。
提案手法は,小さなオブジェクトを正確に検出するGeometry-Guided Query Generationモジュールと,協調クエリを堅牢にマッチングする学習可能なContext-Aware Associationモジュールの2つの新しいコンポーネントを特徴とする。
V2X-SeqデータセットとGriffinデータセットの実験は、特に100~150mの長距離設定に挑戦して、Long-SCOPEが最先端のパフォーマンスを達成することを検証する。
- 参考スコア(独自算出の注目度): 22.880970790986357
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Cooperative 3D perception via Vehicle-to-Everything communication is a promising paradigm for enhancing autonomous driving, offering extended sensing horizons and occlusion resolution. However, the practical deployment of existing methods is hindered at long distances by two critical bottlenecks: the quadratic computational scaling of dense BEV representations and the fragility of feature association mechanisms under significant observation and alignment errors. To overcome these limitations, we introduce Long-SCOPE, a fully sparse framework designed for robust long-distance cooperative 3D perception. Our method features two novel components: a Geometry-guided Query Generation module to accurately detect small, distant objects, and a learnable Context-Aware Association module that robustly matches cooperative queries despite severe positional noise. Experiments on the V2X-Seq and Griffin datasets validate that Long-SCOPE achieves state-of-the-art performance, particularly in challenging 100-150 m long-range settings, while maintaining highly competitive computation and communication costs.
- Abstract(参考訳): 車両間通信による協調的な3次元認識は、自律運転の強化に有望なパラダイムであり、拡張された測光地平線とオクルージョン分解を提供する。
しかし、既存の手法の実践的な展開は、高密度なBEV表現の2次計算スケーリングと、重要な観察およびアライメントエラーの下での特徴関連機構の脆弱さという、2つの重要なボトルネックによって、長距離で妨げられている。
これらの制約を克服するために,長距離協調3次元認識のための完全スパースフレームワークであるLong-SCOPEを導入する。
提案手法では,小さなオブジェクトを正確に検出するGeometry-Guided Query Generationモジュールと,厳密な位置雑音にもかかわらず協調クエリを頑健にマッチングする学習可能なContext-Aware Associationモジュールの2つの新しいコンポーネントを特徴とする。
V2X-SeqデータセットとGriffinデータセットの実験は、特に100~150mの長距離設定に挑戦しながら、高い競争力のある計算と通信コストを維持しながら、Long-SCOPEが最先端のパフォーマンスを達成することを実証している。
関連論文リスト
- DecoVLN: Decoupling Observation, Reasoning, and Correction for Vision-and-Language Navigation [49.233063630722334]
長距離ナビゲーションにおけるロバストなストリーミング認識と閉ループ制御のためのフレームワークであるDecoVLNを提案する。
本稿では,統合されたスコアリング関数を反復的に最適化することにより,過去の候補プールからフレームを選択する適応的精錬機構を提案する。
また,コンプレックスエラーを軽減するために,状態-作用ペアレベルの補正手法を導入する。
論文 参考訳(メタデータ) (2026-03-13T16:24:37Z) - S2AM3D: Scale-controllable Part Segmentation of 3D Point Cloud [53.23686565523385]
本稿では,S2AM3Dを提案する。
我々は、ネイティブな3Dコントラスト学習を通じて、多視点2D特徴を集約する点一貫性部分エンコーダを設計する。
次に、セグメント化粒度のリアルタイムな調整を可能にするために、スケール対応プロンプトデコーダを提案する。
論文 参考訳(メタデータ) (2025-11-30T17:32:54Z) - MCOP: Multi-UAV Collaborative Occupancy Prediction [40.58729551462363]
Current Bird's Eye View (BEV)ベースのアプローチには2つの大きな制限がある。
本稿では,複数UAV共同占有予測フレームワークを提案する。
提案手法は最先端の精度を達成し,既存の協調手法を著しく上回っている。
論文 参考訳(メタデータ) (2025-10-14T16:17:42Z) - SparseAlign: A Fully Sparse Framework for Cooperative Object Detection [38.96043178218958]
完全スパースフレームワークであるSparseAlignを、拡張されたスパース3Dバックボーン、クエリベースの時間文脈学習モジュール、スパース機能に特化された堅牢な検出ヘッドの3つの主要な特徴で設計する。
我々のフレームワークは、その拡張性にも拘わらず、通信帯域幅の少ない技術よりも優れています。
論文 参考訳(メタデータ) (2025-03-17T09:38:53Z) - SFMNet: Sparse Focal Modulation for 3D Object Detection [11.19540223578237]
SFMNetは、スパース畳み込みの効率と長距離依存をモデル化する能力を組み合わせた、新しい3次元スパース検出器である。
そこで本研究では,自律走行データセットの最先端性能について述べる。
論文 参考訳(メタデータ) (2025-03-15T11:40:58Z) - GEAL: Generalizable 3D Affordance Learning with Cross-Modal Consistency [50.11520458252128]
既存の3Dアベイランス学習手法は、注釈付きデータに制限があるため、一般化と堅牢性に苦慮している。
本稿では,大規模事前学習型2Dモデルを活用することで,3次元アベイランス学習の一般化と堅牢性を高めるための新しいフレームワークであるGEALを提案する。
GEALは、既存のメソッドと、新しいオブジェクトカテゴリ、および破損したデータにおいて、一貫して優れています。
論文 参考訳(メタデータ) (2024-12-12T17:59:03Z) - Cross-Cluster Shifting for Efficient and Effective 3D Object Detection
in Autonomous Driving [69.20604395205248]
本稿では,自律運転における3次元物体検出のための3次元点検出モデルであるShift-SSDを提案する。
我々は、ポイントベース検出器の表現能力を解き放つために、興味深いクロスクラスタシフト操作を導入する。
我々は、KITTI、ランタイム、nuScenesデータセットに関する広範な実験を行い、Shift-SSDの最先端性能を実証した。
論文 参考訳(メタデータ) (2024-03-10T10:36:32Z) - SiCP: Simultaneous Individual and Cooperative Perception for 3D Object Detection in Connected and Automated Vehicles [18.23919432049492]
連結車両と自動車両の協調認識は、伝統的に2台以上の車両の特徴マップの融合によって達成される。
この欠点は、車両資源が2つの知覚モデルを同時に使用するには不十分なため、協調的な知覚の採用を妨げる。
我々は、最先端のスタンドアロン認識バックボーンを幅広くサポートする汎用フレームワークである、同時個人協調知覚(SiCP)を提示する。
論文 参考訳(メタデータ) (2023-12-08T04:12:26Z) - Rethinking Lightweight Salient Object Detection via Network Depth-Width
Tradeoff [26.566339984225756]
既存の有能なオブジェクト検出手法では、より深いネットワークが採用され、性能が向上する。
本稿では,U字形構造を3つの相補枝に分解することで,新しい3方向デコーダフレームワークを提案する。
提案手法は,5つのベンチマークにおいて効率と精度のバランスが良くなることを示す。
論文 参考訳(メタデータ) (2023-01-17T03:43:25Z) - Ret3D: Rethinking Object Relations for Efficient 3D Object Detection in
Driving Scenes [82.4186966781934]
Ret3Dと呼ばれるシンプルで効率的で効果的な2段階検出器を導入する。
Ret3Dの中核は、新しいフレーム内およびフレーム間関係モジュールの利用である。
無視できる余分なオーバーヘッドにより、Ret3Dは最先端のパフォーマンスを達成する。
論文 参考訳(メタデータ) (2022-08-18T03:48:58Z) - Homography Loss for Monocular 3D Object Detection [54.04870007473932]
ホログラフィーロス(Homography Loss)と呼ばれる,2次元情報と3次元情報の両方を利用する識別可能なロス関数を提案する。
提案手法は,KITTI 3Dデータセットにおいて,他の最先端技術と比較して高い性能を示す。
論文 参考訳(メタデータ) (2022-04-02T03:48:03Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。