Fugu-MT 論文翻訳(概要): 3DLG-Detector: 3D Object Detection via Simultaneous Local-Global Feature Learning

論文の概要: 3DLG-Detector: 3D Object Detection via Simultaneous Local-Global Feature Learning

arxiv url: http://arxiv.org/abs/2208.14796v1
Date: Wed, 31 Aug 2022 12:23:40 GMT
ステータス: 翻訳完了
システム内更新日: 2022-09-01 13:34:25.206260
Title: 3DLG-Detector: 3D Object Detection via Simultaneous Local-Global Feature Learning
Title（参考訳）: 3DLG-detector:局所的特徴学習による3次元物体検出
Authors: Baian Chen, Liangliang Nan, Haoran Xie, Dening Lu, Fu Lee Wang and Mingqiang Wei
Abstract要約: 不規則点雲の局所的・大域的特徴の捕獲は3次元物体検出に不可欠である(3OD) 本稿では,3ODを肯定的に利用するシーンポイント雲の局所的な特徴を同時に学習するモジュールについて検討する。局所的特徴学習(3DLG-Detector)を併用した効果的な3ODネットワークを提案する。
参考スコア（独自算出の注目度）: 15.995277437128452
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Capturing both local and global features of irregular point clouds is essential to 3D object detection (3OD). However, mainstream 3D detectors, e.g., VoteNet and its variants, either abandon considerable local features during pooling operations or ignore many global features in the whole scene context. This paper explores new modules to simultaneously learn local-global features of scene point clouds that serve 3OD positively. To this end, we propose an effective 3OD network via simultaneous local-global feature learning (dubbed 3DLG-Detector). 3DLG-Detector has two key contributions. First, it develops a Dynamic Points Interaction (DPI) module that preserves effective local features during pooling. Besides, DPI is detachable and can be incorporated into existing 3OD networks to boost their performance. Second, it develops a Global Context Aggregation module to aggregate multi-scale features from different layers of the encoder to achieve scene context-awareness. Our method shows improvements over thirteen competitors in terms of detection accuracy and robustness on both the SUN RGB-D and ScanNet datasets. Source code will be available upon publication.
Abstract（参考訳）: 不規則点雲の局所的特徴と大域的特徴の捕獲は、3次元物体検出(3OD)に不可欠である。しかし、VoteNetなどの主流の3D検出器は、プール操作中にかなりの局所的な特徴を放棄するか、シーン全体のグローバルな特徴を無視している。本稿では,3odを正に利用するシーンポイント雲の局所的グローバル特徴を同時に学習するモジュールについて検討する。そこで本研究では,局所的特徴学習(3DLG-Detector)による効果的な3ODネットワークを提案する。 3DLG-Detectorには2つの重要な貢献がある。まず、プール中の効果的なローカル機能を保存するDynamic Points Interaction (DPI)モジュールを開発する。さらにDPIは分離可能で、既存の3ODネットワークに組み込んでパフォーマンスを向上させることができる。第二に、エンコーダの異なるレイヤからマルチスケール機能を集約してシーンコンテキスト認識を実現するGlobal Context Aggregationモジュールを開発する。本手法は,SUN RGB-DデータセットとScanNetデータセットの両方において,検出精度とロバスト性の観点から,13の競合に対して改善を示す。ソースコードは公開時に入手できる。

関連論文リスト

PVAFN: Point-Voxel Attention Fusion Network with Multi-Pooling Enhancing for 3D Object Detection [59.355022416218624]
点とボクセルの表現の統合は、LiDARベースの3Dオブジェクト検出においてより一般的になりつつある。 PVAFN(Point-Voxel Attention Fusion Network)と呼ばれる新しい2段3次元物体検出器を提案する。 PVAFNはマルチプール戦略を使用して、マルチスケールとリージョン固有の情報を効果的に統合する。
論文参考訳（メタデータ） (2024-08-26T19:43:01Z)
Co-Fix3D: Enhancing 3D Object Detection with Collaborative Refinement [37.24731059950228]
運転シナリオにおける3次元物体検出は、複雑な道路環境の課題に直面している。我々はCo-Fix3Dと呼ばれる高度な検出フレームワークを提案する。 Co-Fix3DはLocal and Global Enhancement (LGE)モジュールを統合し、Bird's Eye View (BEV)機能を洗練する。
論文参考訳（メタデータ） (2024-08-15T07:56:02Z)
Rethinking 3D Dense Caption and Visual Grounding in A Unified Framework through Prompt-based Localization [51.33923845954759]
3Dビジュアルグラウンド(3DVG)と3Dキャプション(3DDC)は、様々な3Dアプリケーションにおいて2つの重要なタスクである。本稿では,これら2つの異なる,しかし密接に関連するタスクを協調的に解決する統合フレームワークである3DGCTRを提案する。実装面では、Lightweight Caption Headを既存の3DVGネットワークに統合し、Caption Text Promptを接続として使用する。
論文参考訳（メタデータ） (2024-04-17T04:46:27Z)
Surface-biased Multi-Level Context 3D Object Detection [1.9723551683930771]
本研究は,高効率表面偏光特性抽出法(wang2022rbgnet)を用いて3次元点雲中の物体検出タスクに対処する。本稿では,オブジェクト候補の正確な特徴表現を抽出し,点パッチやオブジェクト候補,グローバルシーンにおける自己注意を活用する3Dオブジェクト検出手法を提案する。
論文参考訳（メタデータ） (2023-02-13T11:50:04Z)
CAGroup3D: Class-Aware Grouping for 3D Object Detection on Point Clouds [55.44204039410225]
本稿では,CAGroup3Dという新しい2段階完全スパース3Dオブジェクト検出フレームワークを提案する。提案手法は,まず,オブジェクト表面のボクセル上でのクラス認識型局所群戦略を活用することによって,高品質な3D提案を生成する。不正なボクセルワイドセグメンテーションにより欠落したボクセルの特徴を回復するために,完全にスパースな畳み込み型RoIプールモジュールを構築した。
論文参考訳（メタデータ） (2022-10-09T13:38:48Z)
AGO-Net: Association-Guided 3D Point Cloud Object Detection Network [86.10213302724085]
ドメイン適応によるオブジェクトの無傷な特徴を関連付ける新しい3D検出フレームワークを提案する。我々は,KITTIの3D検出ベンチマークにおいて,精度と速度の両面で最新の性能を実現する。
論文参考訳（メタデータ） (2022-08-24T16:54:38Z)
The Devil is in the Task: Exploiting Reciprocal Appearance-Localization Features for Monocular 3D Object Detection [62.1185839286255]
低コストのモノクル3D物体検出は、自律運転において基本的な役割を果たす。 DFR-Netという動的特徴反射ネットワークを導入する。我々は、KITTIテストセットの全ての単分子3D物体検出器の中で、第1位にランク付けする。
論文参考訳（メタデータ） (2021-12-28T07:31:18Z)
LATFormer: Locality-Aware Point-View Fusion Transformer for 3D Shape Recognition [38.540048855119004]
そこで我々は,3次元形状検索と分類のためのLATFormer(Locality-Aware Point-View Fusion Transformer)を提案する。 LATFormerの中核となるコンポーネントはLocality-Aware Fusion (LAF) という名前のモジュールで、2つのモードにまたがる関連領域の局所的特徴を統合する。 LATFormerでは,LAFモジュールを用いて双方向および階層的に2つのモードのマルチスケール機能を融合し,より情報的な特徴を得る。
論文参考訳（メタデータ） (2021-09-03T03:23:27Z)
DH3D: Deep Hierarchical 3D Descriptors for Robust Large-Scale 6DoF Relocalization [56.15308829924527]
生の3D点から直接3次元特徴の検出と記述を共同で学習するシームズネットワークを提案する。 3次元キーポイントを検出するために,局所的な記述子の識別性を教師なしで予測する。各種ベンチマーク実験により,本手法はグローバルポイントクラウド検索とローカルポイントクラウド登録の両面で競合する結果が得られた。
論文参考訳（メタデータ） (2020-07-17T20:21:22Z)
D3Feat: Joint Learning of Dense Detection and Description of 3D Local Features [51.04841465193678]
私たちは3Dポイントクラウドに3D完全畳み込みネットワークを活用しています。本稿では,3次元点ごとに検出スコアと記述特徴の両方を密に予測する,新しい,実践的な学習機構を提案する。本手法は,屋内と屋外の両方のシナリオで最先端の手法を実現する。
論文参考訳（メタデータ） (2020-03-06T12:51:09Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。