論文の概要: Pillar-Voxel Fusion Network for 3D Object Detection in Airborne Hyperspectral Point Clouds
- arxiv url: http://arxiv.org/abs/2504.09506v1
- Date: Sun, 13 Apr 2025 10:13:48 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-04-15 16:52:05.756360
- Title: Pillar-Voxel Fusion Network for 3D Object Detection in Airborne Hyperspectral Point Clouds
- Title(参考訳): 航空機搭載ハイパースペクトル点雲における3次元物体検出のためのピラー・ボクセル核融合ネットワーク
- Authors: Yanze Jiang, Yanfeng Gu, Xian Li,
- Abstract要約: 航空機搭載HPCのための3次元物体検出ネットワークPiV-A HPCを提案する。
我々はまず,HPCからスペクトルおよび垂直構造特徴を捕捉し,スペクトル歪みを克服するピラーボクセル二重分岐エンコーダを開発した。
2つのブランチ間の情報相互作用を強化するために,マルチレベル特徴融合機構が考案された。
- 参考スコア(独自算出の注目度): 35.24778377226701
- License:
- Abstract: Hyperspectral point clouds (HPCs) can simultaneously characterize 3D spatial and spectral information of ground objects, offering excellent 3D perception and target recognition capabilities. Current approaches for generating HPCs often involve fusion techniques with hyperspectral images and LiDAR point clouds, which inevitably lead to geometric-spectral distortions due to fusion errors and obstacle occlusions. These adverse effects limit their performance in downstream fine-grained tasks across multiple scenarios, particularly in airborne applications. To address these issues, we propose PiV-AHPC, a 3D object detection network for airborne HPCs. To the best of our knowledge, this is the first attempt at this HPCs task. Specifically, we first develop a pillar-voxel dual-branch encoder, where the former captures spectral and vertical structural features from HPCs to overcome spectral distortion, while the latter emphasizes extracting accurate 3D spatial features from point clouds. A multi-level feature fusion mechanism is devised to enhance information interaction between the two branches, achieving neighborhood feature alignment and channel-adaptive selection, thereby organically integrating heterogeneous features and mitigating geometric distortion. Extensive experiments on two airborne HPCs datasets demonstrate that PiV-AHPC possesses state-of-the-art detection performance and high generalization capability.
- Abstract(参考訳): ハイパースペクトル点雲(HPC)は、地上物体の3次元空間およびスペクトル情報を同時に特徴付けることができ、優れた3次元知覚と目標認識能力を提供する。
HPCを生成するための現在のアプローチは、しばしばハイパースペクトル画像とLiDAR点雲との融合技術を含む。
これらの悪影響は、特に空中アプリケーションにおいて、複数のシナリオにわたる下流のきめ細かいタスクのパフォーマンスを制限する。
これらの問題に対処するため,航空機搭載HPCのための3次元物体検出ネットワークPiV-AHPCを提案する。
私たちの知る限りでは、これがこのHPCタスクの最初の試みです。
具体的には、まず柱ボクセル二重分岐エンコーダを開発し、前者はスペクトルおよび垂直構造特徴をHPCからキャプチャしてスペクトル歪みを克服し、後者は点雲から正確な3次元空間特徴を抽出することを強調する。
近接特徴アライメントとチャネル適応選択を実現し、異種特徴を有機的に統合し、幾何歪みを緩和する多層特徴融合機構を考案した。
2つの航空機搭載HPCデータセットの大規模な実験により、PiV-AHPCは最先端検出性能と高一般化能力を有することが示された。
関連論文リスト
- DiffFormer: a Differential Spatial-Spectral Transformer for Hyperspectral Image Classification [3.271106943956333]
超スペクトル画像分類(HSIC)は、高次元データをスペクトル情報と空間情報で分析する可能性から注目されている。
本稿では、スペクトル冗長性や空間不連続性といったHSICの固有の課題に対処するために、差分空間スペクトル変換器(DiffFormer)を提案する。
ベンチマークハイパースペクトルデータセットの実験は、分類精度、計算効率、一般化可能性の観点から、DiffFormerの優位性を示す。
論文 参考訳(メタデータ) (2024-12-23T07:21:41Z) - PVAFN: Point-Voxel Attention Fusion Network with Multi-Pooling Enhancing for 3D Object Detection [59.355022416218624]
点とボクセルの表現の統合は、LiDARベースの3Dオブジェクト検出においてより一般的になりつつある。
PVAFN(Point-Voxel Attention Fusion Network)と呼ばれる新しい2段3次元物体検出器を提案する。
PVAFNはマルチプール戦略を使用して、マルチスケールとリージョン固有の情報を効果的に統合する。
論文 参考訳(メタデータ) (2024-08-26T19:43:01Z) - Towards High-resolution 3D Anomaly Detection via Group-Level Feature Contrastive Learning [45.21394843710758]
高分解能点雲(HRPCD)異常検出(AD)は、精密加工およびハイエンド機器製造において重要な役割を担っている。
最近提案された多くの3D-ADメソッドにもかかわらず、HRPCD-ADタスクの要件を満たすことはできない。
本稿では,グループレベルの特徴ベースネットワークであるGroup3ADを提案する。
論文 参考訳(メタデータ) (2024-08-08T17:24:03Z) - Cross-Cluster Shifting for Efficient and Effective 3D Object Detection
in Autonomous Driving [69.20604395205248]
本稿では,自律運転における3次元物体検出のための3次元点検出モデルであるShift-SSDを提案する。
我々は、ポイントベース検出器の表現能力を解き放つために、興味深いクロスクラスタシフト操作を導入する。
我々は、KITTI、ランタイム、nuScenesデータセットに関する広範な実験を行い、Shift-SSDの最先端性能を実証した。
論文 参考訳(メタデータ) (2024-03-10T10:36:32Z) - PointHPS: Cascaded 3D Human Pose and Shape Estimation from Point Clouds [99.60575439926963]
本稿では,実環境で捉えた点雲から正確な3次元HPSを実現するための基本的フレームワークであるPointHPSを提案する。
PointHPSは、カスケードアーキテクチャを通じてポイント機能を反復的に洗練する。
広範囲な実験により、ポイントHPSは強力な特徴抽出と処理方式を持ち、State-of-the-Art法より優れていることが示された。
論文 参考訳(メタデータ) (2023-08-28T11:10:14Z) - OPA-3D: Occlusion-Aware Pixel-Wise Aggregation for Monocular 3D Object
Detection [51.153003057515754]
OPA-3Dは、Occlusion-Aware Pixel-Wise Aggregationネットワークである。
密集した風景深度と、奥行きのある箱残量と物の境界箱を共同で推定する。
メインカーのカテゴリーでは最先端の手法よりも優れています。
論文 参考訳(メタデータ) (2022-11-02T14:19:13Z) - Homogeneous Multi-modal Feature Fusion and Interaction for 3D Object
Detection [16.198358858773258]
マルチモーダル3D物体検出は、自律運転において活発な研究課題となっている。
スパース3D点と高密度2Dピクセルの相互特徴融合を探索するのは簡単ではない。
最近のアプローチでは、画像特徴と2次元画像平面に投影される点雲の特徴を融合させるか、スパース点雲と高密度画像画素を組み合わせるかのどちらかである。
論文 参考訳(メタデータ) (2022-10-18T06:15:56Z) - On Robust Cross-View Consistency in Self-Supervised Monocular Depth Estimation [56.97699793236174]
本論文では,2種類の堅牢なクロスビュー整合性について検討する。
深度特徴空間と3次元ボクセル空間の時間的コヒーレンスを自己教師付き単眼深度推定に利用した。
いくつかのアウトドアベンチマークの実験結果から,本手法は最先端技術より優れていることが示された。
論文 参考訳(メタデータ) (2022-09-19T03:46:13Z) - Cross-Modality 3D Object Detection [63.29935886648709]
本稿では,3次元物体検出のための新しい2段階多モード融合ネットワークを提案する。
アーキテクチャ全体が2段階の融合を促進する。
KITTIデータセットを用いた実験により,提案したマルチステージ融合により,ネットワークがより良い表現を学習できることが示唆された。
論文 参考訳(メタデータ) (2020-08-16T11:01:20Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。