論文の概要: Unsupervised Machine Learning for Detecting and Locating Human-Made Objects in 3D Point Cloud
- arxiv url: http://arxiv.org/abs/2410.20006v1
- Date: Fri, 25 Oct 2024 23:20:57 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-10-29 12:19:14.250733
- Title: Unsupervised Machine Learning for Detecting and Locating Human-Made Objects in 3D Point Cloud
- Title(参考訳): 3Dポイントクラウドにおける人手物体の検出と位置決定のための教師なし機械学習
- Authors: Hong Zhao, Huyunting Huang, Tonglin Zhang, Baijian Yang, Jin Wei-Kocsis, Songlin Fei,
- Abstract要約: 本研究は,自然木構造中の人工物の検出と同定という,新しい課題を紹介する。
提案手法は, 地中フィルタリング, 局所情報抽出, クラスタリングの3段階からなる。
実験により,提案手法は従来の手法よりも優れた性能を示した。
- 参考スコア(独自算出の注目度): 4.325161601374467
- License:
- Abstract: A 3D point cloud is an unstructured, sparse, and irregular dataset, typically collected by airborne LiDAR systems over a geological region. Laser pulses emitted from these systems reflect off objects both on and above the ground, resulting in a dataset containing the longitude, latitude, and elevation of each point, as well as information about the corresponding laser pulse strengths. A widely studied research problem, addressed in many previous works, is ground filtering, which involves partitioning the points into ground and non-ground subsets. This research introduces a novel task: detecting and identifying human-made objects amidst natural tree structures. This task is performed on the subset of non-ground points derived from the ground filtering stage. Marked Point Fields (MPFs) are used as models well-suited to these tasks. The proposed methodology consists of three stages: ground filtering, local information extraction (LIE), and clustering. In the ground filtering stage, a statistical method called One-Sided Regression (OSR) is introduced, addressing the limitations of prior ground filtering methods on uneven terrains. In the LIE stage, unsupervised learning methods are lacking. To mitigate this, a kernel-based method for the Hessian matrix of the MPF is developed. In the clustering stage, the Gaussian Mixture Model (GMM) is applied to the results of the LIE stage to partition the non-ground points into trees and human-made objects. The underlying assumption is that LiDAR points from trees exhibit a three-dimensional distribution, while those from human-made objects follow a two-dimensional distribution. The Hessian matrix of the MPF effectively captures this distinction. Experimental results demonstrate that the proposed ground filtering method outperforms previous techniques, and the LIE method successfully distinguishes between points representing trees and human-made objects.
- Abstract(参考訳): 3Dポイント・クラウド(英: 3D Point cloud)は、地質学的領域を飛行するLiDARシステムによって収集される、非構造的でスパースで不規則なデータセットである。
これらの系から放出されるレーザーパルスは、地上と地上の両方で物体を反射し、それぞれの点の経度、緯度、高度、および対応するレーザーパルス強度に関する情報を含むデータセットを生成する。
これまでの多くの研究で取り上げられた研究課題はグラウンドフィルタリングであり、ポイントをグラウンドサブセットと非グラウンドサブセットに分割するものである。
本研究は,自然木構造中の人工物の検出と同定という,新しい課題を紹介する。
この処理は、基底フィルタリング段階から派生した非基底点のサブセット上で実行される。
マーク付きポイントフィールド(MPF)はこれらのタスクに適したモデルとして使用される。
提案手法は, 地中フィルタリング, 局所情報抽出 (LIE) , クラスタリングの3段階からなる。
地中ろ過の段階では, 従来地中ろ過手法の限界に対処するため, 1-Sided Regression (OSR) と呼ばれる統計手法が導入された。
LIEの段階では、教師なしの学習方法が不足している。
これを軽減するために,MPFのヘッセン行列のカーネルベースの手法を開発した。
クラスタリング段階では、LIEステージの結果に対してガウス混合モデル(GMM)を適用し、非地上点を木と人造物体に分割する。
根底にある前提は、木からのLiDAR点が3次元分布を示すのに対して、人造物体からの点が2次元分布に従うことである。
MPFのヘッセン行列はこの区別を効果的に捉えている。
実験の結果,提案手法は従来の手法よりも優れた性能を示し,LIE法は木と人造物体の点の識別に成功している。
関連論文リスト
- Weakly-supervised Contrastive Learning for Unsupervised Object Discovery [52.696041556640516]
ジェネリックな方法でオブジェクトを発見できるため、教師なしのオブジェクト発見は有望である。
画像から高レベルな意味的特徴を抽出する意味誘導型自己教師学習モデルを設計する。
オブジェクト領域のローカライズのための主成分分析(PCA)を導入する。
論文 参考訳(メタデータ) (2023-07-07T04:03:48Z) - 3DMODT: Attention-Guided Affinities for Joint Detection & Tracking in 3D
Point Clouds [95.54285993019843]
本稿では,3次元点雲における複数物体の同時検出と追跡手法を提案する。
本モデルでは,複数のフレームを用いた時間情報を利用してオブジェクトを検出し,一つのネットワーク上で追跡する。
論文 参考訳(メタデータ) (2022-11-01T20:59:38Z) - OccAM's Laser: Occlusion-based Attribution Maps for 3D Object Detectors
on LiDAR Data [8.486063950768694]
本稿では,LiDAR点雲における3次元物体検出のための属性マップを生成する手法を提案する。
これらのマップは、特定のオブジェクトを予測する上で、各3Dポイントの重要性を示している。
本稿では,属性マップの詳細な評価を行い,それらが解釈可能かつ高情報であることを示す。
論文 参考訳(メタデータ) (2022-04-13T18:00:30Z) - Learning-based Point Cloud Registration for 6D Object Pose Estimation in
the Real World [55.7340077183072]
我々は、ポイントクラウドデータからオブジェクトの6Dポーズを推定するタスクに取り組む。
この課題に対処する最近の学習ベースのアプローチは、合成データセットにおいて大きな成功を収めている。
これらの障害の原因を分析し、ソースとターゲットポイントの雲の特徴分布の違いに遡る。
論文 参考訳(メタデータ) (2022-03-29T07:55:04Z) - Weakly Supervised Object Localization as Domain Adaption [19.854125742336688]
弱教師付きオブジェクトローカライゼーション(WSOL)は、画像レベルの分類マスクの監督のみでオブジェクトをローカライズすることに焦点を当てる。
従来のWSOL手法の多くは、MIL(Multi-instance Learning)機構を用いて分類構造に基づいてオブジェクトをローカライズする分類活性化マップ(CAM)に従っている。
この研究は、WSOLをドメイン適応(DA)タスクとしてモデル化する、新しい視点を提供する。そこでは、ソース/イメージドメインでトレーニングされたスコア推定器がターゲット/ピクセルドメイン上でテストされ、オブジェクトを見つける。
論文 参考訳(メタデータ) (2022-03-03T13:50:22Z) - SASA: Semantics-Augmented Set Abstraction for Point-based 3D Object
Detection [78.90102636266276]
SASA(Semantics-Augmented Set Abstraction)と呼ばれる新しい集合抽象化手法を提案する。
そこで本研究では, 推定点前景スコアに基づいて, より重要な前景点の維持を支援するセマンティックス誘導点サンプリングアルゴリズムを提案する。
実際には、SASAは、前景オブジェクトに関連する貴重な点を識別し、ポイントベースの3D検出のための特徴学習を改善するのに有効である。
論文 参考訳(メタデータ) (2022-01-06T08:54:47Z) - PLUME: Efficient 3D Object Detection from Stereo Images [95.31278688164646]
既存の手法では、2つのステップでこの問題に対処する: 第一深度推定を行い、その深さ推定から擬似LiDAR点雲表現を計算し、3次元空間で物体検出を行う。
この2つのタスクを同一のメトリック空間で統一するモデルを提案する。
提案手法は,既存の手法と比較して推定時間を大幅に削減し,挑戦的なKITTIベンチマークの最先端性能を実現する。
論文 参考訳(メタデータ) (2021-01-17T05:11:38Z) - Campus3D: A Photogrammetry Point Cloud Benchmark for Hierarchical
Understanding of Outdoor Scene [76.4183572058063]
複数の屋外シーン理解タスクに対して,リッチな注釈付き3Dポイントクラウドデータセットを提案する。
データセットは階層型ラベルとインスタンスベースのラベルの両方でポイントワイズアノテートされている。
本稿では,3次元点雲分割のための階層的学習問題を定式化し,様々な階層間の整合性を評価することを提案する。
論文 参考訳(メタデータ) (2020-08-11T19:10:32Z) - Unsupervised Learning for Subterranean Junction Recognition Based on 2D
Point Cloud [3.8532191223676517]
本稿では, 獲得した2次元点雲に基づいて地下環境におけるトンネル接合数を検出するための, 教師なし学習フレームワークを提案する。
我々は,複数の現実的なシミュレーションや地下環境の実際の飛行から収集した複数のデータセットを用いて,開発フレームワークを検証した。
論文 参考訳(メタデータ) (2020-06-07T18:36:56Z) - A Nearest Neighbor Network to Extract Digital Terrain Models from 3D
Point Clouds [1.6249267147413524]
本稿では,3Dポイントのクラウド上で動作し,エンド・ツー・エンドのアプローチを用いてシーンの基盤となるDTMを推定するアルゴリズムを提案する。
我々のモデルは近隣情報を学習し、これをポイントワイドでブロックワイドなグローバルな特徴とシームレスに統合する。
論文 参考訳(メタデータ) (2020-05-21T15:54:55Z) - Scan-based Semantic Segmentation of LiDAR Point Clouds: An Experimental
Study [2.6205925938720833]
最先端の手法では、深いニューラルネットワークを使用して、LiDARスキャンの各点のセマンティッククラスを予測する。
LiDAR測定を処理するための強力で効率的な方法は、2次元の画像のような投影を使うことである。
メモリの制約だけでなく、パフォーマンスの向上やランタイムの改善など、さまざまなテクニックを実証する。
論文 参考訳(メタデータ) (2020-04-06T11:08:12Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。