Fugu-MT 論文翻訳(概要): Weighted Bayesian Gaussian Mixture Model for Roadside LiDAR Object Detection

論文の概要: Weighted Bayesian Gaussian Mixture Model for Roadside LiDAR Object Detection

arxiv url: http://arxiv.org/abs/2204.09804v4
Date: Fri, 24 Mar 2023 06:22:03 GMT
ステータス: 翻訳完了
システム内更新日: 2023-03-27 18:49:41.453368
Title: Weighted Bayesian Gaussian Mixture Model for Roadside LiDAR Object Detection
Title（参考訳）: 道路側LiDAR物体検出のための重み付きベイズガウス混合モデル
Authors: Tianya Zhang, Yi Ge, Peter J. Jin
Abstract要約: 背景モデリングは、静的な背景成分を減じることで移動目標を検出するインテリジェントな監視システムに広く利用されている。多くの道路沿いのLiDARオブジェクト検出手法は、新しいデータポイントと事前訓練されたバックグラウンド参照を比較して前景点をフィルタリングする。本稿では,各LiDAR点の標高と方位値に基づいて,生のLiDARデータを構造化表現に変換する。提案手法は,2つの最先端の道路背景モデル,コンピュータビジョンベンチマーク,深層学習ベースラインを比較し,交通量と難易度で評価された点,対象,経路レベルを比較した。
参考スコア（独自算出の注目度）: 0.5156484100374059
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Background modeling is widely used for intelligent surveillance systems to detect moving targets by subtracting the static background components. Most roadside LiDAR object detection methods filter out foreground points by comparing new data points to pre-trained background references based on descriptive statistics over many frames (e.g., voxel density, number of neighbors, maximum distance). However, these solutions are inefficient under heavy traffic, and parameter values are hard to transfer from one scenario to another. In early studies, the probabilistic background modeling methods widely used for the video-based system were considered unsuitable for roadside LiDAR surveillance systems due to the sparse and unstructured point cloud data. In this paper, the raw LiDAR data were transformed into a structured representation based on the elevation and azimuth value of each LiDAR point. With this high-order tensor representation, we break the barrier to allow efficient high-dimensional multivariate analysis for roadside LiDAR background modeling. The Bayesian Nonparametric (BNP) approach integrates the intensity value and 3D measurements to exploit the measurement data using 3D and intensity info entirely. The proposed method was compared against two state-of-the-art roadside LiDAR background models, computer vision benchmark, and deep learning baselines, evaluated at point, object, and path levels under heavy traffic and challenging weather. This multimodal Weighted Bayesian Gaussian Mixture Model (GMM) can handle dynamic backgrounds with noisy measurements and substantially enhances the infrastructure-based LiDAR object detection, whereby various 3D modeling for smart city applications could be created.
Abstract（参考訳）: 背景モデリングは、静的な背景成分を減じることで移動目標を検出するインテリジェントな監視システムに広く利用されている。多くの道端lidarオブジェクト検出手法は、多くのフレーム(ボクセル密度、近傍数、最大距離など)の記述統計に基づいて、新しいデータポイントと事前訓練された背景参照を比較して、前景ポイントをフィルタリングする。しかし、これらのソリューションは高トラフィック下では非効率であり、パラメータ値はあるシナリオから別のシナリオへの転送が困難である。初期の研究では、ビデオベースシステムに広く用いられている確率論的背景モデリング手法は、疎小で非構造化のクラウドデータのため、ロードサイドのLiDAR監視システムには適していないと考えられていた。本稿では,各LiDAR点の標高と方位値に基づいて,生のLiDARデータを構造化表現に変換する。この高次テンソル表現により、道路側LiDAR背景モデリングのための効率的な高次元多変量解析を可能にする障壁を破る。ベイズ非パラメトリック(BNP)アプローチは、強度値と3D計測を統合し、3Dと強度情報を完全に活用する。提案手法は,2つの最先端の道路背景モデル,コンピュータビジョンベンチマーク,深層学習ベースラインを比較し,交通量と難易度で評価された点,対象,経路レベルを比較した。このマルチモーダル重み付きベイズ混合モデル(GMM)は、ノイズ測定により動的バックグラウンドを処理でき、インフラベースのLiDARオブジェクト検出を大幅に強化し、スマートシティアプリケーションのための様々な3Dモデリングを作成することができる。

関連論文リスト

A Fully Interpretable Statistical Approach for Roadside LiDAR Background Subtraction [3.9354551232038]
道路側LiDARデータにおける背景部分抽出のための完全解釈可能かつ柔軟な統計的手法を提案する。マルチライン360度およびマイクロエレクトロメカニカルシステム(MEMS)センサーを含む多様なLiDARタイプをサポートする。最小のバックグラウンドデータであっても、精度と柔軟性において最先端の技術よりも優れています。
論文参考訳（メタデータ） (2025-10-25T18:18:10Z)
Approaching Outside: Scaling Unsupervised 3D Object Detection from 2D Scene [22.297964850282177]
教師なし3次元検出のためのLiDAR-2D Self-paced Learning (LiSe)を提案する。 RGB画像は、正確な2Dローカライゼーションキューを提供するLiDARデータの貴重な補完となる。本フレームワークでは,適応型サンプリングと弱いモデルアグリゲーション戦略を組み込んだ自己評価学習パイプラインを考案する。
論文参考訳（メタデータ） (2024-07-11T14:58:49Z)
VFMM3D: Releasing the Potential of Image by Vision Foundation Model for Monocular 3D Object Detection [80.62052650370416]
モノクル3Dオブジェクト検出は、自律運転やロボティクスなど、さまざまなアプリケーションにおいて重要な役割を担っている。本稿では,VFMM3Dを提案する。VFMM3Dは,ビジョンファウンデーションモデル(VFM)の機能を利用して,単一ビュー画像を正確にLiDARポイントクラウド表現に変換する,革新的なフレームワークである。
論文参考訳（メタデータ） (2024-04-15T03:12:12Z)
OccNeRF: Advancing 3D Occupancy Prediction in LiDAR-Free Environments [77.0399450848749]
本稿では,OccNeRF法を用いて,3次元監視なしで占有ネットワークを訓練する手法を提案する。我々は、再構成された占有領域をパラメータ化し、サンプリング戦略を再編成し、カメラの無限知覚範囲に合わせる。意味的占有予測のために,事前学習した開語彙2Dセグメンテーションモデルの出力をフィルタリングし,プロンプトを洗練するためのいくつかの戦略を設計する。
論文参考訳（メタデータ） (2023-12-14T18:58:52Z)
LiDAR Data Synthesis with Denoising Diffusion Probabilistic Models [1.1965844936801797]
3D LiDARデータの生成モデリングは、自律移動ロボットに有望な応用をもたらす新たな課題である。我々は,多種多様かつ高忠実な3Dシーンポイント雲を生成可能な,LiDARデータのための新しい生成モデルR2DMを提案する。本手法は拡散確率モデル (DDPM) を用いて構築され, 生成モデルフレームワークにおいて顕著な結果が得られた。
論文参考訳（メタデータ） (2023-09-17T12:26:57Z)
Optimal Transport for Change Detection on LiDAR Point Clouds [16.552050876277242]
空気中LiDARデータポイント間の教師なし変更検出は,取得システムからの空間的支持とノイズのアンマッチが困難である。本稿では,2つの時間的支援による3次元LiDAR点の移動の計算に基づく教師なしアプローチを提案する。本手法では,教師なしの階層分類が可能であり,従来の最先端の教師なし手法よりも有意な差で性能が向上する。
論文参考訳（メタデータ） (2023-02-14T13:08:07Z)
Normal Transformer: Extracting Surface Geometry from LiDAR Points Enhanced by Visual Semantics [7.507853813361308]
本稿では,LiDARとカメラセンサから得られた3次元点雲と2次元カラー画像を利用して表面正規化を行うマルチモーダル手法を提案する。本稿では,視覚的意味論と3次元幾何学的情報を巧みに融合した,トランスフォーマーに基づくニューラルネットワークアーキテクチャを提案する。交通シーンを模倣したシミュレーション3D環境から,提案モデルが学習可能であることが確認された。
論文参考訳（メタデータ） (2022-11-19T03:55:09Z)
Boosting 3D Object Detection by Simulating Multimodality on Point Clouds [51.87740119160152]
本稿では,LiDAR 画像検出器に追従する特徴や応答をシミュレートすることで,単一モダリティ (LiDAR) 3次元物体検出器を高速化する新しい手法を提案する。このアプローチでは、単一モダリティ検出器をトレーニングする場合のみ、LiDARイメージデータを必要とし、十分にトレーニングされた場合には、推論時にのみLiDARデータが必要である。 nuScenesデータセットの実験結果から,本手法はSOTA LiDARのみの3D検出器よりも優れていることがわかった。
論文参考訳（メタデータ） (2022-06-30T01:44:30Z)
Dense Voxel Fusion for 3D Object Detection [10.717415797194896]
ボクセル融合 (Voxel Fusion, DVF) は, 多スケール密度ボクセル特徴表現を生成する逐次融合法である。地上の真理2Dバウンディングボックスラベルを直接トレーニングし、ノイズの多い検出器固有の2D予測を避けます。提案したマルチモーダルトレーニング戦略は, 誤った2次元予測を用いたトレーニングに比べ, より一般化できることを示す。
論文参考訳（メタデータ） (2022-03-02T04:51:31Z)
MonoDistill: Learning Spatial Features for Monocular 3D Object Detection [80.74622486604886]
本稿では,LiDAR信号からの空間情報を単分子3D検出器に導入するための簡易かつ効果的な手法を提案する。得られたデータを用いて、ベースラインモデルと同じアーキテクチャで3D検出器をトレーニングする。実験の結果,提案手法はベースラインモデルの性能を大幅に向上させることができることがわかった。
論文参考訳（メタデータ） (2022-01-26T09:21:41Z)
Roadside Lidar Vehicle Detection and Tracking Using Range And Intensity Background Subtraction [0.0]
本稿では,2つの教師なし学習アルゴリズムを組み合わせた道路側LiDAR物体検出手法を提案する。この手法は商用トラフィックデータ収集プラットフォームに対して検証された。
論文参考訳（メタデータ） (2022-01-13T00:54:43Z)
Depth-conditioned Dynamic Message Propagation for Monocular 3D Object Detection [86.25022248968908]
モノラル3Dオブジェクト検出の問題を解決するために、コンテキストと奥行きを認識する特徴表現を学びます。 KITTIベンチマークデータセットにおける単眼的アプローチにおける最新の結果を示す。
論文参考訳（メタデータ） (2021-03-30T16:20:24Z)
SelfVoxeLO: Self-supervised LiDAR Odometry with Voxel-based Deep Neural Networks [81.64530401885476]
本稿では,これら2つの課題に対処するために,自己教師型LiDARオドメトリー法(SelfVoxeLO)を提案する。具体的には、生のLiDARデータを直接処理する3D畳み込みネットワークを提案し、3D幾何パターンをよりよく符号化する特徴を抽出する。我々は,KITTIとApollo-SouthBayという2つの大規模データセット上での手法の性能を評価する。
論文参考訳（メタデータ） (2020-10-19T09:23:39Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。