論文の概要: Classifying Objects in 3D Point Clouds Using Recurrent Neural Network: A GRU LSTM Hybrid Approach
- arxiv url: http://arxiv.org/abs/2403.05950v2
- Date: Thu, 28 Mar 2024 17:14:53 GMT
- ステータス: 処理完了
- システム内更新日: 2024-03-29 20:43:01.271621
- Title: Classifying Objects in 3D Point Clouds Using Recurrent Neural Network: A GRU LSTM Hybrid Approach
- Title(参考訳): リカレントニューラルネットワークによる3次元点雲中の物体の分類:GRU LSTMハイブリッドアプローチ
- Authors: Ramin Mousa, Mitra Khezli, Mohamadreza Azadi, Vahid Nikoofard, Saba Hesaraki,
- Abstract要約: 拡張現実における3次元オブジェクト分類のためのディープラーニング戦略を提案する。
提案手法はGRUとLSTMの組み合わせである。
提案手法は4,499,0641点のデータセットで0.99の精度を達成した。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Accurate classification of objects in 3D point clouds is a significant problem in several applications, such as autonomous navigation and augmented/virtual reality scenarios, which has become a research hot spot. In this paper, we presented a deep learning strategy for 3D object classification in augmented reality. The proposed approach is a combination of the GRU and LSTM. LSTM networks learn longer dependencies well, but due to the number of gates, it takes longer to train; on the other hand, GRU networks have a weaker performance than LSTM, but their training speed is much higher than GRU, which is The speed is due to its fewer gates. The proposed approach used the combination of speed and accuracy of these two networks. The proposed approach achieved an accuracy of 0.99 in the 4,499,0641 points dataset, which includes eight classes (unlabeled, man-made terrain, natural terrain, high vegetation, low vegetation, buildings, hardscape, scanning artifacts, cars). Meanwhile, the traditional machine learning approaches could achieve a maximum accuracy of 0.9489 in the best case. Keywords: Point Cloud Classification, Virtual Reality, Hybrid Model, GRULSTM, GRU, LSTM
- Abstract(参考訳): 3Dポイントクラウドにおけるオブジェクトの正確な分類は、自律的なナビゲーションや拡張現実/仮想現実シナリオなど、いくつかのアプリケーションにおいて重要な問題であり、研究のホットスポットとなっている。
本稿では,拡張現実における3次元オブジェクト分類のためのディープラーニング戦略を提案する。
提案手法はGRUとLSTMの組み合わせである。
LSTMネットワークは、より長い依存性をよく学習するが、ゲートの数が多いため、トレーニングに時間がかかり、一方、GRUネットワークはLSTMよりも性能が低いが、GRUよりもトレーニング速度が高い。
提案手法は、これらの2つのネットワークの速度と精度の組み合わせを用いた。
提案手法は4,499,0641点のデータセットで0.99の精度を達成し、8つのクラス(ラベルなし、人為的地形、自然地形、高植生、低植生、建物、ハードスケープ、スキャニングアーティファクト、車)を含む。
一方、従来の機械学習アプローチでは、ベストケースでは最大精度が0.9489に達する可能性がある。
キーワード:ポイントクラウド分類、バーチャルリアリティ、ハイブリッドモデル、GRULSTM、GRU、LSTM
関連論文リスト
- Active search and coverage using point-cloud reinforcement learning [50.741409008225766]
本稿では,目的探索とカバレッジのためのエンドツーエンドの深層強化学習ソリューションを提案する。
RLの深い階層的特徴学習は有効であり、FPS(Fastthest Point sample)を用いることで点数を削減できることを示す。
また、ポイントクラウドに対するマルチヘッドの注意がエージェントの学習を高速化する上で有効であるが、同じ結果に収束することを示す。
論文 参考訳(メタデータ) (2023-12-18T18:16:30Z) - AutoSynth: Learning to Generate 3D Training Data for Object Point Cloud
Registration [69.21282992341007]
Auto Synthは、ポイントクラウド登録のための3Dトレーニングデータを自動的に生成する。
私たちはポイントクラウド登録ネットワークをもっと小さなサロゲートネットワークに置き換え、4056.43$のスピードアップを実現しました。
TUD-L,LINEMOD,Occluded-LINEMODに関する我々の研究結果は,検索データセットでトレーニングされたニューラルネットワークが,広く使用されているModelNet40データセットでトレーニングされたニューラルネットワークよりも一貫してパフォーマンスが向上していることを示す。
論文 参考訳(メタデータ) (2023-09-20T09:29:44Z) - StarNet: Style-Aware 3D Point Cloud Generation [82.30389817015877]
StarNetは、マッピングネットワークを使用して高忠実度および3Dポイントクラウドを再構築し、生成することができる。
我々のフレームワークは、クラウドの再構築と生成タスクにおいて、様々なメトリクスで同等の最先端のパフォーマンスを達成します。
論文 参考訳(メタデータ) (2023-03-28T08:21:44Z) - Spatial Layout Consistency for 3D Semantic Segmentation [0.7614628596146599]
本稿では,ALTMの点雲のボクセルに基づくセマンティックセマンティックセグメンテーションを実現するための,新しいディープ畳み込みニューラルネットワーク(DCNN)手法を提案する。
提案する深層学習手法であるセマンティック・ユーティリティ・ネットワーク(SUNet)は多次元・多次元ネットワークである。
実験により,SuNetの空間的レイアウトの整合性とマルチレゾリューション機能アグリゲーションにより,性能が大幅に向上することを示した。
論文 参考訳(メタデータ) (2023-03-02T03:24:21Z) - Deep learning approach for interruption attacks detection in LEO
satellite networks [0.0]
本研究の目的は、深層学習アルゴリズムを用いた低地球軌道(textsfLEO)衛星ネットワークの割り込み検出戦略を提供することである。
我々は、MLP(Multi Layer Perceptron)、CNN(Convolutional Neural Network)、RNN(Recurrent Neural Network)、Gated Recurrent Units(GRU)など、さまざまなディープラーニングアルゴリズムをテストする。
論文 参考訳(メタデータ) (2022-12-10T21:21:14Z) - Learnable Online Graph Representations for 3D Multi-Object Tracking [156.58876381318402]
3D MOT問題に対する統一型学習型アプローチを提案します。
我々は、完全にトレーニング可能なデータアソシエーションにNeural Message Passing Networkを使用します。
AMOTAの65.6%の最先端性能と58%のIDスウィッチを達成して、公開可能なnuScenesデータセットに対する提案手法のメリットを示す。
論文 参考訳(メタデータ) (2021-04-23T17:59:28Z) - Mitigating Edge Machine Learning Inference Bottlenecks: An Empirical
Study on Accelerating Google Edge Models [9.411450503567975]
24のGoogleエッジNNモデルを使用して商用Edge TPUを分析します。
Mensaという新しいアクセラレーションフレームワークを提案する。
すべての24のGoogleエッジモデルで平均されるMensaは、Edge TPU上で3.0xと3.1x、最先端のアクセラレータであるEyeriss v2上で2.4xと4.3xでエネルギー効率とスループットを改善します。
論文 参考訳(メタデータ) (2021-03-01T05:49:32Z) - Hyperspectral Classification Based on Lightweight 3-D-CNN With Transfer
Learning [67.40866334083941]
限定サンプルに基づくHSI分類のためのエンドツーエンドの3次元軽量畳み込みニューラルネットワーク(CNN)を提案する。
従来の3D-CNNモデルと比較して,提案した3D-LWNetはネットワーク構造が深く,パラメータが小さく,計算コストも低い。
本モデルでは,HSI分類の競合性能を,いくつかの最先端手法と比較した。
論文 参考訳(メタデータ) (2020-12-07T03:44:35Z) - Searching Collaborative Agents for Multi-plane Localization in 3D
Ultrasound [59.97366727654676]
3D超音波(US)はその豊富な診断情報、可搬性、低コストのために広く用いられている。
米国における標準平面(SP)のローカライゼーションは,効率の向上とユーザ依存の低減だけでなく,米国における3D解釈の促進にも寄与する。
本稿では,複数の子宮SPを同時に3D USにローカライズするマルチエージェント強化学習フレームワークを提案する。
論文 参考訳(メタデータ) (2020-07-30T07:23:55Z) - A Nearest Neighbor Network to Extract Digital Terrain Models from 3D
Point Clouds [1.6249267147413524]
本稿では,3Dポイントのクラウド上で動作し,エンド・ツー・エンドのアプローチを用いてシーンの基盤となるDTMを推定するアルゴリズムを提案する。
我々のモデルは近隣情報を学習し、これをポイントワイドでブロックワイドなグローバルな特徴とシームレスに統合する。
論文 参考訳(メタデータ) (2020-05-21T15:54:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。