論文の概要: Point Transformer for Shape Classification and Retrieval of 3D and ALS
Roof PointClouds
- arxiv url: http://arxiv.org/abs/2011.03921v2
- Date: Sat, 20 Feb 2021 08:54:37 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-28 08:38:58.484685
- Title: Point Transformer for Shape Classification and Retrieval of 3D and ALS
Roof PointClouds
- Title(参考訳): 3DおよびALSルーフクラウドの形状分類と検索のための点変換器
- Authors: Dimple A Shajahan, Mukund Varma T and Ramanathan Muthuganapathy
- Abstract要約: 本稿では,リッチポイントクラウド表現の導出を目的とした,完全注意モデルであるem Point Transformerを提案する。
モデルの形状分類と検索性能は,大規模都市データセット - RoofN3D と標準ベンチマークデータセット ModelNet40 で評価される。
提案手法は、RoofN3Dデータセットの他の最先端モデルよりも優れており、ModelNet40ベンチマークで競合する結果を与え、目に見えない点の破損に対して高い堅牢性を示す。
- 参考スコア(独自算出の注目度): 3.3744638598036123
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The success of deep learning methods led to significant breakthroughs in 3-D
point cloud processing tasks with applications in remote sensing. Existing
methods utilize convolutions that have some limitations, as they assume a
uniform input distribution and cannot learn long-range dependencies. Recent
works have shown that adding attention in conjunction with these methods
improves performance. This raises a question: can attention layers completely
replace convolutions? This paper proposes a fully attentional model - {\em
Point Transformer}, for deriving a rich point cloud representation. The model's
shape classification and retrieval performance are evaluated on a large-scale
urban dataset - RoofN3D and a standard benchmark dataset ModelNet40. Extensive
experiments are conducted to test the model's robustness to unseen point
corruptions for analyzing its effectiveness on real datasets. The proposed
method outperforms other state-of-the-art models in the RoofN3D dataset, gives
competitive results in the ModelNet40 benchmark, and showcases high robustness
to various unseen point corruptions. Furthermore, the model is highly memory
and space efficient when compared to other methods.
- Abstract(参考訳): ディープラーニング手法の成功は、リモートセンシングのアプリケーションによる3Dポイントクラウド処理タスクに大きなブレークスルーをもたらした。
既存の方法は、一様入力分布を仮定して長距離依存を学習できないため、いくつかの制限のある畳み込みを利用する。
近年の研究では,これらの手法と併用することで性能が向上している。
注意層が畳み込みを完全に置き換えられるか?
本稿では,リッチ・ポイント・クラウド表現を導出するための完全注意モデル - {\displaystyle {\em Point Transformer} を提案する。
モデルの形状分類と検索性能は,大規模都市データセット - RoofN3D と標準ベンチマークデータセット ModelNet40 で評価される。
モデルのロバスト性をテストするために、大規模な実験を行い、実際のデータセット上での有効性を分析する。
提案手法は, ルーフ3dデータセットにおける他の最先端モデルよりも優れており, モデルnet40ベンチマークにおいて, 高いロバスト性を示す。
さらに、他の手法と比較して、モデルは非常にメモリと空間効率が高い。
関連論文リスト
- Foundation Model-Powered 3D Few-Shot Class Incremental Learning via Training-free Adaptor [9.54964908165465]
本稿では,3Dポイントクラウド環境におけるFew-Shot連続インクリメンタルラーニング問題に対処する新しい手法を提案する。
私たちは、ポイントクラウドデータに基づいて広範囲にトレーニングされた基礎的な3Dモデルを活用します。
このアプローチでは、二重キャッシュシステムを使用します。まず、モデルの予測にどれだけ自信があるかに基づいて、以前のテストサンプルを使用し、次に、オーバーフィッティングを防ぐために、少数の新しいタスクサンプルを含んでいます。
論文 参考訳(メタデータ) (2024-10-11T20:23:00Z) - Transfer Learning with Point Transformers [3.678615604632945]
Point Transformerは、Point Cloudデータの分類、セグメンテーション、検出のための最先端モデルである。
モデルNet10データセットに基づくこれらの注目ネットワークの分類性能について検討し、3次元MNISTデータセットを微調整後に分類するためにトレーニングされたモデルを用いた。
論文 参考訳(メタデータ) (2024-04-01T01:23:58Z) - ModelNet-O: A Large-Scale Synthetic Dataset for Occlusion-Aware Point
Cloud Classification [28.05358017259757]
本論文では,123,041サンプルの大規模合成データセットであるModelNet-Oを提案する。
ModelNet-Oは、モノクロカメラからのスキャンによる自己閉塞で現実世界の点雲をエミュレートする。
本稿では,PointMLSと呼ばれるロバストポイントクラウド処理手法を提案する。
論文 参考訳(メタデータ) (2024-01-16T08:54:21Z) - FILP-3D: Enhancing 3D Few-shot Class-incremental Learning with
Pre-trained Vision-Language Models [62.663113296987085]
クラス増分学習(class-incremental learning)は、モデルが限られたデータに基づいて漸進的にトレーニングされている場合、破滅的な忘れの問題を軽減することを目的としている。
冗長特徴除去器(RFE)と空間ノイズ補償器(SNC)の2つの新しいコンポーネントを紹介する。
既存の3次元データセットの不均衡を考慮し、3次元FSCILモデルのより微妙な評価を提供する新しい評価指標を提案する。
論文 参考訳(メタデータ) (2023-12-28T14:52:07Z) - StarNet: Style-Aware 3D Point Cloud Generation [82.30389817015877]
StarNetは、マッピングネットワークを使用して高忠実度および3Dポイントクラウドを再構築し、生成することができる。
我々のフレームワークは、クラウドの再構築と生成タスクにおいて、様々なメトリクスで同等の最先端のパフォーマンスを達成します。
論文 参考訳(メタデータ) (2023-03-28T08:21:44Z) - 3DVerifier: Efficient Robustness Verification for 3D Point Cloud Models [17.487852393066458]
既存のポイントクラウドモデルの検証手法は,大規模ネットワーク上で時間的・計算的に実現不可能である。
本稿では,2つの問題に対処する3DVerifierを提案し,線形緩和関数を適用して乗算層を結合し,前方と後方の伝搬を結合する。
提案手法は,大規模ネットワークにおける検証効率のオーダー・オブ・マグニチュード向上を実現し,得られた認証境界も最先端の検証器よりもかなり厳密である。
論文 参考訳(メタデータ) (2022-07-15T15:31:16Z) - Point Discriminative Learning for Unsupervised Representation Learning
on 3D Point Clouds [54.31515001741987]
3次元点雲上での教師なし表現学習のための点識別学習法を提案する。
我々は、中間レベルとグローバルレベルの特徴に新しい点識別損失を課すことにより、これを達成した。
提案手法は強力な表現を学習し,新しい最先端性能を実現する。
論文 参考訳(メタデータ) (2021-08-04T15:11:48Z) - Learning Semantic Segmentation of Large-Scale Point Clouds with Random
Sampling [52.464516118826765]
我々はRandLA-Netを紹介した。RandLA-Netは、大規模ポイントクラウドのポイントごとの意味を推論する、効率的で軽量なニューラルネットワークアーキテクチャである。
我々のアプローチの鍵は、より複雑な点選択アプローチではなく、ランダムな点サンプリングを使用することである。
我々のRandLA-Netは、既存のアプローチよりも最大200倍高速な1回のパスで100万ポイントを処理できます。
論文 参考訳(メタデータ) (2021-07-06T05:08:34Z) - Secrets of 3D Implicit Object Shape Reconstruction in the Wild [92.5554695397653]
コンピュータビジョン、ロボティクス、グラフィックスの様々な用途において、高精細な3Dオブジェクトをスパースから再構築することは重要です。
最近の神経暗黙的モデリング法は、合成データセットまたは高密度データセットで有望な結果を示す。
しかし、粗末でノイズの多い実世界のデータではパフォーマンスが悪い。
本論文では, 一般的な神経暗黙モデルの性能低下の根本原因を解析する。
論文 参考訳(メタデータ) (2021-01-18T03:24:48Z) - 2nd Place Scheme on Action Recognition Track of ECCV 2020 VIPriors
Challenges: An Efficient Optical Flow Stream Guided Framework [57.847010327319964]
我々は、小さなデータセットでモデルをスクラッチからトレーニングできるデータ効率フレームワークを提案する。
具体的には、3D中心差分畳み込み演算を導入することで、新しいC3Dニューラルネットワークベースの2ストリームフレームワークを提案する。
提案手法は,大規模データセット上で事前学習したモデルがなくても,有望な結果が得られることを実証した。
論文 参考訳(メタデータ) (2020-08-10T09:50:28Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。