論文の概要: MODNet: Multi-offset Point Cloud Denoising Network Customized for
Multi-scale Patches
- arxiv url: http://arxiv.org/abs/2208.14160v2
- Date: Thu, 1 Sep 2022 07:31:19 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-02 11:38:39.186991
- Title: MODNet: Multi-offset Point Cloud Denoising Network Customized for
Multi-scale Patches
- Title(参考訳): MODNet:マルチオフセットポイントクラウド マルチスケールパッチ用にカスタマイズされたネットワーク
- Authors: Anyi Huang, Qian Xie, Zhoutao Wang, Dening Lu, Mingqiang Wei, Jun Wang
- Abstract要約: マルチスケールパッチ用にカスタマイズされたMODNet(Multi-offset Denoising Network)を提案する。
マルチスケール知覚モジュールは、各スケールの特徴に対して、マルチスケールの幾何学的情報を埋め込むように設計されている。
実験により,本手法は,合成データセットと実スキャンデータセットの両方において,新しい最先端性能を実現することを示す。
- 参考スコア(独自算出の注目度): 14.078359217301973
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The intricacy of 3D surfaces often results cutting-edge point cloud denoising
(PCD) models in surface degradation including remnant noise, wrongly-removed
geometric details. Although using multi-scale patches to encode the geometry of
a point has become the common wisdom in PCD, we find that simple aggregation of
extracted multi-scale features can not adaptively utilize the appropriate scale
information according to the geometric information around noisy points. It
leads to surface degradation, especially for points close to edges and points
on complex curved surfaces. We raise an intriguing question -- if employing
multi-scale geometric perception information to guide the network to utilize
multi-scale information, can eliminate the severe surface degradation problem?
To answer it, we propose a Multi-offset Denoising Network (MODNet) customized
for multi-scale patches. First, we extract the low-level feature of three
scales patches by patch feature encoders. Second, a multi-scale perception
module is designed to embed multi-scale geometric information for each scale
feature and regress multi-scale weights to guide a multi-offset denoising
displacement. Third, a multi-offset decoder regresses three scale offsets,
which are guided by the multi-scale weights to predict the final displacement
by weighting them adaptively. Experiments demonstrate that our method achieves
new state-of-the-art performance on both synthetic and real-scanned datasets.
- Abstract(参考訳): 3次元表面の複雑度は、しばしば、残留ノイズを含む表面劣化における最先端の点雲デノイング(PCD)モデルが誤って取り除かれた幾何学的詳細をもたらす。
点の幾何を符号化するマルチスケールパッチはPCDでは一般的な知恵となっているが,抽出した多スケール特徴の単純な集約は,雑音点周辺の幾何情報に基づいて適切なスケール情報を適応的に利用できない。
これは、特に複雑な曲面上の辺や点に近い点に対して、表面劣化をもたらす。
マルチスケールの幾何学的知覚情報をネットワークに誘導し、マルチスケールの情報を活用すれば、表面劣化の問題を取り除くことができるのか?
そこで我々は,マルチスケールパッチ用にカスタマイズされたMODNet(Multi-offset Denoising Network)を提案する。
まず,3つのスケールパッチの低レベル特徴をパッチ特徴エンコーダによって抽出する。
第二に、マルチスケール知覚モジュールは、各スケールの特徴に対してマルチスケールの幾何学情報を埋め込み、マルチスケールの重みを補強し、マルチオフセットのデノジング変位を導出するように設計されている。
第三に、マルチオフセットデコーダは3つのスケールオフセットを回帰し、これは多スケールの重みによって誘導され、適応的に重み付けして最終変位を予測する。
実験は,合成データと実データの両方において,新たな最先端性能を実現することを実証する。
関連論文リスト
- A Recipe for Geometry-Aware 3D Mesh Transformers [2.0992612407358293]
本研究では, ノード数可変のパッチを収容するパッチレベルで, 特徴を埋め込む手法について検討する。
本研究は,1)一般的な3次元メッシュトランスフォーマにおける熱拡散による構造的および位置的埋め込みの重要性,2)学習の強化における測地的マスキングや機能的相互作用といった新しい要素の有効性,3)セグメント化と分類作業の課題における提案手法の優れた性能と効率性など,重要な知見を浮き彫りにしている。
論文 参考訳(メタデータ) (2024-10-31T19:13:31Z) - DM3D: Distortion-Minimized Weight Pruning for Lossless 3D Object Detection [42.07920565812081]
本稿では,3次元物体検出のための新しいトレーニング後の重み付け手法を提案する。
事前訓練されたモデルにおける冗長パラメータを決定し、局所性と信頼性の両方において最小限の歪みをもたらす。
本フレームワークは,ネットワーク出力の歪みを最小限に抑え,検出精度を最大に維持することを目的とする。
論文 参考訳(メタデータ) (2024-07-02T09:33:32Z) - Mesh Denoising Transformer [104.5404564075393]
Mesh Denoisingは、入力メッシュからノイズを取り除き、特徴構造を保存することを目的としている。
SurfaceFormerはTransformerベースのメッシュDenoisingフレームワークのパイオニアだ。
局所曲面記述子(Local Surface Descriptor)として知られる新しい表現は、局所幾何学的複雑さをキャプチャする。
Denoising Transformerモジュールは、マルチモーダル情報を受信し、効率的なグローバル機能アグリゲーションを実現する。
論文 参考訳(メタデータ) (2024-05-10T15:27:43Z) - Compact Twice Fusion Network for Edge Detection [5.379716918698048]
マルチスケール機能の重要性は、エッジ検出コミュニティによって徐々に認識されるようになった。
マルチスケール機能を完全に統合する小型Twice Fusion Network (CTFN) を提案する。
CTFNには2つの軽量なマルチスケール機能融合モジュールが含まれている。
論文 参考訳(メタデータ) (2023-07-11T00:46:59Z) - PointMCD: Boosting Deep Point Cloud Encoders via Multi-view Cross-modal
Distillation for 3D Shape Recognition [55.38462937452363]
本稿では,教師として事前訓練されたディープイメージエンコーダ,学生としてディープポイントエンコーダを含む多視点クロスモーダル蒸留アーキテクチャを提案する。
複数ビューの視覚的および幾何学的記述子をペアワイズにアライメントすることで、より強力なディープポイントエンコーダを、疲労や複雑なネットワーク修正を伴わずに得ることができる。
論文 参考訳(メタデータ) (2022-07-07T07:23:20Z) - Point-M2AE: Multi-scale Masked Autoencoders for Hierarchical Point Cloud
Pre-training [56.81809311892475]
Masked Autoencoders (MAE) は、言語と2次元画像変換器の自己教師付き事前学習において大きな可能性を示している。
我々は3次元点雲の階層的自己教師型学習のための強力なマルチスケールMAE事前学習フレームワークであるPoint-M2AEを提案する。
論文 参考訳(メタデータ) (2022-05-28T11:22:53Z) - POCO: Point Convolution for Surface Reconstruction [92.22371813519003]
入射ニューラルネットワークは点雲からの表面再構成に成功している。
それらの多くは、オブジェクトやシーン全体を1つの潜伏ベクトルにエンコードするときにスケーラビリティの問題に直面します。
本稿では,各入力点における点雲畳み込みと潜在ベクトルの計算を提案する。
論文 参考訳(メタデータ) (2022-01-05T21:26:18Z) - Geometry-Contrastive Transformer for Generalized 3D Pose Transfer [95.56457218144983]
この研究の直感は、与えられたメッシュ間の幾何学的不整合を強力な自己認識機構で知覚することである。
本研究では,グローバルな幾何学的不整合に対する3次元構造的知覚能力を有する新しい幾何学コントラスト変換器を提案する。
本稿では, クロスデータセット3次元ポーズ伝達タスクのための半合成データセットとともに, 潜時等尺正則化モジュールを提案する。
論文 参考訳(メタデータ) (2021-12-14T13:14:24Z) - Learning Geometry-Disentangled Representation for Complementary
Understanding of 3D Object Point Cloud [50.56461318879761]
3次元画像処理のためのGDANet(Geometry-Disentangled Attention Network)を提案する。
GDANetは、点雲を3Dオブジェクトの輪郭と平らな部分に切り離し、それぞれ鋭い変化成分と穏やかな変化成分で表される。
3Dオブジェクトの分類とセグメンテーションベンチマークの実験は、GDANetがより少ないパラメータで最先端の処理を実現していることを示している。
論文 参考訳(メタデータ) (2020-12-20T13:35:00Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。