論文の概要: Less is More: Efficient Point Cloud Reconstruction via Multi-Head Decoders
- arxiv url: http://arxiv.org/abs/2505.19057v1
- Date: Sun, 25 May 2025 09:19:55 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-27 16:58:42.872678
- Title: Less is More: Efficient Point Cloud Reconstruction via Multi-Head Decoders
- Title(参考訳): より少ない - マルチヘッドデコーダによる効率的なポイントクラウド再構築
- Authors: Pedro Alonso, Tianrui Li, Chongshou Li,
- Abstract要約: 一定の深さを超えるデコーダの複雑さが増すと、過度に適合し、一般化が劣化することを示す。
本稿では,点雲の固有冗長性を利用した新しいマルチヘッドデコーダアーキテクチャを提案する。
この結果から,出力の多様性とアーキテクチャ設計は,効率的かつ効率的なポイントクラウド再構築において,深度のみよりも重要であることが示唆された。
- 参考スコア(独自算出の注目度): 5.433816055788235
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We challenge the common assumption that deeper decoder architectures always yield better performance in point cloud reconstruction. Our analysis reveals that, beyond a certain depth, increasing decoder complexity leads to overfitting and degraded generalization. Additionally, we propose a novel multi-head decoder architecture that exploits the inherent redundancy in point clouds by reconstructing complete shapes from multiple independent heads, each operating on a distinct subset of points. The final output is obtained by concatenating the predictions from all heads, enhancing both diversity and fidelity. Extensive experiments on ModelNet40 and ShapeNetPart demonstrate that our approach achieves consistent improvements across key metrics--including Chamfer Distance (CD), Hausdorff Distance (HD), Earth Mover's Distance (EMD), and F1-score--outperforming standard single-head baselines. Our findings highlight that output diversity and architectural design can be more critical than depth alone for effective and efficient point cloud reconstruction.
- Abstract(参考訳): 我々は、より深いデコーダアーキテクチャが常にポイントクラウドの再構築においてより良いパフォーマンスをもたらすという一般的な仮定に挑戦する。
解析の結果,デコーダの複雑さが増大すると,過度に適合し,一般化が低下することが明らかとなった。
さらに,複数の独立な頭部から完全な形状を再構成することで,点雲の固有冗長性を生かした新しいマルチヘッドデコーダアーキテクチャを提案する。
最終的な出力は、すべての頭から予測を連結し、多様性と忠実性の両方を高めることで得られる。
ModelNet40とShapeNetPartの大規模な実験により、我々のアプローチは、Chmfer Distance (CD)、Hausdorff Distance (HD)、Earth Mover's Distance (EMD)、F1-score-outperforming standard single-head baselinesを含む主要な指標間で一貫した改善を実現していることが示された。
この結果から,出力の多様性とアーキテクチャ設計は,効率的かつ効率的なポイントクラウド再構築において,深度のみよりも重要であることが示唆された。
関連論文リスト
- A Lightweight Deep Exclusion Unfolding Network for Single Image Reflection Removal [68.0573194557999]
シングルイメージリフレクション除去(SIRR)は、標準的なブラインドソース分離問題である。
本稿ではSIRRのための新しいDeep Exclusion Unfolding Network(DExNet)を提案する。
DExNetは、単純な反復スパースと補助的特徴更新(i-SAFU)アルゴリズムの展開とパラメータ化によって構築される。
論文 参考訳(メタデータ) (2025-03-03T07:54:27Z) - BaseBoostDepth: Exploiting Larger Baselines For Self-supervised Monocular Depth Estimation [2.1028463367241033]
ポーズ推定の精度を高めるために、インクリメンタルなポーズ推定を導入する。
我々の最終深度ネットワークは、テスト時に計算複雑性を増大させることなく、KITTIとSynS-patchesデータセットの最先端性能を実現する。
論文 参考訳(メタデータ) (2024-07-29T22:05:13Z) - PointHR: Exploring High-Resolution Architectures for 3D Point Cloud
Segmentation [77.44144260601182]
3Dポイントクラウドセグメンテーションのための高分解能アーキテクチャについて検討する。
我々は、特徴抽出のためのknnベースのシーケンス演算子と差分再サンプリング演算子を含む、PointHRという名前の統一パイプラインを提案する。
S3DISとScanNetV2データセットを用いて,これらのアーキテクチャを高密度点雲解析のために評価する。
論文 参考訳(メタデータ) (2023-10-11T09:29:17Z) - NU-MCC: Multiview Compressive Coding with Neighborhood Decoder and
Repulsive UDF [71.99426785065552]
NU-MCCと呼ばれる新しい3次元再構成手法を提案する。
NU-MCCには、近隣デコーダとRepulsive Unsigned Distance Functionという2つの重要なイノベーションが含まれている。
NU-MCCは強力な3D表現を学べることが示され, 単視点3D再構成における技術状況が著しく向上した。
論文 参考訳(メタデータ) (2023-07-18T10:02:09Z) - Variational Relational Point Completion Network for Robust 3D
Classification [59.80993960827833]
可変点雲補完法は、局所的な詳細を欠くため、大域的な形状の骨格を生成する傾向がある。
本稿では2つの魅力的な特性を持つ変分フレームワークであるポイントコンプリートネットワーク(VRCNet)を提案する。
VRCNetは、現実世界のポイントクラウドスキャンにおいて、非常に一般化性と堅牢性を示している。
論文 参考訳(メタデータ) (2023-04-18T17:03:20Z) - Learning Neural Volumetric Field for Point Cloud Geometry Compression [13.691147541041804]
我々は、ニューラルネットワークを学習することで、与えられた点雲の幾何学をコーディングすることを提案する。
空間全体を小さな立方体に分割し,各空でない立方体をニューラルネットワークと入力潜時符号で表現する。
ネットワークは、空間的および時間的冗長性を利用するために、1つのフレームまたは複数のフレームで全ての立方体間で共有される。
論文 参考訳(メタデータ) (2022-12-11T19:55:24Z) - Deep Point Cloud Reconstruction [74.694733918351]
3Dスキャンから得られる点雲は、しばしばスパース、ノイズ、不規則である。
これらの問題に対処するため、最近の研究は別々に行われ、不正確な点雲を密度化、復調し、完全な不正確な点雲を観測している。
本研究では,1) 初期密度化とデノナイズのための3次元スパース集積時間ガラスネットワーク,2) 離散ボクセルを3Dポイントに変換するトランスフォーマーによる改良,の2段階からなる深部点雲再構成ネットワークを提案する。
論文 参考訳(メタデータ) (2021-11-23T07:53:28Z) - Towards Comprehensive Monocular Depth Estimation: Multiple Heads Are
Better Than One [32.01675089157679]
本稿では,複数の弱い深度予測器の強度を統合し,包括的かつ正確な深度予測器を構築することを提案する。
具体的には、異なるTransformerベースおよび畳み込みニューラルネットワーク(CNN)ベースのアーキテクチャを用いて、複数のベース(弱)深さ予測器を構築する。
その結果、トランスフォーマー支援深度アンサンブル(TEDepth)と呼ばれるモデルでは、従来の最先端手法よりも優れた結果が得られる。
論文 参考訳(メタデータ) (2021-11-16T09:09:05Z) - Cloud Transformers: A Universal Approach To Point Cloud Processing Tasks [4.116129791139246]
深部クラウド処理アーキテクチャのための汎用ビルディングブロックを新たに提案する。
このビルディングブロックは、トランスフォーマーとマルチビュー畳み込みネットワークのアイデアと、標準畳み込み層の効率を組み合わせている。
我々は、識別的(ポイントクラウドのセグメンテーション、ポイントクラウドの分類)と生成的(ポイントクラウドの塗装とイメージベースのポイントクラウドの再構築)の両方のタスクのためのアーキテクチャを構築します。
論文 参考訳(メタデータ) (2020-07-22T21:09:14Z) - Suppress and Balance: A Simple Gated Network for Salient Object
Detection [89.88222217065858]
両問題を同時に解くための単純なゲートネットワーク(GateNet)を提案する。
多レベルゲートユニットの助けを借りて、エンコーダからの貴重なコンテキスト情報をデコーダに最適に送信することができる。
さらに,提案したFold-ASPP操作(Fold-ASPP)に基づくアトラス空間ピラミッドプーリングを用いて,様々なスケールのサリアンオブジェクトを正確に位置決めする。
論文 参考訳(メタデータ) (2020-07-16T02:00:53Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。