論文の概要: Learning Generalizable Shape Completion with SIM(3) Equivariance
- arxiv url: http://arxiv.org/abs/2509.26631v1
- Date: Tue, 30 Sep 2025 17:58:55 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-01 17:09:04.658267
- Title: Learning Generalizable Shape Completion with SIM(3) Equivariance
- Title(参考訳): SIM(3)等分散による一般化可能な形状補完の学習
- Authors: Yuqing Wang, Zhaiyu Chen, Xiao Xiang Zhu,
- Abstract要約: 3次元形状補完法は通常、スキャンが標準フレームに予め整列されていると仮定する。
このリークは、ネットワークが固有の幾何学を推測するのではなく、絶対的な位置を記憶するために利用するであろうポーズとスケールの手がかりである。
SIM(3)-等変形状補完ネットワークは, モジュール層が連続的に特徴を正準化し, 類似性不変形状の推論を行い, 元のフレームを復元する。
- 参考スコア(独自算出の注目度): 28.32354310239772
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: 3D shape completion methods typically assume scans are pre-aligned to a canonical frame. This leaks pose and scale cues that networks may exploit to memorize absolute positions rather than inferring intrinsic geometry. When such alignment is absent in real data, performance collapses. We argue that robust generalization demands architectural equivariance to the similarity group, SIM(3), so the model remains agnostic to pose and scale. Following this principle, we introduce the first SIM(3)-equivariant shape completion network, whose modular layers successively canonicalize features, reason over similarity-invariant geometry, and restore the original frame. Under a de-biased evaluation protocol that removes the hidden cues, our model outperforms both equivariant and augmentation baselines on the PCN benchmark. It also sets new cross-domain records on real driving and indoor scans, lowering minimal matching distance on KITTI by 17% and Chamfer distance $\ell1$ on OmniObject3D by 14%. Perhaps surprisingly, ours under the stricter protocol still outperforms competitors under their biased settings. These results establish full SIM(3) equivariance as an effective route to truly generalizable shape completion. Project page: https://sime-completion.github.io.
- Abstract(参考訳): 3次元形状補完法は通常、スキャンが標準フレームに予め整列されていると仮定する。
このリークは、ネットワークが固有の幾何学を推測するのではなく、絶対的な位置を記憶するために利用するであろうポーズとスケールの手がかりである。
実際のデータにそのようなアライメントがない場合、パフォーマンスは崩壊する。
我々は、ロバストな一般化は類似性群 SIM(3) に同値なアーキテクチャを必要とするので、モデルがポーズやスケールに非依存であると主張する。
この原理に従うと、最初のSIM(3)-同変形状完備ネットワークを導入し、モジュラー層が連続的に特徴を正準化し、類似性不変形状の理由を定式化し、元のフレームを復元する。
隠れキューを除去する非バイアス評価プロトコルでは,PCNベンチマークにおいて,同変ベースラインと拡張ベースラインの両方で性能が向上する。
また、実際の運転と屋内スキャンに新しいクロスドメインレコードを設定し、KITTI上の最小マッチング距離を17%下げ、OmniObject3D上のChamfer距離を14%下げる。
おそらく意外なことに、より厳格なプロトコルの下では、偏見のある設定下でも競争相手よりも優れています。
これらの結果は、真に一般化可能な形状完備化のための有効な経路として、完全なSIM(3)等式を確立する。
プロジェクトページ: https://sime-completion.github.io
関連論文リスト
- Test3R: Learning to Reconstruct 3D at Test Time [58.0912500917036]
Test3Rは驚くほどシンプルなテストタイム学習技術で、幾何学的精度を大幅に向上させる。
本手法は従来の3次元再構成法や多視点深度推定法よりも優れていた。
論文 参考訳(メタデータ) (2025-06-16T17:56:22Z) - Representation Similarity: A Better Guidance of DNN Layer Sharing for Edge Computing without Training [3.792729116385123]
本稿では,表現類似度Sで導かれる表現をエッジで共有することで,新しいモデルマージ方式を提案する。
Pearson correlation Coefficient |r| > 0.94 than other metrics。
論文 参考訳(メタデータ) (2024-10-15T03:35:54Z) - Equi-GSPR: Equivariant SE(3) Graph Network Model for Sparse Point Cloud Registration [2.814748676983944]
局所球面ユークリッド3次元等分散特性をSE(3)メッセージパッシングに基づく伝搬により埋め込んだグラフニューラルネットワークモデルを提案する。
我々のモデルは、主に記述モジュール、同変グラフ層、類似性、最終的な回帰層から構成される。
3DMatchおよびKITTIデータセットで行った実験は、最先端のアプローチと比較して、我々のモデルの魅力的で堅牢な性能を示している。
論文 参考訳(メタデータ) (2024-10-08T06:48:01Z) - DiffComplete: Diffusion-based Generative 3D Shape Completion [114.43353365917015]
3次元レンジスキャンにおける形状完成のための拡散に基づく新しいアプローチを提案する。
私たちはリアリズム、マルチモダリティ、高忠実さのバランスを取ります。
DiffCompleteは2つの大規模3次元形状補完ベンチマークに新しいSOTA性能を設定する。
論文 参考訳(メタデータ) (2023-06-28T16:07:36Z) - Generalizing Neural Human Fitting to Unseen Poses With Articulated SE(3)
Equivariance [48.39751410262664]
ArtEqは、点雲からのSMPLモデル推定のための部分ベースSE(3)等価ニューラルネットワークである。
実験の結果,ArtEqはトレーニング中に見えない動作を一般化し,身体再建精度の点で最先端の手法を44%上回った。
論文 参考訳(メタデータ) (2023-04-20T17:58:26Z) - SVNet: Where SO(3) Equivariance Meets Binarization on Point Cloud
Representation [65.4396959244269]
本論文は,3次元学習アーキテクチャを構築するための一般的なフレームワークを設計することによる課題に対処する。
提案手法はPointNetやDGCNNといった一般的なバックボーンに適用できる。
ModelNet40、ShapeNet、および実世界のデータセットであるScanObjectNNの実験では、この手法が効率、回転、精度の間の大きなトレードオフを達成することを示した。
論文 参考訳(メタデータ) (2022-09-13T12:12:19Z) - Adjoint Rigid Transform Network: Task-conditioned Alignment of 3D Shapes [86.2129580231191]
Adjoint Rigid Transform (ART) Networkは、さまざまな3Dネットワークと統合可能なニューラルネットワークモジュールである。
ARTは入力の形状を学習した標準方向に回転させることを学び、多くのタスクに欠かせない。
さらなる研究のために、コードと事前訓練されたモデルをリリースします。
論文 参考訳(メタデータ) (2021-02-01T20:58:45Z) - Monocular 3D Detection with Geometric Constraints Embedding and
Semi-supervised Training [3.8073142980733]
我々は,KM3D-Netと呼ばれる,RGB画像のみを用いたモノクル3Dオブジェクト検出のための新しいフレームワークを提案する。
我々は、対象のキーポイント、次元、方向を予測するための完全な畳み込みモデルを設計し、これらの推定を視点幾何学的制約と組み合わせて位置属性を計算する。
論文 参考訳(メタデータ) (2020-09-02T00:51:51Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。