論文の概要: EquiForm: Noise-Robust SE(3)-Equivariant Policy Learning from 3D Point Clouds
- arxiv url: http://arxiv.org/abs/2601.17486v1
- Date: Sat, 24 Jan 2026 15:19:41 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-23 08:17:40.937264
- Title: EquiForm: Noise-Robust SE(3)-Equivariant Policy Learning from 3D Point Clouds
- Title(参考訳): EquiForm: 3次元点雲から学ぶノイズ・ロバストSE(3)-等価政策学習
- Authors: Zhiyuan Zhang, Yu She,
- Abstract要約: EquiFormは、ポイントクラウドベースの操作のための、ノイズロバストSE(3)同種のポリシー学習フレームワークである。
本研究では, 雑音による幾何歪みが観測と反応のマッピングにおける等分散偏差にどのように寄与するかを定式化し, 幾何デノナイジングモジュールを導入する。
これらのコンポーネントに基づいて構築されたEquiFormは、ノイズロストな幾何学的推論と現代的な生成モデルを統合するフレキシブルなポリシー学習パイプラインを形成する。
- 参考スコア(独自算出の注目度): 6.208778433583411
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Visual imitation learning with 3D point clouds has advanced robotic manipulation by providing geometry-aware, appearance-invariant observations. However, point cloud-based policies remain highly sensitive to sensor noise, pose perturbations, and occlusion-induced artifacts, which distort geometric structure and break the equivariance assumptions required for robust generalization. Existing equivariant approaches primarily encode symmetry constraints into neural architectures, but do not explicitly correct noise-induced geometric deviations or enforce equivariant consistency in learned representations. We introduce EquiForm, a noise-robust SE(3)-equivariant policy learning framework for point cloud-based manipulation. EquiForm formalizes how noise-induced geometric distortions lead to equivariance deviations in observation-to-action mappings, and introduces a geometric denoising module to restore consistent 3D structure under noisy or incomplete observations. In addition, we propose a contrastive equivariant alignment objective that enforces representation consistency under both rigid transformations and noise perturbations. Built upon these components, EquiForm forms a flexible policy learning pipeline that integrates noise-robust geometric reasoning with modern generative models. We evaluate EquiForm on 16 simulated tasks and 4 real-world manipulation tasks across diverse objects and scene layouts. Compared to state-of-the-art point cloud imitation learning methods, EquiForm achieves an average improvement of 17.2% in simulation and 28.1% in real-world experiments, demonstrating strong noise robustness and spatial generalization.
- Abstract(参考訳): 3Dポイントクラウドを用いた視覚模倣学習は、幾何学的、外観不変な観察を提供することで、高度なロボット操作を実現する。
しかし、点雲に基づくポリシーは、センサノイズ、ポーズ摂動、オクルージョンによって引き起こされるアーティファクトに非常に敏感であり、幾何構造を歪め、ロバストな一般化に必要な平衡仮定を破る。
既存の同変アプローチは主に対称性の制約をニューラルネットワークにエンコードするが、ノイズによる幾何偏差を明示的に補正したり、学習された表現に同変一貫性を強制したりしない。
EquiFormは、ポイントクラウドベースの操作のための、ノイズロバストSE(3)同種のポリシー学習フレームワークである。
EquiFormは、ノイズによって引き起こされる幾何的歪みが、観測と反応のマッピングにおける等分散のずれにつながるかを形式化し、ノイズや不完全な観測の下で一貫した3D構造を復元する幾何デノナイジングモジュールを導入する。
さらに,剛性変換と雑音摂動の両条件下での表現整合性を実現するコントラッシブ同変アライメント目的を提案する。
これらのコンポーネントに基づいて構築されたEquiFormは、ノイズロストな幾何学的推論と現代的な生成モデルを統合するフレキシブルなポリシー学習パイプラインを形成する。
16のシミュレートされたタスクと4つの実世界の操作タスクにおいて、多様なオブジェクトとシーンレイアウトでEquiFormを評価する。
最先端のクラウド模倣学習法と比較して、EquiFormはシミュレーションで17.2%、実世界の実験で28.1%の平均的な改善を実現し、強いノイズの堅牢性と空間的一般化を示している。
関連論文リスト
- Adaptive Point-Prompt Tuning: Fine-Tuning Heterogeneous Foundation Models for 3D Point Cloud Analysis [51.37795317716487]
本稿では,パラメータの少ない事前学習モデルを微調整するAdaptive Point-Prompt Tuning (APPT)法を提案する。
局所幾何学を集約することで原点雲を点埋め込みに変換し、空間的特徴を捉える。
任意のモダリティのソース領域から3Dへの自己アテンションを校正するために,重みを点埋め込みモジュールと共有するプロンプトジェネレータを導入する。
論文 参考訳(メタデータ) (2025-08-30T06:02:21Z) - Surfel-based 3D Registration with Equivariant SE(3) Features [34.796697445601914]
ポイントクラウドの登録は、リモートセンシングやデジタル遺産のための3D再構成において、複数のローカルポイントクラウドの3D整合性を確保するために不可欠である。
本稿では,これらの問題に対処するための新しいサーベイルベースのポーズ学習回帰手法を提案する。
本手法は,仮想視点カメラパラメータを用いてLidar点雲からサーベイルを初期化し,明示的な$mathbfSE(3)$等変特徴を学習する。
論文 参考訳(メタデータ) (2025-08-28T13:53:44Z) - Self-Supervised Multi-Part Articulated Objects Modeling via Deformable Gaussian Splatting and Progressive Primitive Segmentation [23.18517560629462]
DeGSSは,物体を変形可能な3次元ガウス場として符号化し,幾何学,外観,動きを1つのコンパクト表現に埋め込む統一フレームワークである。
一般化とリアリズムを評価するために、合成PartNet-Mobilityベンチマークを拡張し、RGBキャプチャと正確にリバースエンジニアリングされた3Dモデルを組み合わせたリアル・トゥ・シムデータセットRS-Artをリリースする。
論文 参考訳(メタデータ) (2025-06-11T12:32:16Z) - SkelFormer: Markerless 3D Pose and Shape Estimation using Skeletal Transformers [57.46911575980854]
マルチビュー人間のポーズと形状推定のための新しいマーカーレスモーションキャプチャパイプラインであるSkelFormerを紹介する。
提案手法は,まず市販の2次元キーポイント推定器を用いて,大規模インザミルドデータに基づいて事前トレーニングを行い,3次元関節位置を求める。
次に、重雑音観測から、関節の位置をポーズと形状の表現にマッピングする回帰に基づく逆運動性骨格変換器を設計する。
論文 参考訳(メタデータ) (2024-04-19T04:51:18Z) - Deformation-Guided Unsupervised Non-Rigid Shape Matching [7.327850781641328]
非厳密な形状マッチングのための教師なしデータ駆動方式を提案する。
本手法は,3次元スキャナを用いたディジタル形状のマッチングにおいて特に堅牢である。
論文 参考訳(メタデータ) (2023-11-27T09:55:55Z) - MoDA: Modeling Deformable 3D Objects from Casual Videos [84.29654142118018]
神経二元四元系ブレンドスキンニング(NeuDBS)を提案し,スキンを折り畳むことなく3次元点変形を実現する。
異なるフレーム間で2Dピクセルを登録する試みにおいて、標準空間内の3D点を符号化する標準特徴埋め込みの対応性を確立する。
本手法は,ヒトと動物の3Dモデルを,最先端の手法よりも質的,定量的な性能で再構築することができる。
論文 参考訳(メタデータ) (2023-04-17T13:49:04Z) - Leveraging Equivariant Features for Absolute Pose Regression [9.30597356471664]
変換と回転の同変である畳み込みニューラルネットワークは,カメラの動きの表現を直接特徴空間に誘導することを示す。
次に、この幾何学的性質により、画像平面保存変換の全グループの下でトレーニングデータを暗黙的に増大させることができることを示す。
論文 参考訳(メタデータ) (2022-04-05T12:44:20Z) - SNARF: Differentiable Forward Skinning for Animating Non-Rigid Neural
Implicit Shapes [117.76767853430243]
SNARFは多角形メッシュに対する線形ブレンドスキンの利点とニューラル暗黙表面の利点を組み合わせたものである。
反復ルート探索を用いて任意の変形点のすべての正準対応を探索するフォワードスキンモデルを提案する。
最先端のニューラルネットワークの暗黙的表現と比較すると,このアプローチは,精度を維持しつつ,未認識のポーズを一般化する。
論文 参考訳(メタデータ) (2021-04-08T17:54:59Z) - Disentangling Geometric Deformation Spaces in Generative Latent Shape
Models [5.582957809895198]
3Dオブジェクトの完全な表現には、解釈可能な方法で変形の空間を特徴づける必要がある。
本研究では,物体形状の空間を剛性方向,非剛性ポーズ,内在的な形状に分解する3次元形状の不整合の事前生成モデルを改善する。
得られたモデルは生の3D形状からトレーニングできる。
論文 参考訳(メタデータ) (2021-02-27T06:54:31Z) - Dense Non-Rigid Structure from Motion: A Manifold Viewpoint [162.88686222340962]
Non-Rigid Structure-from-Motion (NRSfM) 問題は、複数のフレームにまたがる2次元特徴対応から変形物体の3次元形状を復元することを目的としている。
提案手法は,ノイズに対する精度,スケーラビリティ,堅牢性を大幅に向上させる。
論文 参考訳(メタデータ) (2020-06-15T09:15:54Z) - Hamiltonian Dynamics for Real-World Shape Interpolation [66.47407593823208]
我々は3次元形状の古典的問題を再考し、ハミルトン力学に基づく新しい物理的に妥当なアプローチを提案する。
本手法は, 中間形状を正確に保存し, 自己切断を回避し, 高分解能スキャンにスケーラブルである。
論文 参考訳(メタデータ) (2020-04-10T18:38:52Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。