論文の概要: Manipulating Elasto-Plastic Objects With 3D Occupancy and Learning-Based Predictive Control
- arxiv url: http://arxiv.org/abs/2505.16249v1
- Date: Thu, 22 May 2025 05:36:00 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-23 17:12:48.059318
- Title: Manipulating Elasto-Plastic Objects With 3D Occupancy and Learning-Based Predictive Control
- Title(参考訳): 3次元操作と学習に基づく予測制御による弾塑性物体の操作
- Authors: Zhen Zhang, Xiangyu Chu, Yunxi Tang, Lulu Zhao, Jing Huang, Zhongliang Jiang, K. W. Samuel Au,
- Abstract要約: 本研究は,運動の準静的仮定を用いた弾塑性物体操作のための新しい枠組みを提案する。
これらの課題を効果的に解決するために,我々は3D占有率を利用して表現する学習力学モデル,3D占有率で訓練された学習力学モデル,学習に基づく予測制御アルゴリズムを活用する。
提案フレームワークは, 弾塑性物体を所定の目標形状に整形し, シミュレーションと実世界の両方で様々な実験を行った。
- 参考スコア(独自算出の注目度): 10.08057070583071
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Manipulating elasto-plastic objects remains a significant challenge due to severe self-occlusion, difficulties of representation, and complicated dynamics. This work proposes a novel framework for elasto-plastic object manipulation with a quasi-static assumption for motions, leveraging 3D occupancy to represent such objects, a learned dynamics model trained with 3D occupancy, and a learning-based predictive control algorithm to address these challenges effectively. We build a novel data collection platform to collect full spatial information and propose a pipeline for generating a 3D occupancy dataset. To infer the 3D occupancy during manipulation, an occupancy prediction network is trained with multiple RGB images supervised by the generated dataset. We design a deep neural network empowered by a 3D convolution neural network (CNN) and a graph neural network (GNN) to predict the complex deformation with the inferred 3D occupancy results. A learning-based predictive control algorithm is introduced to plan the robot actions, incorporating a novel shape-based action initialization module specifically designed to improve the planner efficiency. The proposed framework in this paper can successfully shape the elasto-plastic objects into a given goal shape and has been verified in various experiments both in simulation and the real world.
- Abstract(参考訳): 弾塑性物体を操作することは、厳密な自己閉塞、表現の困難、複雑な力学のために依然として重要な課題である。
本研究は, 運動に対する準静的仮定を用いた弾塑性物体の操作のための新しい枠組みを提案し, それらの対象を表現するために3次元占有を活用, 3次元占有を訓練した学習力学モデルと, これらの課題に効果的に対処するための学習に基づく予測制御アルゴリズムを提案する。
空間情報全体を収集する新しいデータ収集プラットフォームを構築し、3次元占有データセットを生成するパイプラインを提案する。
操作中の3D占有率を推定するために、占有率予測ネットワークは、生成されたデータセットによって管理される複数のRGB画像を用いて訓練される。
我々は,3次元畳み込みニューラルネットワーク(CNN)とグラフニューラルネットワーク(GNN)によって強化されたディープニューラルネットワークを設計し,推定された3次元占有結果による複雑な変形を予測する。
ロボットの動作を計画するために学習に基づく予測制御アルゴリズムを導入し、プランナー効率を改善するために特別に設計された新しい形状に基づくアクション初期化モジュールを組み込んだ。
提案する枠組みは, 弾塑性物体を所定の目標形状に整形することができ, シミュレーションと実世界の両方で様々な実験で検証されている。
関連論文リスト
- Self-Supervised Pre-training with Combined Datasets for 3D Perception in Autonomous Driving [46.24100810736637]
我々は、ラベルのないデータから効果的な3D表現をスクラッチから学習する自己教師付き事前学習フレームワークを導入する。
このアプローチは、3Dオブジェクト検出、BEVセグメンテーション、3Dオブジェクトトラッキング、占有率予測などの下流タスクにおけるモデルパフォーマンスを大幅に改善する。
論文 参考訳(メタデータ) (2025-04-17T07:26:11Z) - DOFS: A Real-world 3D Deformable Object Dataset with Full Spatial Information for Dynamics Model Learning [7.513355021861478]
この研究は、完全な空間情報を持つ3次元変形可能な物体(例えば、弾塑性物体)のパイロットデータセットであるDOFSを提案する。
データセットは、アクティブな操作アクション、マルチビューのRGB-Dイメージ、よく登録されたポイントクラウド、3Dデフォルメメッシュ、セマンティクスによる3D占有で構成されている。
さらに, 弾塑性物体の力学をモデル化するための入力として, ダウンサンプリングされた3D占有力と動作を応用したニューラルネットワークを訓練した。
論文 参考訳(メタデータ) (2024-10-29T05:46:16Z) - Predicting 3D Rigid Body Dynamics with Deep Residual Network [0.0]
本稿では,C++で実装された3次元物理シミュレータとPyTorchを用いたディープラーニングモデルを組み合わせたフレームワークを提案する。
シミュレータは、線形および角運動、弾性衝突、流体摩擦、重力効果、減衰を含むトレーニングデータを生成する。
我々は,1万のシミュレーションシナリオのデータセットを用いて,ネットワークの性能を評価する。
論文 参考訳(メタデータ) (2024-07-09T23:40:10Z) - Enhancing Generalizability of Representation Learning for Data-Efficient 3D Scene Understanding [50.448520056844885]
本研究では,実世界のパターンを持つ多様な合成シーンを生成可能なベイズネットワークを提案する。
一連の実験は、既存の最先端の事前学習手法に比べて、我々の手法が一貫した優位性を示す。
論文 参考訳(メタデータ) (2024-06-17T07:43:53Z) - SUGAR: Pre-training 3D Visual Representations for Robotics [85.55534363501131]
ロボット工学のための新しい3D事前学習フレームワークSUGARを紹介した。
SUGARは3次元の点雲を通してオブジェクトの意味的、幾何学的、および余分な特性をキャプチャする。
SuGARの3D表現は最先端の2Dおよび3D表現よりも優れていることを示す。
論文 参考訳(メタデータ) (2024-04-01T21:23:03Z) - AGAR: Attention Graph-RNN for Adaptative Motion Prediction of Point
Clouds of Deformable Objects [7.414594429329531]
変形可能な3Dオブジェクトのポイントクラウド予測のための改良されたアーキテクチャを提案する。
具体的には、変形可能な形状を扱うために、点雲の空間構造を学習し、活用するグラフベースのアプローチを提案する。
提案した適応モジュールは各点の局所的および大域的な動きの合成を制御し、変形可能な3Dオブジェクトの複雑な動きをより効率的にモデル化することができる。
論文 参考訳(メタデータ) (2023-07-19T12:21:39Z) - Uncertainty Guided Policy for Active Robotic 3D Reconstruction using
Neural Radiance Fields [82.21033337949757]
本稿では,物体の暗黙のニューラル表現の各光線に沿ったカラーサンプルの重量分布のエントロピーを計算した線量不確実性推定器を提案する。
提案した推定器を用いた新しい視点から, 基礎となる3次元形状の不確かさを推測することが可能であることを示す。
ニューラルラディアンス場に基づく表現における線量不確実性によって導かれる次ベクター選択ポリシーを提案する。
論文 参考訳(メタデータ) (2022-09-17T21:28:57Z) - SNUG: Self-Supervised Neural Dynamic Garments [14.83072352654608]
本研究では,パラメトリックな人体が着る衣服の動的3次元変形を自己指導的に学習する手法を提案する。
これにより、動的変形や細かいしわを含むインタラクティブな衣服のモデルを、トレーニング時間に2桁の速度で学習することができる。
論文 参考訳(メタデータ) (2022-04-05T13:50:21Z) - Geometry-Contrastive Transformer for Generalized 3D Pose Transfer [95.56457218144983]
この研究の直感は、与えられたメッシュ間の幾何学的不整合を強力な自己認識機構で知覚することである。
本研究では,グローバルな幾何学的不整合に対する3次元構造的知覚能力を有する新しい幾何学コントラスト変換器を提案する。
本稿では, クロスデータセット3次元ポーズ伝達タスクのための半合成データセットとともに, 潜時等尺正則化モジュールを提案する。
論文 参考訳(メタデータ) (2021-12-14T13:14:24Z) - Scene Synthesis via Uncertainty-Driven Attribute Synchronization [52.31834816911887]
本稿では,3次元シーンの多様な特徴パターンを捉えるニューラルシーン合成手法を提案する。
提案手法は,ニューラルネットワークと従来のシーン合成手法の双方の長所を結合する。
論文 参考訳(メタデータ) (2021-08-30T19:45:07Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。