論文の概要: Implicit Neural-Representation Learning for Elastic Deformable-Object Manipulations
- arxiv url: http://arxiv.org/abs/2505.00500v1
- Date: Thu, 01 May 2025 13:00:56 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-02 19:15:55.30538
- Title: Implicit Neural-Representation Learning for Elastic Deformable-Object Manipulations
- Title(参考訳): 弾性変形物体マニピュレーションのための入射ニューラル表現学習
- Authors: Minseok Song, JeongHo Ha, Bonggyeong Park, Daehyung Park,
- Abstract要約: InR-DOMと呼ばれる弾性DOMのための新しい暗黙的ニューラル表現学習を提案する。
本手法は,符号付き距離関数として表される完全かつ暗黙的な曲面を再構成する部分可観測弾性物体に関連する一貫した状態表現を学習する。
我々は,3つのシミュレーション環境の構築と,フランカ・エミカ・パンダアームを用いた実世界の操作に関する研究を定量的に定性的に分析する。
- 参考スコア(独自算出の注目度): 5.257305312436567
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We aim to solve the problem of manipulating deformable objects, particularly elastic bands, in real-world scenarios. However, deformable object manipulation (DOM) requires a policy that works on a large state space due to the unlimited degree of freedom (DoF) of deformable objects. Further, their dense but partial observations (e.g., images or point clouds) may increase the sampling complexity and uncertainty in policy learning. To figure it out, we propose a novel implicit neural-representation (INR) learning for elastic DOMs, called INR-DOM. Our method learns consistent state representations associated with partially observable elastic objects reconstructing a complete and implicit surface represented as a signed distance function. Furthermore, we perform exploratory representation fine-tuning through reinforcement learning (RL) that enables RL algorithms to effectively learn exploitable representations while efficiently obtaining a DOM policy. We perform quantitative and qualitative analyses building three simulated environments and real-world manipulation studies with a Franka Emika Panda arm. Videos are available at http://inr-dom.github.io.
- Abstract(参考訳): 現実のシナリオにおいて、変形可能なオブジェクト、特に弾性バンドを操作することの問題を解決することを目的としている。
しかし、変形可能なオブジェクト操作(DOM)は、変形可能なオブジェクトの無限の自由度(DoF)のため、大きな状態空間で動作するポリシーを必要とする。
さらに、密集しているが部分的な観測(画像や点雲など)は、政策学習におけるサンプリングの複雑さと不確実性を増大させる可能性がある。
そこで本研究では,新しい暗黙的ニューラル表現学習法(INR-DOM)を提案する。
本手法は,符号付き距離関数として表される完全かつ暗黙的な曲面を再構成する部分可観測弾性物体に関連する一貫した状態表現を学習する。
さらに、RLアルゴリズムがDOMポリシーを効率的に獲得しつつ、効果的に活用可能な表現を学習できる強化学習(RL)による探索的表現微調整を行う。
我々は,3つのシミュレーション環境の構築と,フランカ・エミカ・パンダアームを用いた実世界操作研究を行った。
ビデオはhttp://inr-dom.github.io.comで公開されている。
関連論文リスト
- Offline Action-Free Learning of Ex-BMDPs by Comparing Diverse Datasets [87.62730694973696]
本稿では,エージェント間の制御可能な特徴ダイナミクスの違いを利用して表現を学習する,サンプル効率のよいアルゴリズムCRAFTを紹介する。
我々はCRAFTの性能を理論的に保証し、おもちゃの例でその実現可能性を示す。
論文 参考訳(メタデータ) (2025-03-26T22:05:57Z) - Cross-Domain Policy Adaptation by Capturing Representation Mismatch [53.087413751430255]
強化学習(RL)において、動的に異なる領域に移行できる効果的な政策を学ぶことが不可欠である。
本稿では、ソースドメインとターゲットドメインとの間に動的ミスマッチが存在する場合の動的適応設定について考察する。
対象領域でのみ表現学習を行い、ソース領域からの遷移における表現偏差を測定する。
論文 参考訳(メタデータ) (2024-05-24T09:06:12Z) - Efficient Imitation Learning with Conservative World Models [54.52140201148341]
報酬機能のない専門家によるデモンストレーションから政策学習の課題に取り組む。
純粋な強化学習ではなく、微調整問題として模倣学習を再構成する。
論文 参考訳(メタデータ) (2024-05-21T20:53:18Z) - Part-Guided 3D RL for Sim2Real Articulated Object Manipulation [27.422878372169805]
実演を伴わずに調音物体の操作を学習できる部分誘導型3D RLフレームワークを提案する。
2次元分割と3次元RLの長所を組み合わせることにより,RL政策訓練の効率化を図る。
一つの汎用的なRLポリシーは、シミュレーション中に複数のオブジェクト操作タスクを同時にトレーニングすることができる。
論文 参考訳(メタデータ) (2024-04-26T10:18:17Z) - CORN: Contact-based Object Representation for Nonprehensile Manipulation of General Unseen Objects [1.3299507495084417]
非包括的操作は、野生ではあまりに薄く、大きく、または、そうでなければ不快な物体を操作するために不可欠である。
そこで本研究では,接触型オブジェクト表現と事前学習パイプラインを提案する。
論文 参考訳(メタデータ) (2024-03-16T01:47:53Z) - GenDOM: Generalizable One-shot Deformable Object Manipulation with Parameter-Aware Policy [22.965840244436777]
我々は,1つの実世界の実演だけで異なる変形可能なオブジェクトを操作できるフレームワークであるGenDOMを紹介した。
新しいオブジェクトが推測されると、GenDOMは1つの実世界のデモだけで変形可能なオブジェクトパラメータを推定できる。
シミュレーションおよび実世界のオブジェクト操作設定の実証検証により,本手法が一つの実演で異なるオブジェクトを操作できることが明らかとなった。
論文 参考訳(メタデータ) (2023-09-16T17:18:23Z) - Provably Efficient Reinforcement Learning in Partially Observable
Dynamical Systems [97.12538243736705]
関数近似を用いた部分観測可能力学系の強化学習について検討する。
本稿では,POMDP,LQG,予測状態表現 (Predictive State Representations,PSR) などのモデルや,POMDPのHilbert Space Embeddingsや観測可能なPOMDPを遅延低ランク遷移で組み込むことのできる,汎用的な新しいテクスタイト(Partially Observar Bilinear Actor-Critic)フレームワークを提案する。
論文 参考訳(メタデータ) (2022-06-24T00:27:42Z) - Learning Generalizable Dexterous Manipulation from Human Grasp
Affordance [11.060931225148936]
マルチフィンガーハンドによる有害な操作は、ロボット工学における最も難しい問題の1つだ。
模倣学習の最近の進歩は、強化学習と比較してサンプル効率を大幅に改善した。
本稿では,様々な3Dオブジェクトをカテゴリ内に配置した大規模実演を用いて,デクスタラスな操作を学習することを提案する。
論文 参考訳(メタデータ) (2022-04-05T16:26:22Z) - Exploratory State Representation Learning [63.942632088208505]
本稿では,XSRL(eXploratory State Representation Learning)と呼ばれる新しい手法を提案する。
一方、コンパクトな状態表現と、その表現から不可解な情報を除去するために使用される状態遷移推定器を共同で学習する。
一方、逆モデルを継続的に訓練し、このモデルの予測誤差に$k$-stepの学習促進ボーナスを加え、発見ポリシーの目的を形成する。
論文 参考訳(メタデータ) (2021-09-28T10:11:07Z) - Neural Articulated Radiance Field [90.91714894044253]
本稿では,画像から学習した明瞭な物体に対する新しい変形可能な3次元表現であるニューラルArticulated Radiance Field(NARF)を提案する。
実験の結果,提案手法は効率的であり,新しいポーズにうまく一般化できることがわかった。
論文 参考訳(メタデータ) (2021-04-07T13:23:14Z) - SoftGym: Benchmarking Deep Reinforcement Learning for Deformable Object
Manipulation [15.477950393687836]
我々は、変形可能なオブジェクトを操作するためのオープンソースのシミュレーションベンチマークであるSoftGymを紹介する。
我々はこれらの課題に対して様々なアルゴリズムを評価し、強化学習アルゴリズムの課題を強調した。
論文 参考訳(メタデータ) (2020-11-14T03:46:59Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。