論文の概要: Learning Predictive Representations for Deformable Objects Using
Contrastive Estimation
- arxiv url: http://arxiv.org/abs/2003.05436v1
- Date: Wed, 11 Mar 2020 17:55:15 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-24 13:19:22.197778
- Title: Learning Predictive Representations for Deformable Objects Using
Contrastive Estimation
- Title(参考訳): コントラスト推定を用いた変形可能な物体の予測表現の学習
- Authors: Wilson Yan, Ashwin Vangipuram, Pieter Abbeel, Lerrel Pinto
- Abstract要約: 視覚表現モデルと動的モデルの両方を協調的に最適化する新しい学習フレームワークを提案する。
我々は,標準モデルに基づく学習手法をロープや布の操作スイートで大幅に改善した。
- 参考スコア(独自算出の注目度): 83.16948429592621
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Using visual model-based learning for deformable object manipulation is
challenging due to difficulties in learning plannable visual representations
along with complex dynamic models. In this work, we propose a new learning
framework that jointly optimizes both the visual representation model and the
dynamics model using contrastive estimation. Using simulation data collected by
randomly perturbing deformable objects on a table, we learn latent dynamics
models for these objects in an offline fashion. Then, using the learned models,
we use simple model-based planning to solve challenging deformable object
manipulation tasks such as spreading ropes and cloths. Experimentally, we show
substantial improvements in performance over standard model-based learning
techniques across our rope and cloth manipulation suite. Finally, we transfer
our visual manipulation policies trained on data purely collected in simulation
to a real PR2 robot through domain randomization.
- Abstract(参考訳): 変形可能なオブジェクト操作のためのビジュアルモデルベースの学習は、複雑な動的モデルとともに計画可能な視覚的表現を学ぶのが困難であるため、難しい。
本研究では,視覚表現モデルとダイナミクスモデルの両方を,コントラスト推定を用いて共同で最適化する新しい学習フレームワークを提案する。
テーブル上の変形可能なオブジェクトをランダムに摂動することで収集したシミュレーションデータを用いて、これらのオブジェクトの潜在力学モデルをオフラインで学習する。
次に,学習モデルを用いて簡易なモデルに基づく計画手法を用いて,ロープや布を広めるなどの変形可能な物体操作課題を解決する。
実験により, ロープや布の操作において, 標準モデルに基づく学習技術よりも性能が大幅に向上した。
最後に、シミュレーションで収集したデータに基づいてトレーニングしたビジュアル操作ポリシーを、ドメインのランダム化を通じて実際のpr2ロボットに転送する。
関連論文リスト
- Learning Low-Dimensional Strain Models of Soft Robots by Looking at the Evolution of Their Shape with Application to Model-Based Control [2.058941610795796]
本稿では,低次元物理モデル学習のための合理化手法を提案する。
各種平面ソフトマニピュレータを用いたシミュレーションにより,本手法の有効性を検証した。
物理的に互換性のあるモデルを生成する方法のおかげで、学習したモデルはモデルベースの制御ポリシーと簡単に組み合わせることができる。
論文 参考訳(メタデータ) (2024-10-31T18:37:22Z) - Model-based Policy Optimization using Symbolic World Model [46.42871544295734]
ロボット工学における学習に基づく制御手法の適用は、大きな課題を呈している。
1つは、モデルなし強化学習アルゴリズムがサンプル効率の低い観測データを使用することである。
シンボリック回帰によって生成されるシンボリック表現による遷移ダイナミクスの近似を提案する。
論文 参考訳(メタデータ) (2024-07-18T13:49:21Z) - Dynamic-Resolution Model Learning for Object Pile Manipulation [33.05246884209322]
本研究では,様々な抽象レベルで動的かつ適応的な表現を学習し,効率と効率の最適なトレードオフを実現する方法について検討する。
具体的には、環境の動的分解能粒子表現を構築し、グラフニューラルネットワーク(GNN)を用いた統一力学モデルを学ぶ。
本手法は, 粒状オブジェクトの収集, ソート, 再分配において, 最先端の固定解像度ベースラインよりも優れた性能が得られることを示す。
論文 参考訳(メタデータ) (2023-06-29T05:51:44Z) - Predictive Experience Replay for Continual Visual Control and
Forecasting [62.06183102362871]
視覚力学モデリングのための新しい連続学習手法を提案し,その視覚制御と予測における有効性について検討する。
まず,タスク固有のダイナミクスをガウスの混合で学習する混合世界モデルを提案し,その上で,破滅的な忘れを克服するための新たなトレーニング戦略を提案する。
我々のモデルは,DeepMind Control と Meta-World のベンチマークにおいて,既存の連続的学習アルゴリズムと視覚的RLアルゴリズムの単純な組み合わせよりも優れている。
論文 参考訳(メタデータ) (2023-03-12T05:08:03Z) - ACID: Action-Conditional Implicit Visual Dynamics for Deformable Object
Manipulation [135.10594078615952]
本稿では,体積変形可能なオブジェクトに対する動作条件の視覚力学モデルであるACIDを紹介する。
ベンチマークには17,000以上のアクション・トラジェクトリー、6種類のぬいぐるみと78種類の変種が含まれている。
我々のモデルは、幾何学、対応、力学の予測において最高の性能を達成する。
論文 参考訳(メタデータ) (2022-03-14T04:56:55Z) - Learning Dynamics Models for Model Predictive Agents [28.063080817465934]
モデルに基づく強化学習は、データからテクトダイナミックスモデルを学習し、そのモデルを使用して振る舞いを最適化する。
本稿では, 動的モデル学習における設計選択の役割を, 基礎構造モデルとの比較により明らかにすることを目的としている。
論文 参考訳(メタデータ) (2021-09-29T09:50:25Z) - Model-agnostic multi-objective approach for the evolutionary discovery
of mathematical models [55.41644538483948]
現代のデータ科学では、どの部分がより良い結果を得るために置き換えられるかというモデルの性質を理解することがより興味深い。
合成データ駆動型モデル学習において,多目的進化最適化を用いてアルゴリズムの所望特性を求める。
論文 参考訳(メタデータ) (2021-07-07T11:17:09Z) - Model-Based Visual Planning with Self-Supervised Functional Distances [104.83979811803466]
モデルに基づく視覚的目標達成のための自己監視手法を提案する。
私たちのアプローチは、オフラインでラベルなしのデータを使って完全に学習します。
このアプローチは,モデルフリーとモデルベース先行手法の両方で大幅に性能が向上することがわかった。
論文 参考訳(メタデータ) (2020-12-30T23:59:09Z) - Model-Based Inverse Reinforcement Learning from Visual Demonstrations [20.23223474119314]
本稿では,視覚的人間の実演のみを与えられた場合のコスト関数を学習する,勾配に基づく逆強化学習フレームワークを提案する。
学習したコスト関数は、視覚モデル予測制御によって実証された振る舞いを再現するために使用される。
2つの基本的なオブジェクト操作タスクでハードウェアのフレームワークを評価する。
論文 参考訳(メタデータ) (2020-10-18T17:07:53Z) - Goal-Aware Prediction: Learning to Model What Matters [105.43098326577434]
学習した前進力学モデルを使用する際の根本的な課題の1つは、学習したモデルの目的と下流のプランナーやポリシーの目標とのミスマッチである。
本稿では,タスク関連情報への直接的予測を提案し,そのモデルが現在のタスクを認識し,状態空間の関連量のみをモデル化することを奨励する。
提案手法は,目標条件付きシーンの関連部分を効果的にモデル化し,その結果,標準タスク非依存のダイナミックスモデルやモデルレス強化学習より優れていることがわかった。
論文 参考訳(メタデータ) (2020-07-14T16:42:59Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。