論文の概要: Active Exploration for Robotic Manipulation
- arxiv url: http://arxiv.org/abs/2210.12806v1
- Date: Sun, 23 Oct 2022 18:07:51 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-25 21:35:21.368555
- Title: Active Exploration for Robotic Manipulation
- Title(参考訳): ロボットマニピュレーションのためのアクティブ探索
- Authors: Tim Schneider, Boris Belousov, Georgia Chalvatzaki, Diego Romeres,
Devesh K. Jha and Jan Peters
- Abstract要約: 本稿では,スパース・リワード型ロボット操作作業における効率的な学習を可能にするモデルに基づく能動探索手法を提案する。
我々は,提案アルゴリズムをシミュレーションおよび実ロボットで評価し,スクラッチから本手法を訓練した。
- 参考スコア(独自算出の注目度): 40.39182660794481
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Robotic manipulation stands as a largely unsolved problem despite significant
advances in robotics and machine learning in recent years. One of the key
challenges in manipulation is the exploration of the dynamics of the
environment when there is continuous contact between the objects being
manipulated. This paper proposes a model-based active exploration approach that
enables efficient learning in sparse-reward robotic manipulation tasks. The
proposed method estimates an information gain objective using an ensemble of
probabilistic models and deploys model predictive control (MPC) to plan actions
online that maximize the expected reward while also performing directed
exploration. We evaluate our proposed algorithm in simulation and on a real
robot, trained from scratch with our method, on a challenging ball pushing task
on tilted tables, where the target ball position is not known to the agent
a-priori. Our real-world robot experiment serves as a fundamental application
of active exploration in model-based reinforcement learning of complex robotic
manipulation tasks.
- Abstract(参考訳): ロボット操作は、近年のロボット工学と機械学習の大きな進歩にもかかわらず、ほとんど未解決の問題である。
操作における重要な課題の1つは、操作対象間の継続的な接触がある場合の環境のダイナミクスの探求である。
本稿では,ロボット操作タスクにおける効率的な学習を可能にするモデルベースの能動的探索手法を提案する。
提案手法は,確率モデルのアンサンブルを用いて情報ゲイン目標を推定し,モデル予測制御(MPC)をオンラインに展開し,期待される報酬を最大化し,かつ有向探索を行う。
我々は,提案アルゴリズムをシミュレーションおよび実ロボットで評価し,対象のボール位置がエージェントa-プリオリに知られていない傾斜したテーブル上での挑戦的な球押し作業において,スクラッチから訓練した。
実世界のロボット実験は、複雑なロボット操作タスクのモデルベース強化学習における能動的探索の基本的な応用として機能する。
関連論文リスト
- Interactive Planning Using Large Language Models for Partially
Observable Robotics Tasks [54.60571399091711]
大きな言語モデル(LLM)は、オープン語彙タスクを実行するロボットエージェントを作成することで、驚くべき成果を上げている。
LLMを用いた部分的に観測可能なタスクのための対話型計画手法を提案する。
論文 参考訳(メタデータ) (2023-12-11T22:54:44Z) - RoboGen: Towards Unleashing Infinite Data for Automated Robot Learning
via Generative Simulation [64.51563634951394]
RoboGenはジェネレーティブなロボットエージェントで、ジェネレーティブなシミュレーションを通じて、さまざまなロボットのスキルを自動的に学習する。
我々の研究は、大規模モデルに埋め込まれた広範囲で多目的な知識を抽出し、それらをロボット工学の分野に移す試みである。
論文 参考訳(メタデータ) (2023-11-02T17:59:21Z) - Robot Fine-Tuning Made Easy: Pre-Training Rewards and Policies for
Autonomous Real-World Reinforcement Learning [58.3994826169858]
ロボット強化学習のためのリセット不要な微調整システムであるRoboFuMEを紹介する。
我々の洞察は、オフラインの強化学習技術を利用して、事前訓練されたポリシーの効率的なオンライン微調整を確保することである。
提案手法では,既存のロボットデータセットからのデータを組み込んで,目標タスクを3時間以内の自律現実体験で改善することができる。
論文 参考訳(メタデータ) (2023-10-23T17:50:08Z) - Pave the Way to Grasp Anything: Transferring Foundation Models for
Universal Pick-Place Robots [50.73735524550534]
そこで本稿では,最先端基礎モデルによって生成された言語基底セグメンテーションマスクを効果的に活用する新しいパラダイムを提案する。
マスクから伝達される正確なセマンティクスとジオメトリを多視点ポリシーモデルに統合することにより、正確なオブジェクトのポーズを認識し、サンプル効率のよい学習を可能にする。
論文 参考訳(メタデータ) (2023-06-09T07:22:12Z) - Bridging Active Exploration and Uncertainty-Aware Deployment Using
Probabilistic Ensemble Neural Network Dynamics [11.946807588018595]
本稿では,活発な探索と不確実性を考慮した展開を橋渡しするモデルベース強化学習フレームワークを提案する。
探索と展開の対立する2つのタスクは、最先端のサンプリングベースのMPCによって最適化されている。
自動運転車と車輪付きロボットの両方で実験を行い、探索と展開の両方に有望な結果を示します。
論文 参考訳(メタデータ) (2023-05-20T17:20:12Z) - Active Predicting Coding: Brain-Inspired Reinforcement Learning for
Sparse Reward Robotic Control Problems [79.07468367923619]
ニューラルジェネレーティブ・コーディング(NGC)の神経認知計算フレームワークによるロボット制御へのバックプロパゲーションフリーアプローチを提案する。
我々は、スパース報酬から動的オンライン学習を容易にする強力な予測符号化/処理回路から完全に構築されたエージェントを設計する。
提案するActPCエージェントは,スパース(外部)報酬信号に対して良好に動作し,複数の強力なバックプロップベースのRLアプローチと競合し,性能が優れていることを示す。
論文 参考訳(メタデータ) (2022-09-19T16:49:32Z) - SAGCI-System: Towards Sample-Efficient, Generalizable, Compositional,
and Incremental Robot Learning [41.19148076789516]
上記の4つの要件を満たすために,SAGCIシステムと呼ばれる体系的な学習フレームワークを導入する。
本システムはまず,ロボットの手首に搭載されたカメラによって収集された生点雲を入力とし,URDFに代表される周囲環境の初期モデリングを生成する。
そのロボットは、対話的な知覚を利用して環境と対話し、URDFのオンライン検証と修正を行う。
論文 参考訳(メタデータ) (2021-11-29T16:53:49Z) - Reinforcement Learning Experiments and Benchmark for Solving Robotic
Reaching Tasks [0.0]
強化学習はロボットアームによる到達タスクの解決に成功している。
ハイドサイト体験再生探索技術により報奨信号の増大が, オフ・ポリティクス・エージェントの平均リターンを増加させることが示されている。
論文 参考訳(メタデータ) (2020-11-11T14:00:49Z) - Learning compositional models of robot skills for task and motion
planning [39.36562555272779]
センサモレータプリミティブを用いて複雑な長距離操作問題を解決することを学ぶ。
能動的学習とサンプリングに最先端の手法を用いる。
我々は,選択した原始行動の質を計測することで,シミュレーションと実世界の双方でアプローチを評価する。
論文 参考訳(メタデータ) (2020-06-08T20:45:34Z) - Autonomous Planning Based on Spatial Concepts to Tidy Up Home
Environments with Service Robots [5.739787445246959]
本研究では,確率的生成モデルのパラメータを学習することにより,対象物の順序や位置を効率的に推定できる新しい計画法を提案する。
このモデルにより、ロボットは、Tidied環境で収集されたマルチモーダルセンサ情報を用いて、オブジェクトと場所の共起確率の分布を学習することができる。
我々は,世界ロボットサミット2018国際ロボティクスコンペティションのTidy Up Hereタスクの条件を再現する実験シミュレーションにより,提案手法の有効性を評価する。
論文 参考訳(メタデータ) (2020-02-10T11:49:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。