論文の概要: Robotic Table Wiping via Reinforcement Learning and Whole-body
Trajectory Optimization
- arxiv url: http://arxiv.org/abs/2210.10865v1
- Date: Wed, 19 Oct 2022 20:12:43 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-21 14:23:48.911971
- Title: Robotic Table Wiping via Reinforcement Learning and Whole-body
Trajectory Optimization
- Title(参考訳): 強化学習と全体軌道最適化によるロボットテーブルワイピング
- Authors: Thomas Lew, Sumeet Singh, Mario Prats, Jeffrey Bingham, Jonathan
Weisz, Benjie Holson, Xiaohan Zhang, Vikas Sindhwani, Yao Lu, Fei Xia, Peng
Xu, Tingnan Zhang, Jie Tan, Montserrat Gonzalez
- Abstract要約: 本研究では,多目的移動ロボットがテーブルを自律的に拭き取り,こぼれやくちばしを浄化するフレームワークを提案する。
この問題は、高次元の視覚観測によって捉えたクラムや流出の、不確実な潜伏ダイナミクスを推論しながら、ワイピングアクションを計画する必要があるため、難しい。
シミュレーションおよびハードウェア上でのアプローチを幅広く検証する。
- 参考スコア(独自算出の注目度): 19.54264668187374
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We propose a framework to enable multipurpose assistive mobile robots to
autonomously wipe tables to clean spills and crumbs. This problem is
challenging, as it requires planning wiping actions while reasoning over
uncertain latent dynamics of crumbs and spills captured via high-dimensional
visual observations. Simultaneously, we must guarantee constraints satisfaction
to enable safe deployment in unstructured cluttered environments. To tackle
this problem, we first propose a stochastic differential equation to model
crumbs and spill dynamics and absorption with a robot wiper. Using this model,
we train a vision-based policy for planning wiping actions in simulation using
reinforcement learning (RL). To enable zero-shot sim-to-real deployment, we
dovetail the RL policy with a whole-body trajectory optimization framework to
compute base and arm joint trajectories that execute the desired wiping motions
while guaranteeing constraints satisfaction. We extensively validate our
approach in simulation and on hardware. Video: https://youtu.be/inORKP4F3EI
- Abstract(参考訳): 本研究では,多目的移動ロボットがテーブルを自律的に拭き取り,こぼれやくちばしを浄化するフレームワークを提案する。
この問題は、高次元の視覚観測によって捕獲されたクラムやこぼれの不安定な潜在ダイナミクスを推論しながら、ワイピングアクションを計画する必要があるため、困難である。
同時に、構造化されていない乱雑な環境で安全なデプロイを可能にするために、制約満足度を保証しなければなりません。
この問題に対処するために,まず,ロボットワイパーを用いたき裂のモデル化とこぼれのダイナミクスと吸収に関する確率微分方程式を提案する。
このモデルを用いて,強化学習(rl)を用いたシミュレーションにおけるワイピング行動計画のためのビジョンベースポリシーを訓練する。
ゼロショット sim-to-real 展開を可能にするため,RL ポリシを全体軌道最適化フレームワークに精査し,所望のワイピング動作を実行するためのベースとアームの関節軌道を計算する。
我々はシミュレーションとハードウェアのアプローチを広範囲に検証した。
ビデオ:https://youtu.be/inORKP4F3EI
関連論文リスト
- Controllable Safety-Critical Closed-loop Traffic Simulation via Guided
Diffusion [100.4988219600854]
誘導拡散モデルに根ざした新しいクローズドループシミュレーションフレームワークを提案する。
提案手法は, 現実の条件を密にエミュレートする現実的なロングテールシナリオの生成と, 制御性の向上という, 二つの異なる利点をもたらす。
我々はNuScenesデータセットを実証的に検証し、リアリズムと制御性の両方の改善を実証した。
論文 参考訳(メタデータ) (2023-12-31T04:14:43Z) - DTC: Deep Tracking Control [16.2850135844455]
本研究では,両世界の強靭性,フット配置精度,地形の一般化を両世界の利点と組み合わせたハイブリッド制御アーキテクチャを提案する。
深層ニューラルネットワークポリシは、最適化された足場を追跡することを目的として、シミュレーションでトレーニングされている。
モデルベースに比べて滑りやすい地盤や変形可能な地盤が存在する場合の強靭性を示す。
論文 参考訳(メタデータ) (2023-09-27T07:57:37Z) - Nonprehensile Planar Manipulation through Reinforcement Learning with
Multimodal Categorical Exploration [8.343657309038285]
強化学習はそのようなロボットコントローラを開発するための強力なフレームワークである。
分類分布を用いたマルチモーダル探索手法を提案する。
学習したポリシは外部の障害や観測ノイズに対して堅牢であり、複数のプッシュ器でタスクにスケールできることが示される。
論文 参考訳(メタデータ) (2023-08-04T16:55:00Z) - Residual Physics Learning and System Identification for Sim-to-real
Transfer of Policies on Buoyancy Assisted Legged Robots [14.760426243769308]
本研究では,BALLUロボットのシステム識別による制御ポリシのロバストなシミュレートを実演する。
標準的な教師あり学習の定式化に頼るのではなく、深層強化学習を利用して外部力政策を訓練する。
シミュレーショントラジェクトリと実世界のトラジェクトリを比較することで,改良されたシミュレーション忠実度を解析する。
論文 参考訳(メタデータ) (2023-03-16T18:49:05Z) - Domain Randomization for Robust, Affordable and Effective Closed-loop
Control of Soft Robots [10.977130974626668]
ソフトロボットは、コンタクトや適応性に対する本質的な安全性によって人気を集めている。
本稿では、ソフトロボットのRLポリシーを強化することにより、ドメインランダム化(DR)がこの問題を解決する方法を示す。
本稿では,変形可能なオブジェクトに対する動的パラメータの自動推論のための,従来の適応的領域ランダム化手法に対する新しいアルゴリズム拡張を提案する。
論文 参考訳(メタデータ) (2023-03-07T18:50:00Z) - Active Predicting Coding: Brain-Inspired Reinforcement Learning for
Sparse Reward Robotic Control Problems [79.07468367923619]
ニューラルジェネレーティブ・コーディング(NGC)の神経認知計算フレームワークによるロボット制御へのバックプロパゲーションフリーアプローチを提案する。
我々は、スパース報酬から動的オンライン学習を容易にする強力な予測符号化/処理回路から完全に構築されたエージェントを設計する。
提案するActPCエージェントは,スパース(外部)報酬信号に対して良好に動作し,複数の強力なバックプロップベースのRLアプローチと競合し,性能が優れていることを示す。
論文 参考訳(メタデータ) (2022-09-19T16:49:32Z) - Nonprehensile Riemannian Motion Predictive Control [57.295751294224765]
本稿では,リアル・ツー・シムの報酬分析手法を導入し,リアルなロボット・プラットフォームに対する行動の可能性を確実に予測する。
連続的なアクション空間でオブジェクトを反応的にプッシュするクローズドループコントローラを作成します。
我々は,RMPCが乱雑な環境だけでなく,乱雑な環境においても頑健であり,ベースラインよりも優れていることを観察した。
論文 参考訳(メタデータ) (2021-11-15T18:50:04Z) - OSCAR: Data-Driven Operational Space Control for Adaptive and Robust
Robot Manipulation [50.59541802645156]
オペレーショナル・スペース・コントロール(OSC)は、操作のための効果的なタスクスペース・コントローラとして使われてきた。
本稿では,データ駆動型OSCのモデル誤差を補償するOSC for Adaptation and Robustness (OSCAR)を提案する。
本手法は,様々なシミュレーション操作問題に対して評価し,制御器のベースラインの配列よりも大幅に改善されていることを示す。
論文 参考訳(メタデータ) (2021-10-02T01:21:38Z) - SABER: Data-Driven Motion Planner for Autonomously Navigating
Heterogeneous Robots [112.2491765424719]
我々は、データ駆動型アプローチを用いて、異種ロボットチームをグローバルな目標に向けてナビゲートする、エンドツーエンドのオンラインモーションプランニングフレームワークを提案する。
モデル予測制御(SMPC)を用いて,ロボット力学を満たす制御入力を計算し,障害物回避時の不確実性を考慮した。
リカレントニューラルネットワークは、SMPC有限時間地平線解における将来の状態の不確かさを素早く推定するために用いられる。
ディープQ学習エージェントがハイレベルパスプランナーとして機能し、SMPCにロボットを望ましいグローバルな目標に向けて移動させる目標位置を提供する。
論文 参考訳(メタデータ) (2021-08-03T02:56:21Z) - Risk-Averse MPC via Visual-Inertial Input and Recurrent Networks for
Online Collision Avoidance [95.86944752753564]
本稿では,モデル予測制御(MPC)の定式化を拡張したオンライン経路計画アーキテクチャを提案する。
我々のアルゴリズムは、状態推定の共分散を推論するリカレントニューラルネットワーク(RNN)とオブジェクト検出パイプラインを組み合わせる。
本手法のロバスト性は, 複雑な四足歩行ロボットの力学で検証され, ほとんどのロボットプラットフォームに適用可能である。
論文 参考訳(メタデータ) (2020-07-28T07:34:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。