論文の概要: Robotic Table Wiping via Reinforcement Learning and Whole-body
Trajectory Optimization
- arxiv url: http://arxiv.org/abs/2210.10865v1
- Date: Wed, 19 Oct 2022 20:12:43 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-21 14:23:48.911971
- Title: Robotic Table Wiping via Reinforcement Learning and Whole-body
Trajectory Optimization
- Title(参考訳): 強化学習と全体軌道最適化によるロボットテーブルワイピング
- Authors: Thomas Lew, Sumeet Singh, Mario Prats, Jeffrey Bingham, Jonathan
Weisz, Benjie Holson, Xiaohan Zhang, Vikas Sindhwani, Yao Lu, Fei Xia, Peng
Xu, Tingnan Zhang, Jie Tan, Montserrat Gonzalez
- Abstract要約: 本研究では,多目的移動ロボットがテーブルを自律的に拭き取り,こぼれやくちばしを浄化するフレームワークを提案する。
この問題は、高次元の視覚観測によって捉えたクラムや流出の、不確実な潜伏ダイナミクスを推論しながら、ワイピングアクションを計画する必要があるため、難しい。
シミュレーションおよびハードウェア上でのアプローチを幅広く検証する。
- 参考スコア(独自算出の注目度): 19.54264668187374
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We propose a framework to enable multipurpose assistive mobile robots to
autonomously wipe tables to clean spills and crumbs. This problem is
challenging, as it requires planning wiping actions while reasoning over
uncertain latent dynamics of crumbs and spills captured via high-dimensional
visual observations. Simultaneously, we must guarantee constraints satisfaction
to enable safe deployment in unstructured cluttered environments. To tackle
this problem, we first propose a stochastic differential equation to model
crumbs and spill dynamics and absorption with a robot wiper. Using this model,
we train a vision-based policy for planning wiping actions in simulation using
reinforcement learning (RL). To enable zero-shot sim-to-real deployment, we
dovetail the RL policy with a whole-body trajectory optimization framework to
compute base and arm joint trajectories that execute the desired wiping motions
while guaranteeing constraints satisfaction. We extensively validate our
approach in simulation and on hardware. Video: https://youtu.be/inORKP4F3EI
- Abstract(参考訳): 本研究では,多目的移動ロボットがテーブルを自律的に拭き取り,こぼれやくちばしを浄化するフレームワークを提案する。
この問題は、高次元の視覚観測によって捕獲されたクラムやこぼれの不安定な潜在ダイナミクスを推論しながら、ワイピングアクションを計画する必要があるため、困難である。
同時に、構造化されていない乱雑な環境で安全なデプロイを可能にするために、制約満足度を保証しなければなりません。
この問題に対処するために,まず,ロボットワイパーを用いたき裂のモデル化とこぼれのダイナミクスと吸収に関する確率微分方程式を提案する。
このモデルを用いて,強化学習(rl)を用いたシミュレーションにおけるワイピング行動計画のためのビジョンベースポリシーを訓練する。
ゼロショット sim-to-real 展開を可能にするため,RL ポリシを全体軌道最適化フレームワークに精査し,所望のワイピング動作を実行するためのベースとアームの関節軌道を計算する。
我々はシミュレーションとハードウェアのアプローチを広範囲に検証した。
ビデオ:https://youtu.be/inORKP4F3EI
関連論文リスト
- Dynamic Tube MPC: Learning Tube Dynamics with Massively Parallel Simulation for Robust Safety in Practice [28.37162791852146]
追跡不能なエラーは、安全を確保するために名目上の計画の堅牢化を必要とする。
本研究では,超並列シミュレーションを利用して動的チューブ表現を学習する手法を提案する。
結果のダイナミックMPCチューブは、3DホッピングロボットARCHERに適用される。
論文 参考訳(メタデータ) (2024-11-22T21:22:51Z) - A Meta-Engine Framework for Interleaved Task and Motion Planning using Topological Refinements [51.54559117314768]
タスク・アンド・モーション・プランニング(タスク・アンド・モーション・プランニング、TAMP)は、自動化された計画問題の解決策を見つけるための問題である。
本稿では,TAMP問題のモデル化とベンチマークを行うための,汎用的でオープンソースのフレームワークを提案する。
移動エージェントと複数のタスク状態依存障害を含むTAMP問題を解決する革新的なメタ技術を導入する。
論文 参考訳(メタデータ) (2024-08-11T14:57:57Z) - Gaussian Splatting to Real World Flight Navigation Transfer with Liquid Networks [93.38375271826202]
本研究では,シミュレート・トゥ・リアルな視覚四重項ナビゲーションタスクにおける分布シフトに対する一般化とロバスト性を改善する手法を提案する。
まず,擬似飛行力学とガウススプラッティングを統合してシミュレータを構築し,その後,液状ニューラルネットワークを用いてロバストなナビゲーションポリシーを訓練する。
このようにして、我々は3次元ガウススプラッティングラディアンス場レンダリング、専門家による実演訓練データのプログラミング、およびLiquid Networkのタスク理解能力の進歩を組み合わせたフルスタックの模倣学習プロトコルを得る。
論文 参考訳(メタデータ) (2024-06-21T13:48:37Z) - DTC: Deep Tracking Control [16.2850135844455]
本研究では,両世界の強靭性,フット配置精度,地形の一般化を両世界の利点と組み合わせたハイブリッド制御アーキテクチャを提案する。
深層ニューラルネットワークポリシは、最適化された足場を追跡することを目的として、シミュレーションでトレーニングされている。
モデルベースに比べて滑りやすい地盤や変形可能な地盤が存在する場合の強靭性を示す。
論文 参考訳(メタデータ) (2023-09-27T07:57:37Z) - Nonprehensile Planar Manipulation through Reinforcement Learning with
Multimodal Categorical Exploration [8.343657309038285]
強化学習はそのようなロボットコントローラを開発するための強力なフレームワークである。
分類分布を用いたマルチモーダル探索手法を提案する。
学習したポリシは外部の障害や観測ノイズに対して堅牢であり、複数のプッシュ器でタスクにスケールできることが示される。
論文 参考訳(メタデータ) (2023-08-04T16:55:00Z) - Residual Physics Learning and System Identification for Sim-to-real
Transfer of Policies on Buoyancy Assisted Legged Robots [14.760426243769308]
本研究では,BALLUロボットのシステム識別による制御ポリシのロバストなシミュレートを実演する。
標準的な教師あり学習の定式化に頼るのではなく、深層強化学習を利用して外部力政策を訓練する。
シミュレーショントラジェクトリと実世界のトラジェクトリを比較することで,改良されたシミュレーション忠実度を解析する。
論文 参考訳(メタデータ) (2023-03-16T18:49:05Z) - Active Predicting Coding: Brain-Inspired Reinforcement Learning for
Sparse Reward Robotic Control Problems [79.07468367923619]
ニューラルジェネレーティブ・コーディング(NGC)の神経認知計算フレームワークによるロボット制御へのバックプロパゲーションフリーアプローチを提案する。
我々は、スパース報酬から動的オンライン学習を容易にする強力な予測符号化/処理回路から完全に構築されたエージェントを設計する。
提案するActPCエージェントは,スパース(外部)報酬信号に対して良好に動作し,複数の強力なバックプロップベースのRLアプローチと競合し,性能が優れていることを示す。
論文 参考訳(メタデータ) (2022-09-19T16:49:32Z) - Nonprehensile Riemannian Motion Predictive Control [57.295751294224765]
本稿では,リアル・ツー・シムの報酬分析手法を導入し,リアルなロボット・プラットフォームに対する行動の可能性を確実に予測する。
連続的なアクション空間でオブジェクトを反応的にプッシュするクローズドループコントローラを作成します。
我々は,RMPCが乱雑な環境だけでなく,乱雑な環境においても頑健であり,ベースラインよりも優れていることを観察した。
論文 参考訳(メタデータ) (2021-11-15T18:50:04Z) - OSCAR: Data-Driven Operational Space Control for Adaptive and Robust
Robot Manipulation [50.59541802645156]
オペレーショナル・スペース・コントロール(OSC)は、操作のための効果的なタスクスペース・コントローラとして使われてきた。
本稿では,データ駆動型OSCのモデル誤差を補償するOSC for Adaptation and Robustness (OSCAR)を提案する。
本手法は,様々なシミュレーション操作問題に対して評価し,制御器のベースラインの配列よりも大幅に改善されていることを示す。
論文 参考訳(メタデータ) (2021-10-02T01:21:38Z) - Risk-Averse MPC via Visual-Inertial Input and Recurrent Networks for
Online Collision Avoidance [95.86944752753564]
本稿では,モデル予測制御(MPC)の定式化を拡張したオンライン経路計画アーキテクチャを提案する。
我々のアルゴリズムは、状態推定の共分散を推論するリカレントニューラルネットワーク(RNN)とオブジェクト検出パイプラインを組み合わせる。
本手法のロバスト性は, 複雑な四足歩行ロボットの力学で検証され, ほとんどのロボットプラットフォームに適用可能である。
論文 参考訳(メタデータ) (2020-07-28T07:34:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。