論文の概要: Reconciling Reality through Simulation: A Real-to-Sim-to-Real Approach for Robust Manipulation
- arxiv url: http://arxiv.org/abs/2403.03949v2
- Date: Tue, 29 Oct 2024 04:41:49 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-10-30 13:37:32.163746
- Title: Reconciling Reality through Simulation: A Real-to-Sim-to-Real Approach for Robust Manipulation
- Title(参考訳): シミュレーションによる現実の再現:ロバストマニピュレーションのための実-実-実-実-実-
- Authors: Marcel Torne, Anthony Simeonov, Zechu Li, April Chan, Tao Chen, Abhishek Gupta, Pulkit Agrawal,
- Abstract要約: 模倣学習法は、対象のポーズ、身体的乱れ、視覚的気晴らしに頑健なポリシーを学ぶために、人間の監督を必要とする。
一方、強化学習は、堅牢な振る舞いを学ぶために、自律的に環境を探索することができるが、現実的なデータ収集を非現実的に必要とすることができる。
本研究では, 実世界の模倣学習政策を, 「デジタルツイン」シミュレーション環境における強化学習によって強化するシステムであるRialToを提案する。
- 参考スコア(独自算出の注目度): 22.16213887836936
- License:
- Abstract: Imitation learning methods need significant human supervision to learn policies robust to changes in object poses, physical disturbances, and visual distractors. Reinforcement learning, on the other hand, can explore the environment autonomously to learn robust behaviors but may require impractical amounts of unsafe real-world data collection. To learn performant, robust policies without the burden of unsafe real-world data collection or extensive human supervision, we propose RialTo, a system for robustifying real-world imitation learning policies via reinforcement learning in "digital twin" simulation environments constructed on the fly from small amounts of real-world data. To enable this real-to-sim-to-real pipeline, RialTo proposes an easy-to-use interface for quickly scanning and constructing digital twins of real-world environments. We also introduce a novel "inverse distillation" procedure for bringing real-world demonstrations into simulated environments for efficient fine-tuning, with minimal human intervention and engineering required. We evaluate RialTo across a variety of robotic manipulation problems in the real world, such as robustly stacking dishes on a rack, placing books on a shelf, and six other tasks. RialTo increases (over 67%) in policy robustness without requiring extensive human data collection. Project website and videos at https://real-to-sim-to-real.github.io/RialTo/
- Abstract(参考訳): 模倣学習法は、物体のポーズ、身体的乱れ、視覚的気晴らしなどの変化に頑健な政策を学ぶために、重要な人間の監督を必要とする。
一方、強化学習は、堅牢な振る舞いを学ぶために自律的に環境を探索することができるが、非現実的な量の現実世界のデータ収集を必要とする可能性がある。
安全でない実世界のデータ収集や広範囲な人的監督の負担を伴わずに、パフォーマンスの高いロバストなポリシーを学習するために、少量の実世界のデータから構築された「デジタルツイン」シミュレーション環境において、強化学習を介して実世界の模倣学習ポリシーを堅牢化するシステムであるRialToを提案する。
このリアル・トゥ・シミュレート・トゥ・リアルパイプラインを実現するために、RialToは現実世界環境のデジタルツインを素早くスキャンして構築するための使いやすいインターフェースを提案する。
また,人間の介入や工学を最小限に抑えて,実世界の実演をシミュレーション環境に導入し,効率的な微調整を行う「逆蒸留」手法も導入した。
私たちはRialToを、ラックに皿をしっかり積み重ねたり、棚に本を置いたり、その他6つのタスクなど、現実世界のさまざまなロボット操作の問題にまたがって評価した。
RialToは、大規模な人的データ収集を必要とせずに、ポリシーの堅牢性を高める(67%以上)。
Project website and video at https://real-to-sim-to-real.github.io/RialTo/
関連論文リスト
- Efficient Imitation Learning with Conservative World Models [54.52140201148341]
報酬機能のない専門家によるデモンストレーションから政策学習の課題に取り組む。
純粋な強化学習ではなく、微調整問題として模倣学習を再構成する。
論文 参考訳(メタデータ) (2024-05-21T20:53:18Z) - Evaluating Real-World Robot Manipulation Policies in Simulation [91.55267186958892]
実環境と模擬環境の制御と視覚的格差は、信頼性のある模擬評価の鍵となる課題である。
実環境に完全忠実なデジタル双生児を作らなくても、これらのギャップを軽減できる手法を提案する。
シミュレーション環境の集合体であるSIMPLERを作成した。
論文 参考訳(メタデータ) (2024-05-09T17:30:16Z) - ASID: Active Exploration for System Identification in Robotic Manipulation [32.27299045059514]
本稿では,少数の実世界のデータを活用して,シミュレーションモデルを自律的に洗練し,正確な制御戦略を立案する学習システムを提案する。
本研究は, ロボット操作作業における調音, 質量, その他の物理パラメータの同定における, このパラダイムの有効性を実証する。
論文 参考訳(メタデータ) (2024-04-18T16:35:38Z) - MoDem-V2: Visuo-Motor World Models for Real-World Robot Manipulation [29.349549097807916]
MoDem-V2は、非装備の現実世界でコンタクトリッチな操作を直接学習することができる。
実世界の安全性を尊重しながら、モデル学習におけるデモンストレーションを活用するための重要な要素を同定する。
論文 参考訳(メタデータ) (2023-09-25T15:51:29Z) - Navigating to Objects in the Real World [76.1517654037993]
本稿では,古典的,モジュール的,エンド・ツー・エンドの学習手法と比較した,意味的視覚ナビゲーション手法に関する大規模な実証的研究について述べる。
モジュラー学習は実世界ではうまく機能し、90%の成功率に達しています。
対照的に、エンド・ツー・エンドの学習は、シミュレーションと現実の間の画像領域の差が大きいため、77%のシミュレーションから23%の実際の成功率へと低下する。
論文 参考訳(メタデータ) (2022-12-02T01:10:47Z) - DeXtreme: Transfer of Agile In-hand Manipulation from Simulation to
Reality [64.51295032956118]
我々は人型ロボットの手で頑健な操作を行える政策を訓練する。
本研究は,各種ハードウェアおよびシミュレータのデクスタラス操作におけるsim-to-real転送の可能性を再確認する。
論文 参考訳(メタデータ) (2022-10-25T01:51:36Z) - Practical Imitation Learning in the Real World via Task Consistency Loss [18.827979446629296]
本稿では,機能レベルと行動予測レベルの両方において,シミュレートと実際のアライメントを促進する自己監督的損失を提案する。
我々は、シミュレートとリアルで遠隔操作されたデモンストレーションを16.2時間しか使っていない10のシーンで80%の成功を達成した。
論文 参考訳(メタデータ) (2022-02-03T21:43:06Z) - Reactive Long Horizon Task Execution via Visual Skill and Precondition
Models [59.76233967614774]
シミュレーションで学習したモデルを用いて、単純なタスクプランナの構成要素をグラウンド化することで、見知らぬロボットタスクを達成できるシミュレート・トゥ・リアル・トレーニングのアプローチについて述べる。
シミュレーションでは91.6%から98%,実世界の成功率は10%から80%に増加した。
論文 参考訳(メタデータ) (2020-11-17T15:24:01Z) - Sim-to-Real Transfer with Incremental Environment Complexity for
Reinforcement Learning of Depth-Based Robot Navigation [1.290382979353427]
段階的環境複雑性を用いたソフト・アクター・クリティカル(SAC)トレーニング戦略を提案し,実世界における追加トレーニングの必要性を大幅に低減した。
アプリケーションは深度に基づくマップレスナビゲーションで、移動ロボットは、事前のマッピング情報なしで、散らかった環境で所定の経路点に到達すべきである。
論文 参考訳(メタデータ) (2020-04-30T10:47:02Z) - Meta-Reinforcement Learning for Robotic Industrial Insertion Tasks [70.56451186797436]
本研究では,メタ強化学習を用いてシミュレーションの課題の大部分を解決する方法について検討する。
エージェントを訓練して現実の挿入タスクを成功させる手法を実証する。
論文 参考訳(メタデータ) (2020-04-29T18:00:22Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。