論文の概要: TRANSIC: Sim-to-Real Policy Transfer by Learning from Online Correction
- arxiv url: http://arxiv.org/abs/2405.10315v3
- Date: Mon, 14 Oct 2024 06:03:55 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-10-15 15:03:42.473045
- Title: TRANSIC: Sim-to-Real Policy Transfer by Learning from Online Correction
- Title(参考訳): TransIC:オンライン・コレクションから学ぶシミュレート・ツー・リアル・ポリシー・トランスファー
- Authors: Yunfan Jiang, Chen Wang, Ruohan Zhang, Jiajun Wu, Li Fei-Fei,
- Abstract要約: シミュレーションの学習と実世界への学習は、ジェネラリストロボットを可能にする可能性がある。
そこで本研究では,Human-in-the-loopフレームワークをベースとしたSIM-to-real転送を実現するためのデータ駆動型手法を提案する。
本手法は,家具組立などの複雑かつ接触に富んだ操作作業において,シミュレートから現実への伝達を成功させることができることを示す。
- 参考スコア(独自算出の注目度): 25.36756787147331
- License:
- Abstract: Learning in simulation and transferring the learned policy to the real world has the potential to enable generalist robots. The key challenge of this approach is to address simulation-to-reality (sim-to-real) gaps. Previous methods often require domain-specific knowledge a priori. We argue that a straightforward way to obtain such knowledge is by asking humans to observe and assist robot policy execution in the real world. The robots can then learn from humans to close various sim-to-real gaps. We propose TRANSIC, a data-driven approach to enable successful sim-to-real transfer based on a human-in-the-loop framework. TRANSIC allows humans to augment simulation policies to overcome various unmodeled sim-to-real gaps holistically through intervention and online correction. Residual policies can be learned from human corrections and integrated with simulation policies for autonomous execution. We show that our approach can achieve successful sim-to-real transfer in complex and contact-rich manipulation tasks such as furniture assembly. Through synergistic integration of policies learned in simulation and from humans, TRANSIC is effective as a holistic approach to addressing various, often coexisting sim-to-real gaps. It displays attractive properties such as scaling with human effort. Videos and code are available at https://transic-robot.github.io/
- Abstract(参考訳): シミュレーションの学習と実世界への学習は、ジェネラリストロボットを可能にする可能性がある。
このアプローチの鍵となる課題は、シミュレーション対現実(sim-to-real)ギャップに対処することである。
以前はドメイン固有の知識を事前に必要としていた。
このような知識を得るための簡単な方法は、人間が現実世界でロボットポリシーの実行を観察し、支援することである、と我々は主張する。
ロボットは人間から学習して、さまざまなシミュレートとリアルのギャップを埋める。
提案するTransICは,Human-in-the-loopフレームワークをベースとしたSIM-to-real転送を実現するためのデータ駆動型アプローチである。
TransICは、介入やオンライン修正を通じて、シミュレーションポリシーを強化し、さまざまなモデルのないsim-to-realギャップを均等に克服することを可能にする。
残留ポリシーは、人間の修正から学び、自律実行のためのシミュレーションポリシーと統合することができる。
本手法は,家具組立などの複雑で接触に富んだ操作作業において,シミュレートと現実の移動を実現することができることを示す。
シミュレーションや人間から学んだポリシーの相乗的統合を通じて、TransICは様々な、しばしば共存するsim-to-realギャップに対処するための総合的なアプローチとして有効である。
人間の努力によるスケーリングのような魅力的な特性を示す。
ビデオとコードはhttps://transic-robot.github.io/で公開されている。
関連論文リスト
- EAGERx: Graph-Based Framework for Sim2real Robot Learning [9.145895178276822]
Sim2realは、シミュレーションから現実世界への学習制御ポリシーの移行であり、ロボット工学への関心が高まりつつある分野である。
EAGERxは,実際のロボット学習とシミュレーションロボット学習の両方に統一されたソフトウェアパイプラインを備えたフレームワークである。
論文 参考訳(メタデータ) (2024-07-05T08:01:19Z) - DrEureka: Language Model Guided Sim-To-Real Transfer [64.14314476811806]
シミュレーションで学んだ政策を現実世界に伝達することは、ロボットのスキルを大規模に獲得する上で有望な戦略である。
本稿では,Large Language Models (LLMs) を用いてシム・トゥ・リアル設計の自動化と高速化を行う。
本手法では,ヨガボールの上を歩行する四足歩行や四足歩行など,新しいロボットタスクを解くことができる。
論文 参考訳(メタデータ) (2024-06-04T04:53:05Z) - DeXtreme: Transfer of Agile In-hand Manipulation from Simulation to
Reality [64.51295032956118]
我々は人型ロボットの手で頑健な操作を行える政策を訓練する。
本研究は,各種ハードウェアおよびシミュレータのデクスタラス操作におけるsim-to-real転送の可能性を再確認する。
論文 参考訳(メタデータ) (2022-10-25T01:51:36Z) - Robot Learning from Randomized Simulations: A Review [59.992761565399185]
ディープラーニングがロボティクス研究のパラダイムシフトを引き起こし、大量のデータを必要とする方法が好まれている。
最先端のアプローチは、データ生成が高速かつ安価であるシミュレーションで学ぶ。
本稿では,ランダム化シミュレーションから学習する手法である「領域ランダム化」に焦点をあてる。
論文 参考訳(メタデータ) (2021-11-01T13:55:41Z) - Understanding Domain Randomization for Sim-to-real Transfer [41.33483293243257]
本稿では,シミュレータを調整可能なパラメータを持つMDPの集合としてモデル化する,sim-to-realトランスファーの理論的枠組みを提案する。
実世界のトレーニングサンプルを使わずに, 穏やかな条件下で, sim-to-realトランスファーが成功できることを実証する。
論文 参考訳(メタデータ) (2021-10-07T07:45:59Z) - TrafficSim: Learning to Simulate Realistic Multi-Agent Behaviors [74.67698916175614]
リアル交通シミュレーションのためのマルチエージェント行動モデルであるTrafficSimを提案する。
特に、暗黙の潜在変数モデルを利用して、共同アクターポリシーをパラメータ化する。
TrafficSimは、多様なベースラインと比較して、より現実的で多様なトラフィックシナリオを生成します。
論文 参考訳(メタデータ) (2021-01-17T00:29:30Z) - Reactive Long Horizon Task Execution via Visual Skill and Precondition
Models [59.76233967614774]
シミュレーションで学習したモデルを用いて、単純なタスクプランナの構成要素をグラウンド化することで、見知らぬロボットタスクを達成できるシミュレート・トゥ・リアル・トレーニングのアプローチについて述べる。
シミュレーションでは91.6%から98%,実世界の成功率は10%から80%に増加した。
論文 参考訳(メタデータ) (2020-11-17T15:24:01Z) - Point Cloud Based Reinforcement Learning for Sim-to-Real and Partial
Observability in Visual Navigation [62.22058066456076]
強化学習(Reinforcement Learning, RL)は、複雑なロボットタスクを解決する強力なツールである。
RL は sim-to-real transfer problem として知られる現実世界では直接作用しない。
本稿では,点雲と環境ランダム化によって構築された観測空間を学習する手法を提案する。
論文 参考訳(メタデータ) (2020-07-27T17:46:59Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。