Fugu-MT 論文翻訳(概要): TRANSIC: Sim-to-Real Policy Transfer by Learning from Online Correction

論文の概要: TRANSIC: Sim-to-Real Policy Transfer by Learning from Online Correction

arxiv url: http://arxiv.org/abs/2405.10315v3
Date: Mon, 14 Oct 2024 06:03:55 GMT
ステータス: 翻訳完了
システム内更新日: 2024-12-03 05:52:36.865694
Title: TRANSIC: Sim-to-Real Policy Transfer by Learning from Online Correction
Title（参考訳）: TransIC:オンライン・コレクションから学ぶシミュレート・ツー・リアル・ポリシー・トランスファー
Authors: Yunfan Jiang, Chen Wang, Ruohan Zhang, Jiajun Wu, Li Fei-Fei,
Abstract要約: シミュレーションの学習と実世界への学習は、ジェネラリストロボットを可能にする可能性がある。そこで本研究では,Human-in-the-loopフレームワークをベースとしたSIM-to-real転送を実現するためのデータ駆動型手法を提案する。本手法は,家具組立などの複雑かつ接触に富んだ操作作業において,シミュレートから現実への伝達を成功させることができることを示す。
参考スコア（独自算出の注目度）: 25.36756787147331
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Learning in simulation and transferring the learned policy to the real world has the potential to enable generalist robots. The key challenge of this approach is to address simulation-to-reality (sim-to-real) gaps. Previous methods often require domain-specific knowledge a priori. We argue that a straightforward way to obtain such knowledge is by asking humans to observe and assist robot policy execution in the real world. The robots can then learn from humans to close various sim-to-real gaps. We propose TRANSIC, a data-driven approach to enable successful sim-to-real transfer based on a human-in-the-loop framework. TRANSIC allows humans to augment simulation policies to overcome various unmodeled sim-to-real gaps holistically through intervention and online correction. Residual policies can be learned from human corrections and integrated with simulation policies for autonomous execution. We show that our approach can achieve successful sim-to-real transfer in complex and contact-rich manipulation tasks such as furniture assembly. Through synergistic integration of policies learned in simulation and from humans, TRANSIC is effective as a holistic approach to addressing various, often coexisting sim-to-real gaps. It displays attractive properties such as scaling with human effort. Videos and code are available at https://transic-robot.github.io/
Abstract（参考訳）: シミュレーションの学習と実世界への学習は、ジェネラリストロボットを可能にする可能性がある。このアプローチの鍵となる課題は、シミュレーション対現実(sim-to-real)ギャップに対処することである。以前はドメイン固有の知識を事前に必要としていた。このような知識を得るための簡単な方法は、人間が現実世界でロボットポリシーの実行を観察し、支援することである、と我々は主張する。ロボットは人間から学習して、さまざまなシミュレートとリアルのギャップを埋める。提案するTransICは,Human-in-the-loopフレームワークをベースとしたSIM-to-real転送を実現するためのデータ駆動型アプローチである。 TransICは、介入やオンライン修正を通じて、シミュレーションポリシーを強化し、さまざまなモデルのないsim-to-realギャップを均等に克服することを可能にする。残留ポリシーは、人間の修正から学び、自律実行のためのシミュレーションポリシーと統合することができる。本手法は,家具組立などの複雑で接触に富んだ操作作業において,シミュレートと現実の移動を実現することができることを示す。シミュレーションや人間から学んだポリシーの相乗的統合を通じて、TransICは様々な、しばしば共存するsim-to-realギャップに対処するための総合的なアプローチとして有効である。人間の努力によるスケーリングのような魅力的な特性を示す。ビデオとコードはhttps://transic-robot.github.io/で公開されている。

関連論文リスト

X-Sim: Cross-Embodiment Learning via Real-to-Sim-to-Real [13.644777529832291]
X-Simは、ロボットのポリシーを学ぶための、密集した伝達可能な信号としてオブジェクトの動きを利用する、リアルからシミュレート・トゥ・リアルなフレームワークである。 X-Simは、RGBDの人間のビデオからシミュレーションを再構築し、オブジェクト中心の報酬を定義するためにオブジェクトの軌跡を追跡することから始まる。学習方針は、様々な視点と照明でレンダリングされた合成ロールアウトを用いて、画像調和拡散政策に蒸留される。
論文参考訳（メタデータ） (2025-05-11T19:04:00Z)
Real-is-Sim: Bridging the Sim-to-Real Gap with a Dynamic Digital Twin [8.498460043101499]
我々は、シミュレーションを行動クローニングパイプラインに統合するための新しいアプローチである、Real-is-simを導入する。デプロイ前にポリシーを安全にテストする機能がない実際のメソッドや、sim-to-realメソッドとは対照的に、sim-to-realギャップを横断するために複雑な適応を必要とするsim-to-realメソッドがある。当社のフレームワークでは,実際のハードウェア上での動作と,並列化された仮想環境での動作とをシームレスに切り替えることが可能です。
論文参考訳（メタデータ） (2025-04-04T17:05:56Z)
Sim-and-Real Co-Training: A Simple Recipe for Vision-Based Robotic Manipulation [40.96453435496208]
本稿では,視覚に基づくロボット操作課題を解決するためにシミュレーションデータを利用する手法を提案する。ロボットアームとヒューマノイドの2つの領域を用いて,シミュレーションデータにより実世界のタスク性能を平均38%向上させることができることを示した。
論文参考訳（メタデータ） (2025-03-31T17:39:38Z)
Sim-to-Real Reinforcement Learning for Vision-Based Dexterous Manipulation on Humanoids [56.892520712892804]
本稿では,ヒューマノイドロボットを訓練して3つの巧妙な操作を行う,実用的なシミュレート・トゥ・リアルなRLレシピを提案する。未確認のオブジェクトやロバストで適応的な政策行動に対して高い成功率を示す。
論文参考訳（メタデータ） (2025-02-27T18:59:52Z)
Video2Policy: Scaling up Manipulation Tasks in Simulation through Internet Videos [61.925837909969815]
我々は,インターネット上のRGBビデオを利用して日常の人間行動に基づいてタスクを再構築する新しいフレームワークであるVideo2Policyを紹介した。本手法は投球のような複雑で困難なタスクを含む,そのようなタスクに対するRLポリシーのトレーニングに成功している。生成したシミュレーションデータは,一般的なポリシをトレーニングするためにスケールアップ可能であり,Real2Sim2Real方式で実ロボットに転送可能であることを示す。
論文参考訳（メタデータ） (2025-02-14T03:22:03Z)
EAGERx: Graph-Based Framework for Sim2real Robot Learning [9.145895178276822]
Sim2realは、シミュレーションから現実世界への学習制御ポリシーの移行であり、ロボット工学への関心が高まりつつある分野である。 EAGERxは,実際のロボット学習とシミュレーションロボット学習の両方に統一されたソフトウェアパイプラインを備えたフレームワークである。
論文参考訳（メタデータ） (2024-07-05T08:01:19Z)
DrEureka: Language Model Guided Sim-To-Real Transfer [64.14314476811806]
シミュレーションで学んだ政策を現実世界に伝達することは、ロボットのスキルを大規模に獲得する上で有望な戦略である。本稿では,Large Language Models (LLMs) を用いてシム・トゥ・リアル設計の自動化と高速化を行う。本手法では,ヨガボールの上を歩行する四足歩行や四足歩行など,新しいロボットタスクを解くことができる。
論文参考訳（メタデータ） (2024-06-04T04:53:05Z)
DeXtreme: Transfer of Agile In-hand Manipulation from Simulation to Reality [64.51295032956118]
我々は人型ロボットの手で頑健な操作を行える政策を訓練する。本研究は,各種ハードウェアおよびシミュレータのデクスタラス操作におけるsim-to-real転送の可能性を再確認する。
論文参考訳（メタデータ） (2022-10-25T01:51:36Z)
Robot Learning from Randomized Simulations: A Review [59.992761565399185]
ディープラーニングがロボティクス研究のパラダイムシフトを引き起こし、大量のデータを必要とする方法が好まれている。最先端のアプローチは、データ生成が高速かつ安価であるシミュレーションで学ぶ。本稿では,ランダム化シミュレーションから学習する手法である「領域ランダム化」に焦点をあてる。
論文参考訳（メタデータ） (2021-11-01T13:55:41Z)
Understanding Domain Randomization for Sim-to-real Transfer [41.33483293243257]
本稿では,シミュレータを調整可能なパラメータを持つMDPの集合としてモデル化する,sim-to-realトランスファーの理論的枠組みを提案する。実世界のトレーニングサンプルを使わずに, 穏やかな条件下で, sim-to-realトランスファーが成功できることを実証する。
論文参考訳（メタデータ） (2021-10-07T07:45:59Z)
TrafficSim: Learning to Simulate Realistic Multi-Agent Behaviors [74.67698916175614]
リアル交通シミュレーションのためのマルチエージェント行動モデルであるTrafficSimを提案する。特に、暗黙の潜在変数モデルを利用して、共同アクターポリシーをパラメータ化する。 TrafficSimは、多様なベースラインと比較して、より現実的で多様なトラフィックシナリオを生成します。
論文参考訳（メタデータ） (2021-01-17T00:29:30Z)
Reactive Long Horizon Task Execution via Visual Skill and Precondition Models [59.76233967614774]
シミュレーションで学習したモデルを用いて、単純なタスクプランナの構成要素をグラウンド化することで、見知らぬロボットタスクを達成できるシミュレート・トゥ・リアル・トレーニングのアプローチについて述べる。シミュレーションでは91.6%から98%,実世界の成功率は10%から80%に増加した。
論文参考訳（メタデータ） (2020-11-17T15:24:01Z)
Point Cloud Based Reinforcement Learning for Sim-to-Real and Partial Observability in Visual Navigation [62.22058066456076]
強化学習(Reinforcement Learning, RL)は、複雑なロボットタスクを解決する強力なツールである。 RL は sim-to-real transfer problem として知られる現実世界では直接作用しない。本稿では,点雲と環境ランダム化によって構築された観測空間を学習する手法を提案する。
論文参考訳（メタデータ） (2020-07-27T17:46:59Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。