論文の概要: Auto-Tuned Sim-to-Real Transfer
- arxiv url: http://arxiv.org/abs/2104.07662v1
- Date: Thu, 15 Apr 2021 17:59:55 GMT
- ステータス: 処理完了
- システム内更新日: 2021-04-16 15:18:00.626511
- Title: Auto-Tuned Sim-to-Real Transfer
- Title(参考訳): オートチューニング型シム・トゥ・リアルトランスファー
- Authors: Yuqing Du, Olivia Watkins, Trevor Darrell, Pieter Abbeel, Deepak
Pathak
- Abstract要約: シミュレーションで訓練されたポリシーは、しばしば現実世界に移されるときに失敗する。
ドメインのランダム化のようなこの問題に取り組む現在のアプローチには、事前の知識とエンジニアリングが必要である。
実世界に合わせてシミュレータシステムパラメータを自動的にチューニングする手法を提案する。
- 参考スコア(独自算出の注目度): 143.44593793640814
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Policies trained in simulation often fail when transferred to the real world
due to the `reality gap' where the simulator is unable to accurately capture
the dynamics and visual properties of the real world. Current approaches to
tackle this problem, such as domain randomization, require prior knowledge and
engineering to determine how much to randomize system parameters in order to
learn a policy that is robust to sim-to-real transfer while also not being too
conservative. We propose a method for automatically tuning simulator system
parameters to match the real world using only raw RGB images of the real world
without the need to define rewards or estimate state. Our key insight is to
reframe the auto-tuning of parameters as a search problem where we iteratively
shift the simulation system parameters to approach the real-world system
parameters. We propose a Search Param Model (SPM) that, given a sequence of
observations and actions and a set of system parameters, predicts whether the
given parameters are higher or lower than the true parameters used to generate
the observations. We evaluate our method on multiple robotic control tasks in
both sim-to-sim and sim-to-real transfer, demonstrating significant improvement
over naive domain randomization. Project videos and code at
https://yuqingd.github.io/autotuned-sim2real/
- Abstract(参考訳): シミュレーションでトレーニングされたポリシは,実世界のダイナミクスや視覚特性を正確に把握できない‘現実のギャップ’のため,実世界に移行すると失敗することが多い。
ドメインのランダム化のようなこの問題に対処するための現在のアプローチは、システムパラメータをどの程度ランダム化するかを決定するために、事前の知識と工学を必要としている。
本稿では,実世界の生のRGB画像のみを用いて,報酬や推定状態を定義することなく,実世界に合わせてシミュレータシステムパラメータを自動調整する手法を提案する。
我々の重要な洞察は、パラメータの自動チューニングを探索問題として再構成し、シミュレーションシステムパラメータを現実のシステムパラメータに反復的にシフトさせることである。
本研究では,一連の観測と行動とシステムパラメータが与えられた場合,与えられたパラメータが観測に使用される真のパラメータよりも高いか低いかを予測するサーチパラムモデル(spm)を提案する。
sim-to-simとsim-to-realの両方における複数のロボット制御タスクにおける本手法の評価を行った。
project video and code at https://yuqingd.github.io/autotuned-sim2real/
関連論文リスト
- Dynamics as Prompts: In-Context Learning for Sim-to-Real System Identifications [23.94013806312391]
そこで本研究では,テキスト内学習を用いてシミュレーション環境パラメータを動的に調整する手法を提案する。
オブジェクトスクーピングとテーブルエアホッケーという2つのタスクにまたがるアプローチを検証する。
提案手法は,ロボットの動的現実シナリオへの展開を推し進め,効率的かつスムーズなシステム識別を実現する。
論文 参考訳(メタデータ) (2024-10-27T07:13:38Z) - Learning autonomous driving from aerial imagery [67.06858775696453]
フォトグラムシミュレーターは、生成済みの資産を新しいビューに変換することによって、新しいビューを合成することができる。
我々は、ニューラルネットワーク場(NeRF)を中間表現として使用し、地上車両の視点から新しいビューを合成する。
論文 参考訳(メタデータ) (2024-10-18T05:09:07Z) - Sim-to-Real Transfer of Deep Reinforcement Learning Agents for Online Coverage Path Planning [15.792914346054502]
我々は、カバーパス計画(CPP)のための強化学習エージェント(RL)のSim-to-real転送の課題に取り組む。
シミュレーションされたセンサと障害物を利用しながら、現実のロボットやリアルタイムの側面を含む半仮想環境を通じて、シミュレートと現実のギャップを橋渡しする。
高い推測周波数は、一階マルコフのポリシーをシミュレーションから直接転送することを可能にし、高階のポリシーを微調整することで、sim-to-realのギャップをさらに減らすことができる。
論文 参考訳(メタデータ) (2024-06-07T13:24:19Z) - DrEureka: Language Model Guided Sim-To-Real Transfer [64.14314476811806]
シミュレーションで学んだ政策を現実世界に伝達することは、ロボットのスキルを大規模に獲得する上で有望な戦略である。
本稿では,Large Language Models (LLMs) を用いてシム・トゥ・リアル設計の自動化と高速化を行う。
本手法では,ヨガボールの上を歩行する四足歩行や四足歩行など,新しいロボットタスクを解くことができる。
論文 参考訳(メタデータ) (2024-06-04T04:53:05Z) - Robust Visual Sim-to-Real Transfer for Robotic Manipulation [79.66851068682779]
シミュレーションにおけるビジュモータポリシーの学習は、現実世界よりも安全で安価である。
しかし、シミュレーションデータと実データとの相違により、シミュレータ訓練されたポリシーは実際のロボットに転送されると失敗することが多い。
視覚的なsim-to-real領域ギャップを埋める一般的なアプローチは、ドメインランダム化(DR)である。
論文 参考訳(メタデータ) (2023-07-28T05:47:24Z) - Understanding Domain Randomization for Sim-to-real Transfer [41.33483293243257]
本稿では,シミュレータを調整可能なパラメータを持つMDPの集合としてモデル化する,sim-to-realトランスファーの理論的枠組みを提案する。
実世界のトレーニングサンプルを使わずに, 穏やかな条件下で, sim-to-realトランスファーが成功できることを実証する。
論文 参考訳(メタデータ) (2021-10-07T07:45:59Z) - TrafficSim: Learning to Simulate Realistic Multi-Agent Behaviors [74.67698916175614]
リアル交通シミュレーションのためのマルチエージェント行動モデルであるTrafficSimを提案する。
特に、暗黙の潜在変数モデルを利用して、共同アクターポリシーをパラメータ化する。
TrafficSimは、多様なベースラインと比較して、より現実的で多様なトラフィックシナリオを生成します。
論文 参考訳(メタデータ) (2021-01-17T00:29:30Z) - Point Cloud Based Reinforcement Learning for Sim-to-Real and Partial
Observability in Visual Navigation [62.22058066456076]
強化学習(Reinforcement Learning, RL)は、複雑なロボットタスクを解決する強力なツールである。
RL は sim-to-real transfer problem として知られる現実世界では直接作用しない。
本稿では,点雲と環境ランダム化によって構築された観測空間を学習する手法を提案する。
論文 参考訳(メタデータ) (2020-07-27T17:46:59Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。