論文の概要: Intervention Design for Effective Sim2Real Transfer
- arxiv url: http://arxiv.org/abs/2012.02055v1
- Date: Thu, 3 Dec 2020 16:38:54 GMT
- ステータス: 処理完了
- システム内更新日: 2021-05-23 14:41:05.262786
- Title: Intervention Design for Effective Sim2Real Transfer
- Title(参考訳): sim2実効転写のための介入設計
- Authors: Melissa Mozifian, Amy Zhang, Joelle Pineau, and David Meger
- Abstract要約: この研究は、sim2real設定に対する領域ランダム化とデータ拡張の最近の成功に対処する。
この成功は、因果推論のレンズ、領域ランダム化の位置決め、および環境への介入としてのデータ拡張によって説明される。
- 参考スコア(独自算出の注目度): 48.9711031777803
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The goal of this work is to address the recent success of domain
randomization and data augmentation for the sim2real setting. We explain this
success through the lens of causal inference, positioning domain randomization
and data augmentation as interventions on the environment which encourage
invariance to irrelevant features. Such interventions include visual
perturbations that have no effect on reward and dynamics. This encourages the
learning algorithm to be robust to these types of variations and learn to
attend to the true causal mechanisms for solving the task. This connection
leads to two key findings: (1) perturbations to the environment do not have to
be realistic, but merely show variation along dimensions that also vary in the
real world, and (2) use of an explicit invariance-inducing objective improves
generalization in sim2sim and sim2real transfer settings over just data
augmentation or domain randomization alone. We demonstrate the capability of
our method by performing zero-shot transfer of a robot arm reach task on a 7DoF
Jaco arm learning from pixel observations.
- Abstract(参考訳): この研究の目標は、最近のsim2real設定におけるドメインのランダム化とデータ拡張の成功に対処することである。
因果推論や位置決めドメインのランダム化,データ拡張などを通じて,無関係な特徴の分散を促進する環境への介入として,この成功を説明する。
このような介入には、報酬やダイナミクスに影響を与えない視覚摂動が含まれる。
これにより、学習アルゴリズムはこの種のバリエーションに対して堅牢であり、タスクを解決するための真の因果的メカニズムへの参加を学ぶことができる。
この関係は,(1) 環境への摂動は現実的である必要はないが, 実世界でも異なる次元に沿った変化を示すだけであり, (2) 明示的な不変性誘導目的を用いることで, 単にデータ拡張やドメインランダム化のみに対するsim2simおよびsim2real転送設定の一般化が向上する。
画素観察から学習した7DoF Jacoアーム上でロボットアームの到達タスクをゼロショット転送することで,本手法の有効性を示す。
関連論文リスト
- Dynamics as Prompts: In-Context Learning for Sim-to-Real System Identifications [23.94013806312391]
そこで本研究では,テキスト内学習を用いてシミュレーション環境パラメータを動的に調整する手法を提案する。
オブジェクトスクーピングとテーブルエアホッケーという2つのタスクにまたがるアプローチを検証する。
提案手法は,ロボットの動的現実シナリオへの展開を推し進め,効率的かつスムーズなシステム識別を実現する。
論文 参考訳(メタデータ) (2024-10-27T07:13:38Z) - Towards Open-World Mobile Manipulation in Homes: Lessons from the Neurips 2023 HomeRobot Open Vocabulary Mobile Manipulation Challenge [93.4434417387526]
ロボット工学における鍵となるベンチマークタスクとして,Open Vocabulary Mobile Manipulationを提案する。
我々は,この課題に対する解決策を評価するために,シミュレーションと実世界のコンポーネントを兼ね備えたNeurIPS 2023コンペティションを組織した。
シミュレーションと実環境設定の両方で使用される結果と方法論を詳述する。
論文 参考訳(メタデータ) (2024-07-09T15:15:01Z) - Domain Randomization for Sim2real Transfer of Automatically Generated
Grasping Datasets [0.0]
本稿では,実世界において自動生成された把握がどのように活用されるかを検討する。
7000以上のリーチ・アンド・グラス軌道が3つの異なるアームとグリップにQD(Quality-Diversity)法で生成され、それには平行な指と器用な手が含まれ、現実世界でテストされている。
ドメインランダム化をより堅牢にするために、ついにQDアプローチが提案され、その結果、フランカリサーチ3アームの転送比は84%となった。
論文 参考訳(メタデータ) (2023-10-06T18:26:09Z) - Robust Visual Sim-to-Real Transfer for Robotic Manipulation [79.66851068682779]
シミュレーションにおけるビジュモータポリシーの学習は、現実世界よりも安全で安価である。
しかし、シミュレーションデータと実データとの相違により、シミュレータ訓練されたポリシーは実際のロボットに転送されると失敗することが多い。
視覚的なsim-to-real領域ギャップを埋める一般的なアプローチは、ドメインランダム化(DR)である。
論文 参考訳(メタデータ) (2023-07-28T05:47:24Z) - Attention-based Adversarial Appearance Learning of Augmented Pedestrians [49.25430012369125]
本稿では,歩行者認識タスクのための現実的なデータを合成する手法を提案する。
本手法は, 対向的損失によって駆動される注意機構を用いて, ドメインの相違を学習する。
提案手法はこのような不一致に対して頑健であり,視覚的リアリズムと意味的整合性の両方を明らかにする。
論文 参考訳(メタデータ) (2021-07-06T15:27:00Z) - Domain Adaptive Robotic Gesture Recognition with Unsupervised
Kinematic-Visual Data Alignment [60.31418655784291]
本稿では,マルチモダリティ知識,すなわちキネマティックデータとビジュアルデータを同時にシミュレータから実ロボットに伝達できる,教師なしドメイン適応フレームワークを提案する。
ビデオの時間的手がかりと、ジェスチャー認識に対するマルチモーダル固有の相関を用いて、トランスファー可能な機能を強化したドメインギャップを修復する。
その結果, 本手法は, ACCでは最大12.91%, F1scoreでは20.16%と, 実際のロボットではアノテーションを使わずに性能を回復する。
論文 参考訳(メタデータ) (2021-03-06T09:10:03Z) - DIRL: Domain-Invariant Representation Learning for Sim-to-Real Transfer [2.119586259941664]
本稿では,ドメイン不変表現学習(DIRL)アルゴリズムを提案する。
桁領域の実験は、挑戦的なベンチマークで最先端のパフォーマンスを得る。
論文 参考訳(メタデータ) (2020-11-15T17:39:01Z) - Point Cloud Based Reinforcement Learning for Sim-to-Real and Partial
Observability in Visual Navigation [62.22058066456076]
強化学習(Reinforcement Learning, RL)は、複雑なロボットタスクを解決する強力なツールである。
RL は sim-to-real transfer problem として知られる現実世界では直接作用しない。
本稿では,点雲と環境ランダム化によって構築された観測空間を学習する手法を提案する。
論文 参考訳(メタデータ) (2020-07-27T17:46:59Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。