論文の概要: Learning Cross-Domain Correspondence for Control with Dynamics
Cycle-Consistency
- arxiv url: http://arxiv.org/abs/2012.09811v1
- Date: Thu, 17 Dec 2020 18:22:25 GMT
- ステータス: 処理完了
- システム内更新日: 2021-05-02 07:31:55.473089
- Title: Learning Cross-Domain Correspondence for Control with Dynamics
Cycle-Consistency
- Title(参考訳): 動的サイクル整合性を考慮した制御のためのクロスドメイン対応学習
- Authors: Qiang Zhang, Tete Xiao, Alexei A. Efros, Lerrel Pinto, Xiaolong Wang
- Abstract要約: サイクル一貫性制約を用いて2つのドメインで動的ロボットの挙動を調整することを学ぶ。
本フレームワークは,実ロボットアームの無補間単眼映像とシミュレーションアームの動的状態動作軌跡をペアデータなしで一致させることができる。
- 参考スコア(独自算出の注目度): 60.39133304370604
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: At the heart of many robotics problems is the challenge of learning
correspondences across domains. For instance, imitation learning requires
obtaining correspondence between humans and robots; sim-to-real requires
correspondence between physics simulators and the real world; transfer learning
requires correspondences between different robotics environments. This paper
aims to learn correspondence across domains differing in representation (vision
vs. internal state), physics parameters (mass and friction), and morphology
(number of limbs). Importantly, correspondences are learned using unpaired and
randomly collected data from the two domains. We propose \textit{dynamics
cycles} that align dynamic robot behavior across two domains using a
cycle-consistency constraint. Once this correspondence is found, we can
directly transfer the policy trained on one domain to the other, without
needing any additional fine-tuning on the second domain. We perform experiments
across a variety of problem domains, both in simulation and on real robot. Our
framework is able to align uncalibrated monocular video of a real robot arm to
dynamic state-action trajectories of a simulated arm without paired data. Video
demonstrations of our results are available at:
https://sjtuzq.github.io/cycle_dynamics.html .
- Abstract(参考訳): 多くのロボティクス問題の核心は、ドメイン間の通信を学習することである。
例えば、模倣学習は人間とロボットの対応を得る必要があり、sim-to-realは物理シミュレータと現実世界の対応を必要とする。
本稿では,表現(視覚と内部状態),物理パラメータ(質量と摩擦),形態(手足の数)の異なる領域間の対応について学ぶことを目的とした。
重要なことに、2つのドメインから無作為かつランダムに収集されたデータを用いて対応を学習する。
本稿では,サイクル整合性制約を用いて2つの領域にまたがる動的ロボット動作を協調する「textit{dynamics cycles」を提案する。
この対応が見つかると、第2のドメインで追加の微調整を必要とせずに、あるドメインでトレーニングされたポリシーを直接他のドメインに転送できます。
我々は,シミュレーションと実ロボットの両方において,様々な問題領域で実験を行う。
本フレームワークは,実ロボットアームの無補間単眼映像とシミュレーションアームの動的状態動作軌跡をペアデータなしで一致させることができる。
結果のビデオデモは、https://sjtuzq.github.io/cycle_dynamics.htmlで見ることができる。
関連論文リスト
- Dynamics as Prompts: In-Context Learning for Sim-to-Real System Identifications [23.94013806312391]
そこで本研究では,テキスト内学習を用いてシミュレーション環境パラメータを動的に調整する手法を提案する。
オブジェクトスクーピングとテーブルエアホッケーという2つのタスクにまたがるアプローチを検証する。
提案手法は,ロボットの動的現実シナリオへの展開を推し進め,効率的かつスムーズなシステム識別を実現する。
論文 参考訳(メタデータ) (2024-10-27T07:13:38Z) - Flow as the Cross-Domain Manipulation Interface [73.15952395641136]
Im2Flow2Actは、現実世界のロボットのトレーニングデータを必要とせずに、ロボットが現実世界の操作スキルを習得することを可能にする。
Im2Flow2Actはフロー生成ネットワークとフロー条件ポリシーの2つのコンポーネントから構成される。
我々はIm2Flow2Actの様々な実世界のタスクにおいて、剛性、調音、変形可能なオブジェクトの操作を含む能力を実証する。
論文 参考訳(メタデータ) (2024-07-21T16:15:02Z) - Dynamic Handover: Throw and Catch with Bimanual Hands [30.206469112964033]
この問題を解決するために、ロボットアームに2本の指を取り付けたシステムを設計する。
シミュレーションにおいてマルチエージェント強化学習を用いてシステムを訓練し、実ロボットにデプロイするためのSim2Real転送を実行する。
Sim2Realのギャップを克服するために、オブジェクトの軌道予測モデルを学ぶことを含む、複数の新しいアルゴリズム設計を提供する。
論文 参考訳(メタデータ) (2023-09-11T17:49:25Z) - Robot Learning with Sensorimotor Pre-training [98.7755895548928]
ロボット工学のための自己教師型感覚運動器事前学習手法を提案する。
我々のモデルはRTTと呼ばれ、センサモレータトークンのシーケンスで動作するトランスフォーマーである。
感覚運動の事前学習は、ゼロからトレーニングを一貫して上回り、優れたスケーリング特性を持ち、さまざまなタスク、環境、ロボット間での移動を可能にしている。
論文 参考訳(メタデータ) (2023-06-16T17:58:10Z) - Malleable Agents for Re-Configurable Robotic Manipulators [0.0]
本稿では,深部ニューラルネットワークにシーケンスニューラルネットワークを組み込んだRLエージェントを提案する。
ドメインランダム化の新たなツールにより、このエージェントはリンクの数/長さやダイナミックスノイズの異なる構成に適応する。
論文 参考訳(メタデータ) (2022-02-04T21:22:00Z) - Towards Optimal Strategies for Training Self-Driving Perception Models
in Simulation [98.51313127382937]
合成ドメインのみにおけるラベルの使用に焦点を当てる。
提案手法では,ニューラル不変表現の学習方法と,シミュレータからデータをサンプリングする方法に関する理論的にインスピレーションを得た視点を導入する。
マルチセンサーデータを用いた鳥眼視車両分割作業におけるアプローチについて紹介する。
論文 参考訳(メタデータ) (2021-11-15T18:37:43Z) - Robot Learning from Randomized Simulations: A Review [59.992761565399185]
ディープラーニングがロボティクス研究のパラダイムシフトを引き起こし、大量のデータを必要とする方法が好まれている。
最先端のアプローチは、データ生成が高速かつ安価であるシミュレーションで学ぶ。
本稿では,ランダム化シミュレーションから学習する手法である「領域ランダム化」に焦点をあてる。
論文 参考訳(メタデータ) (2021-11-01T13:55:41Z) - Cross Domain Robot Imitation with Invariant Representation [32.1735585546968]
クロスドメイン模倣学習(CDIL)はロボット工学における課題である。
不変表現に基づく模倣学習アルゴリズムを提案する。
本手法は,類似した動作の異なるロボットに対して,類似した表現を学習できることを示す。
論文 参考訳(メタデータ) (2021-09-13T13:05:35Z) - Domain Adaptive Robotic Gesture Recognition with Unsupervised
Kinematic-Visual Data Alignment [60.31418655784291]
本稿では,マルチモダリティ知識,すなわちキネマティックデータとビジュアルデータを同時にシミュレータから実ロボットに伝達できる,教師なしドメイン適応フレームワークを提案する。
ビデオの時間的手がかりと、ジェスチャー認識に対するマルチモーダル固有の相関を用いて、トランスファー可能な機能を強化したドメインギャップを修復する。
その結果, 本手法は, ACCでは最大12.91%, F1scoreでは20.16%と, 実際のロボットではアノテーションを使わずに性能を回復する。
論文 参考訳(メタデータ) (2021-03-06T09:10:03Z) - Metric-Based Imitation Learning Between Two Dissimilar Anthropomorphic
Robotic Arms [29.08134072341867]
模倣学習における大きな課題の1つは、対応問題である。
異種エンボディメント間の距離測定を導入する。
この尺度は, 実施形態の類似性を記述し, 遠隔操作による模倣政策の学習に適していることが判明した。
論文 参考訳(メタデータ) (2020-02-25T19:47:19Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。