論文の概要: Sim-to-Real Transfer via a Style-Identified Cycle Consistent Generative Adversarial Network: Zero-Shot Deployment on Robotic Manipulators through Visual Domain Adaptation
- arxiv url: http://arxiv.org/abs/2601.16677v1
- Date: Fri, 23 Jan 2026 11:48:15 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-26 14:27:27.672164
- Title: Sim-to-Real Transfer via a Style-Identified Cycle Consistent Generative Adversarial Network: Zero-Shot Deployment on Robotic Manipulators through Visual Domain Adaptation
- Title(参考訳): スタイル同定型サイクル連続生成対向ネットワークによるシミュレータ間移動:視覚領域適応によるロボットマニピュレータのゼロショット展開
- Authors: Lucía Güitta-López, Lionel Güitta-López, Jaime Boal, Álvaro Jesús López-López,
- Abstract要約: 深層強化学習(Dep Reinforcement Learning, DRL)は、実世界の訓練のコストと時間的要求により、その産業的採用を損なう。
仮想環境はDRLエージェントを訓練するためのコスト効率の良い代替手段を提供するが、学習したポリシーの実際のセットアップへの移動は、sim-to-realギャップによって妨げられる。
本研究は,CycleGANベースモデルであるStyleID-CycleGAN(StyleID-CycleGAN, SICGAN)に基づく新しい領域適応手法を提案する。
- 参考スコア(独自算出の注目度): 1.0499611180329804
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: The sample efficiency challenge in Deep Reinforcement Learning (DRL) compromises its industrial adoption due to the high cost and time demands of real-world training. Virtual environments offer a cost-effective alternative for training DRL agents, but the transfer of learned policies to real setups is hindered by the sim-to-real gap. Achieving zero-shot transfer, where agents perform directly in real environments without additional tuning, is particularly desirable for its efficiency and practical value. This work proposes a novel domain adaptation approach relying on a Style-Identified Cycle Consistent Generative Adversarial Network (StyleID-CycleGAN or SICGAN), an original Cycle Consistent Generative Adversarial Network (CycleGAN) based model. SICGAN translates raw virtual observations into real-synthetic images, creating a hybrid domain for training DRL agents that combines virtual dynamics with real-like visual inputs. Following virtual training, the agent can be directly deployed, bypassing the need for real-world training. The pipeline is validated with two distinct industrial robots in the approaching phase of a pick-and-place operation. In virtual environments agents achieve success rates of 90 to 100\%, and real-world deployment confirms robust zero-shot transfer (i.e., without additional training in the physical environment) with accuracies above 95\% for most workspace regions. We use augmented reality targets to improve the evaluation process efficiency, and experimentally demonstrate that the agent successfully generalizes to real objects of varying colors and shapes, including LEGO\textsuperscript{\textregistered}~cubes and a mug. These results establish the proposed pipeline as an efficient, scalable solution to the sim-to-real problem.
- Abstract(参考訳): Deep Reinforcement Learning (DRL)のサンプル効率の課題は、実世界のトレーニングのコストと時間の要求が高いため、産業採用を損なう。
仮想環境はDRLエージェントを訓練するためのコスト効率の良い代替手段を提供するが、学習したポリシーの実際のセットアップへの移動は、sim-to-realギャップによって妨げられる。
エージェントが追加のチューニングなしに実際の環境で直接実行するゼロショット転送を実現することは、その効率性と実用的価値のために特に望ましい。
本研究は,CycleGANベースモデルであるStyleID-CycleGAN(StyleID-CycleGAN, SICGAN)に基づく新しい領域適応手法を提案する。
SICGANは生の仮想観察を実合成画像に変換し、仮想力学と実のような視覚入力を組み合わせたDRLエージェントを訓練するためのハイブリッドドメインを作成する。
仮想トレーニングの後、エージェントを直接デプロイして、現実世界のトレーニングの必要性を回避できる。
パイプラインは、ピック・アンド・プレイス・オペレーションの近い段階で、2つの異なる産業用ロボットで検証される。
仮想環境においてエージェントは90から100\%の成功率を達成し、現実世界のデプロイでは、ほとんどのワークスペース領域で95%以上の精度で、堅牢なゼロショット転送(物理環境における追加のトレーニングなしで)が確認できる。
我々は、拡張現実の目標を用いて評価プロセスの効率を向上させるとともに、LEGO\textsuperscript{\textregistered}~cubesやmugsなど、様々な色や形状の実際のオブジェクトに対して、エージェントがうまく一般化できることを実験的に実証した。
これらの結果は、sim-to-real問題に対する効率的でスケーラブルなソリューションとして提案されたパイプラインを確立する。
関連論文リスト
- Scaling Agent Learning via Experience Synthesis [100.42712232390532]
強化学習は、対話を通じて自己改善を行うことで、自律的なエージェントに力を与えることができる。
しかし、コストのかかるロールアウト、タスクの多様性の制限、信頼性の低い報奨信号、インフラストラクチャの複雑さによって、その実践的採用は依然として困難である。
私たちはDreamGymを紹介します。DreamGymはスケーラビリティを念頭において多様なエクスペリエンスを合成するために設計された最初の統合フレームワークです。
論文 参考訳(メタデータ) (2025-11-05T18:58:48Z) - Robotic World Model: A Neural Network Simulator for Robust Policy Optimization in Robotics [50.191655141020505]
この研究は、長期水平予測、エラー蓄積、およびsim-to-real転送の課題に対処することで、モデルに基づく強化学習を前進させる。
スケーラブルでロバストなフレームワークを提供することで、現実のアプリケーションにおいて適応的で効率的なロボットシステムを実現することができる。
論文 参考訳(メタデータ) (2025-01-17T10:39:09Z) - Gaussian Splatting to Real World Flight Navigation Transfer with Liquid Networks [93.38375271826202]
本研究では,シミュレート・トゥ・リアルな視覚四重項ナビゲーションタスクにおける分布シフトに対する一般化とロバスト性を改善する手法を提案する。
まず,擬似飛行力学とガウススプラッティングを統合してシミュレータを構築し,その後,液状ニューラルネットワークを用いてロバストなナビゲーションポリシーを訓練する。
このようにして、我々は3次元ガウススプラッティングラディアンス場レンダリング、専門家による実演訓練データのプログラミング、およびLiquid Networkのタスク理解能力の進歩を組み合わせたフルスタックの模倣学習プロトコルを得る。
論文 参考訳(メタデータ) (2024-06-21T13:48:37Z) - Sim-to-Real Transfer of Deep Reinforcement Learning Agents for Online Coverage Path Planning [22.077058792635313]
被覆経路計画は、制限された地域の自由空間全体をカバーする経路を見つける問題である。
本稿では,この課題に対する連続空間強化学習の有効性について検討する。
提案手法は従来のRLに基づく手法と高度に専門化された手法の両方の性能を上回ることを示す。
論文 参考訳(メタデータ) (2024-06-07T13:24:19Z) - One-Shot Domain Adaptive and Generalizable Semantic Segmentation with
Class-Aware Cross-Domain Transformers [96.51828911883456]
セマンティックセグメンテーションのための教師なしのsim-to-realドメイン適応(UDA)は、シミュレーションデータに基づいて訓練されたモデルの実世界のテスト性能を改善することを目的としている。
従来のUDAは、適応のためのトレーニング中に利用可能なラベルのない実世界のサンプルが豊富にあると仮定することが多い。
実世界のデータサンプルが1つしか利用できない,一発の教師なしシム・トゥ・リアル・ドメイン適応(OSUDA)と一般化問題について検討する。
論文 参考訳(メタデータ) (2022-12-14T15:54:15Z) - Cloud-Edge Training Architecture for Sim-to-Real Deep Reinforcement
Learning [0.8399688944263843]
深層強化学習(DRL)は、環境との相互作用を通じてポリシーを学習することで複雑な制御課題を解決するための有望な手法である。
Sim-to-realアプローチはシミュレーションを利用してDRLポリシーを事前訓練し、現実世界にデプロイする。
本研究では,リアルタイムにDRLエージェントをトレーニングするための分散クラウドエッジアーキテクチャを提案する。
論文 参考訳(メタデータ) (2022-03-04T10:27:01Z) - RL-CycleGAN: Reinforcement Learning Aware Simulation-To-Real [74.45688231140689]
本稿では、画像翻訳におけるRL-scene整合性損失を導入し、画像に関連付けられたQ値に対して変換操作が不変であることを保証する。
RL-CycleGANは実世界のシミュレーションから実世界への変換による強化学習のための新しい手法である。
論文 参考訳(メタデータ) (2020-06-16T08:58:07Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。