論文の概要: An Architecture for Unattended Containerized (Deep) Reinforcement
Learning with Webots
- arxiv url: http://arxiv.org/abs/2403.00765v1
- Date: Tue, 6 Feb 2024 12:08:01 GMT
- ステータス: 処理完了
- システム内更新日: 2024-03-11 00:19:35.059198
- Title: An Architecture for Unattended Containerized (Deep) Reinforcement
Learning with Webots
- Title(参考訳): webotsによるコンテナ化(深層)強化学習のためのアーキテクチャ
- Authors: Tobias Haubold, Petra Linke
- Abstract要約: 3Dの世界におけるエージェントによる強化学習は、依然として課題に直面している。
シミュレーションソフトウェアの使用に必要な知識と、意図しないトレーニングパイプラインにおけるスタンドアロンのシミュレーションソフトウェアの利用。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: As data science applications gain adoption across industries, the tooling
landscape matures to facilitate the life cycle of such applications and provide
solutions to the challenges involved to boost the productivity of the people
involved. Reinforcement learning with agents in a 3D world could still face
challenges: the knowledge required to use a simulation software as well as the
utilization of a standalone simulation software in unattended training
pipelines.
In this paper we review tools and approaches to train reinforcement learning
agents for robots in 3D worlds with respect to the robot Robotino and argue
that the separation of the simulation environment for creators of virtual
worlds and the model development environment for data scientists is not a well
covered topic. Often both are the same and data scientists require knowledge of
the simulation software to work directly with their APIs. Moreover, sometimes
creators of virtual worlds and data scientists even work on the same files. We
want to contribute to that topic by describing an approach where data
scientists don't require knowledge about the simulation software. Our approach
uses the standalone simulation software Webots, the Robot Operating System to
communicate with simulated robots as well as the simulation software itself and
container technology to separate the simulation from the model development
environment. We put emphasize on the APIs the data scientists work with and the
use of a standalone simulation software in unattended training pipelines. We
show the parts that are specific to the Robotino and the robot task to learn.
- Abstract(参考訳): データサイエンスアプリケーションが業界で採用されるにつれて、ツールの世界は成熟し、そのようなアプリケーションのライフサイクルを促進し、関係者の生産性向上に関わる課題の解決策を提供する。
3d世界のエージェントによる強化学習は、まだ課題に直面している可能性がある。シミュレーションソフトウェアを使用するために必要な知識と、無人のトレーニングパイプラインでのスタンドアロンシミュレーションソフトウェアの利用。
本稿では,ロボットロボットに関して,ロボットの強化学習エージェントを訓練するためのツールとアプローチをレビューし,仮想世界の創造者のためのシミュレーション環境とデータサイエンティストのためのモデル開発環境の分離は,あまり話題になっていないことを論じる。
どちらも同じで、データサイエンティストはapiを直接扱うためにシミュレーションソフトウェアに関する知識を必要とします。
さらに、仮想世界やデータサイエンティストの作者が同じファイルで作業することもある。
私たちは、データサイエンティストがシミュレーションソフトウェアに関する知識を必要としないアプローチを説明することで、このトピックに貢献したいと考えています。
本手法では,シミュレーションソフトウェアであるwebots,ロボットオペレーティングシステムを用いてシミュレーションロボットと通信し,シミュレーションソフトウェア自体とコンテナ技術を用いてシミュレーションをモデル開発環境から分離する。
私たちは、データサイエンティストが扱うAPIと、意図しないトレーニングパイプラインでスタンドアロンのシミュレーションソフトウェアを使用することを強調しました。
ロボットノに特有の部分と学習すべきロボットタスクを示す。
関連論文リスト
- RoboCasa: Large-Scale Simulation of Everyday Tasks for Generalist Robots [25.650235551519952]
本稿では,汎用ロボットを日常的に訓練するための大規模シミュレーションフレームワークであるRoboCasaを紹介する。
私たちは、150以上のオブジェクトカテゴリと数十の対話可能な家具とアプライアンスに対して、何千もの3Dアセットを提供しています。
本実験は, 大規模模倣学習のための合成ロボットデータを用いて, スケーリングの傾向を明らかにするものである。
論文 参考訳(メタデータ) (2024-06-04T17:41:31Z) - Learning Interactive Real-World Simulators [107.12907352474005]
生成モデルを用いて実世界の相互作用の普遍的なシミュレータを学習する可能性について検討する。
シミュレーターを用いて、高レベルな視覚言語ポリシーと低レベルな強化学習ポリシーの両方を訓練する。
ビデオキャプションモデルは、シミュレートされた経験を持つトレーニングの恩恵を受けることができる。
論文 参考訳(メタデータ) (2023-10-09T19:42:22Z) - Real Robot Challenge 2022: Learning Dexterous Manipulation from Offline
Data in the Real World [38.54892412474853]
リアルロボットチャレンジ2022は、強化学習とロボティクスのコミュニティの間の橋として機能した。
我々は参加者に、提供された実ロボットデータセットからプッシュ、グリップ、手動の向きを含む2つの巧妙な操作タスクを学ぶように頼んだ。
大規模なソフトウェアドキュメンテーションと、実際のセットアップのシミュレーションに基づく初期ステージにより、競争は特にアクセスしやすくなった。
論文 参考訳(メタデータ) (2023-08-15T12:40:56Z) - Sim2real Transfer Learning for Point Cloud Segmentation: An Industrial
Application Case on Autonomous Disassembly [55.41644538483948]
我々は,点クラウドデータにsim2realTransfer Learningを用いた産業アプリケーションケースを提案する。
合成ポイントクラウドデータの生成と処理方法に関する洞察を提供する。
この問題に対処するために、パッチベースの新しいアテンションネットワークも提案されている。
論文 参考訳(メタデータ) (2023-01-12T14:00:37Z) - Continual learning autoencoder training for a particle-in-cell
simulation via streaming [52.77024349608834]
今後のエクサスケール時代は 次世代の物理シミュレーションを 高解像度で提供します
これらのシミュレーションは高解像度であり、ディスク上に大量のシミュレーションデータを格納することはほぼ不可能であるため、機械学習モデルのトレーニングに影響を与える。
この研究は、ディスク上のデータなしで、実行中のシミュレーションにニューラルネットワークを同時にトレーニングするアプローチを示す。
論文 参考訳(メタデータ) (2022-11-09T09:55:14Z) - Simulation-Based Parallel Training [55.41644538483948]
このようなボトルネックを緩和するトレーニングフレームワークを設計するために、現在進行中の作業を紹介します。
トレーニングプロセスと並行してデータを生成する。
このバイアスをメモリバッファで軽減する戦略を提案する。
論文 参考訳(メタデータ) (2022-11-08T09:31:25Z) - Robot Learning from Randomized Simulations: A Review [59.992761565399185]
ディープラーニングがロボティクス研究のパラダイムシフトを引き起こし、大量のデータを必要とする方法が好まれている。
最先端のアプローチは、データ生成が高速かつ安価であるシミュレーションで学ぶ。
本稿では,ランダム化シミュレーションから学習する手法である「領域ランダム化」に焦点をあてる。
論文 参考訳(メタデータ) (2021-11-01T13:55:41Z) - Reactive Long Horizon Task Execution via Visual Skill and Precondition
Models [59.76233967614774]
シミュレーションで学習したモデルを用いて、単純なタスクプランナの構成要素をグラウンド化することで、見知らぬロボットタスクを達成できるシミュレート・トゥ・リアル・トレーニングのアプローチについて述べる。
シミュレーションでは91.6%から98%,実世界の成功率は10%から80%に増加した。
論文 参考訳(メタデータ) (2020-11-17T15:24:01Z) - A Framework for Learning Predator-prey Agents from Simulation to Real
World [0.0]
本研究では,シミュレーションから実世界への展開が可能な進化型捕食ロボットシステムを提案する。
捕食者と獲物は共に、期待される行動を学ぶために、NeuroEvolution of Augmenting Topologies (NEAT)によって進化する。
ユーザの利便性のために、シミュレートされた実世界のソースコードとビデオがGithubで公開されている。
論文 参考訳(メタデータ) (2020-10-29T17:33:38Z) - A machine learning environment for evaluating autonomous driving
software [1.6516902135723865]
自動運転車のコーナーケース動作を検出するための機械学習環境を提案する。
我々の環境は、CARLAシミュレーションソフトウェアを機械学習フレームワークとカスタムAIクライアントソフトウェアに接続することに基づいている。
我々のシステムは、車両AIが状況を正確に理解できないコーナーケースを探索することができる。
論文 参考訳(メタデータ) (2020-03-07T13:05:03Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。