論文の概要: Low-cost Real-world Implementation of the Swing-up Pendulum for Deep Reinforcement Learning Experiments
- arxiv url: http://arxiv.org/abs/2503.11065v1
- Date: Fri, 14 Mar 2025 04:18:36 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-03-17 13:08:13.561191
- Title: Low-cost Real-world Implementation of the Swing-up Pendulum for Deep Reinforcement Learning Experiments
- Title(参考訳): 深部強化学習実験のためのSwing-up Pendulumの低コスト実世界実装
- Authors: Peter Böhm, Pauline Pounds, Archie C. Chapman,
- Abstract要約: シミュレーションから実時間DRL法を探索するための低コストな物理逆振り子装置とソフトウェア環境について述べる。
特に,本装置の設計により,センサ,通信,学習,推論,動作時の物理的システムに発生する遅延を詳細に調べることができる。
我々のデザインは、市販の電子製品や電気機械、センサーシステム、一般的な金属押出成形、ドール、3Dプリントのカップリングと組み合わせることで、安価な物理DRL装置を実現する方法を示している。
- 参考スコア(独自算出の注目度): 4.669957449088593
- License:
- Abstract: Deep reinforcement learning (DRL) has had success in virtual and simulated domains, but due to key differences between simulated and real-world environments, DRL-trained policies have had limited success in real-world applications. To assist researchers to bridge the \textit{sim-to-real gap}, in this paper, we describe a low-cost physical inverted pendulum apparatus and software environment for exploring sim-to-real DRL methods. In particular, the design of our apparatus enables detailed examination of the delays that arise in physical systems when sensing, communicating, learning, inferring and actuating. Moreover, we wish to improve access to educational systems, so our apparatus uses readily available materials and parts to reduce cost and logistical barriers. Our design shows how commercial, off-the-shelf electronics and electromechanical and sensor systems, combined with common metal extrusions, dowel and 3D printed couplings provide a pathway for affordable physical DRL apparatus. The physical apparatus is complemented with a simulated environment implemented using a high-fidelity physics engine and OpenAI Gym interface.
- Abstract(参考訳): 深層強化学習(DRL)は、仮想およびシミュレートされたドメインで成功したが、シミュレーションされた環境と実世界の環境の主な違いのため、DRLの訓練されたポリシーは現実世界のアプリケーションで限られた成功を収めた。
本稿では,研究者による「textit{sim-to-real gap}」の橋渡しを支援するために,低コストな物理的逆振り子装置と,シム-to-real DRL法を探索するためのソフトウェア環境について述べる。
特に,本装置の設計により,センサ,通信,学習,推論,動作時の物理的システムに発生する遅延を詳細に調べることができる。
さらに,教育システムへのアクセスを向上し,コストと論理的障壁を低減すべく,手軽に利用可能な材料や部品を利用することを目標としている。
我々のデザインは、市販の電子製品や電気機械、センサーシステム、一般的な金属押出成形、ドール、3Dプリントのカップリングと組み合わせることで、安価な物理DRL装置を実現する方法を示している。
物理装置は、高忠実度物理エンジンとOpenAI Gymインタフェースを用いて実装されたシミュレーション環境を補完する。
関連論文リスト
- Aquatic Navigation: A Challenging Benchmark for Deep Reinforcement Learning [53.3760591018817]
ゲームエンジンとDeep Reinforcement Learningの統合の最近の進歩を利用して,水上ナビゲーションのための新しいベンチマーク環境を提案する。
具体的には、最も広く受け入れられているアルゴリズムの一つであるPPOに着目し、先進的なトレーニング手法を提案する。
実験により,これらの成分をうまく組み合わせることで,有望な結果が得られることが示された。
論文 参考訳(メタデータ) (2024-05-30T23:20:23Z) - Real-World Fluid Directed Rigid Body Control via Deep Reinforcement
Learning [7.714620721734689]
ボックス・オ・フロー(Box o Flows)は、動的実世界のシナリオにおいてRLアルゴリズムを体系的に評価する実験的な制御システムである。
モデルフリーなRLアルゴリズムは, 単純な報酬仕様を用いて, 様々な複雑な振る舞いを合成できることを示す。
この予備的な研究から得られた洞察とBox o Flowsのようなシステムの可用性は、体系的なRLアルゴリズムの開発を支援するものだと考えています。
論文 参考訳(メタデータ) (2024-02-08T23:35:03Z) - SERL: A Software Suite for Sample-Efficient Robotic Reinforcement
Learning [85.21378553454672]
筆者らは,報酬の計算と環境のリセットを行う手法とともに,効率的なオフ・ポリティクス・ディープ・RL法を含むライブラリを開発した。
我々は,PCBボードアセンブリ,ケーブルルーティング,オブジェクトの移動に関するポリシを,非常に効率的な学習を実現することができることを発見した。
これらの政策は完全な成功率またはほぼ完全な成功率、摂動下でさえ極端な堅牢性を実現し、突発的な堅牢性回復と修正行動を示す。
論文 参考訳(メタデータ) (2024-01-29T10:01:10Z) - Reinforcement-learning robotic sailboats: simulator and preliminary
results [0.37918614538294315]
この研究は、無人表面車両(USV)デジタルツインを用いた実実験を再現する仮想海洋環境の開発における主な課題と課題に焦点を当てる。
本稿では、自律的なナビゲーションと制御のために強化学習(RL)エージェントを利用することを考慮し、仮想世界を構築するための重要な機能を紹介する。
論文 参考訳(メタデータ) (2024-01-16T09:04:05Z) - Random resistive memory-based deep extreme point learning machine for
unified visual processing [67.51600474104171]
ハードウェア・ソフトウェア共同設計型, ランダム抵抗型メモリベース深部極点学習マシン(DEPLM)を提案する。
我々の共同設計システムは,従来のシステムと比較して,エネルギー効率の大幅な向上とトレーニングコストの削減を実現している。
論文 参考訳(メタデータ) (2023-12-14T09:46:16Z) - DRIFT: Deep Reinforcement Learning for Intelligent Floating Platforms Trajectories [18.420795137038677]
フローティングプラットフォームは、地球上の微小重力環境をエミュレートするための多用途テストベッドとして機能する。
私たちのスイートは、シミュレーションから現実への堅牢性、適応性、優れた転送性を実現します。
論文 参考訳(メタデータ) (2023-10-06T14:11:35Z) - Digital Twin-Enhanced Wireless Indoor Navigation: Achieving Efficient Environment Sensing with Zero-Shot Reinforcement Learning [21.79206567364126]
ミリ波通信は将来のモバイルネットワークにおいて重要な要素であり、複雑な環境での屋内ナビゲーションに最適である。
従来の物理学に基づく手法、例えば到着角(AoA)は複雑なシナリオでは不足することが多い。
本稿では,デジタル双生児が提供する身体的洞察を利用して,強化学習(RL)報酬関数を形作る物理情報強化学習(PIRL)手法を提案する。
論文 参考訳(メタデータ) (2023-06-11T20:33:22Z) - SurRoL: An Open-source Reinforcement Learning Centered and dVRK
Compatible Platform for Surgical Robot Learning [78.76052604441519]
SurRoLは、ダ・ヴィンチ・リサーチキット(dVRK)と互換性のある外科ロボット学習のためのRL中心のシミュレーションプラットフォームである。
プラットフォームには10の学習ベースの外科的タスクが構築されており、実際の自律的な外科的実行に共通している。
シミュレーションにおいてRLアルゴリズムを用いてSurRoLの評価を行い、奥行き分析を行い、実際のdVRKにトレーニングされたポリシーをデプロイし、実世界でより優れた転送性を実現することを示す。
論文 参考訳(メタデータ) (2021-08-30T07:43:47Z) - COCOI: Contact-aware Online Context Inference for Generalizable
Non-planar Pushing [87.7257446869134]
一般的なコンタクトリッチな操作問題は、ロボット工学における長年の課題である。
深層強化学習は、ロボット操作タスクの解決に大きな可能性を示している。
動的プロパティのコンテキスト埋め込みをオンラインにエンコードする深層RL法であるCOCOIを提案する。
論文 参考訳(メタデータ) (2020-11-23T08:20:21Z) - RL STaR Platform: Reinforcement Learning for Simulation based Training
of Robots [3.249853429482705]
強化学習(Reinforcement Learning, RL)は、宇宙ロボット工学における自律性と意思決定能力を高めるための、有望な分野である。
本稿では,RL STaRプラットフォームについて紹介する。
論文 参考訳(メタデータ) (2020-09-21T03:09:53Z) - RL-CycleGAN: Reinforcement Learning Aware Simulation-To-Real [74.45688231140689]
本稿では、画像翻訳におけるRL-scene整合性損失を導入し、画像に関連付けられたQ値に対して変換操作が不変であることを保証する。
RL-CycleGANは実世界のシミュレーションから実世界への変換による強化学習のための新しい手法である。
論文 参考訳(メタデータ) (2020-06-16T08:58:07Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。