論文の概要: A Model-Driven Approach for Developing Families of Reinforcement Learning Environments
- arxiv url: http://arxiv.org/abs/2606.20324v1
- Date: Thu, 18 Jun 2026 15:02:38 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-19 18:23:39.930912
- Title: A Model-Driven Approach for Developing Families of Reinforcement Learning Environments
- Title(参考訳): 強化学習環境構築のためのモデル駆動型アプローチ
- Authors: Xiaoran Liu, Istvan David,
- Abstract要約: 本稿では,RL学習環境の家族構築のためのモデル駆動型アプローチを提案する。
提案手法では,人口ベースグローバルサーチと局所サーチを組み合わせたハイブリッドアルゴリズムにより,環境家族を生成する。
本研究では,山火事軽減シナリオとカリキュラム学習におけるアプローチの健全性を示す。
- 参考スコア(独自算出の注目度): 9.087189607749094
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Virtual training environments are software-intensive systems in which reinforcement learning (RL) agents learn, adapt, and demonstrate meaningful behavior. Virtual training environments offer a safe and cost-efficient alternative to training agents in real-world settings. However, to converge, most realistic RL problems require training in multiple, mostly similar but slightly different environments - i.e., families of environment variants. The typical development process of environment families is a labor-intensive and error-prone manual endeavor that does not scale well. To alleviate these issues, in this paper, we propose a model-driven approach for developing families of RL training environments. To obtain the family of environments, we develop an approach and prototype tool. In our approach, a hybrid genetic algorithm - a combination of population-based global search and heuristic local search - generates environment families. Mutations and constraints are expressed as model transformations and are operationalized into a search process by a state-of-the-art model transformation engine. We demonstrate the soundness of our approach in a wildfire mitigation scenario and curriculum learning - a particular learning paradigm that relies on environment families.
- Abstract(参考訳): 仮想トレーニング環境は、強化学習(RL)エージェントが有意義な振る舞いを学び、適応し、示すソフトウェア集約システムである。
仮想トレーニング環境は、現実世界のトレーニングエージェントに、安全でコスト効率のよい代替手段を提供する。
しかし、収束するためには、最も現実的なRL問題は、複数の、ほとんど類似しているがわずかに異なる環境、すなわち環境変動の族での訓練を必要とする。
環境家族の典型的な開発プロセスは、労働集約的でエラーを起こしやすい手作業であり、うまくスケールしない。
本稿では,これらの問題を緩和するために,RL学習環境の家族構築のためのモデル駆動型アプローチを提案する。
環境のファミリーを得るため,我々はアプローチとプロトタイプツールを開発した。
提案手法では,集団に基づくグローバルサーチとヒューリスティックなローカルサーチを組み合わせたハイブリッド遺伝的アルゴリズムが環境ファミリーを生成する。
変異と制約はモデル変換として表現され、最先端のモデル変換エンジンによって検索プロセスに操作される。
環境家族に依存した特定の学習パラダイムである、山火事軽減シナリオとカリキュラム学習において、我々のアプローチの健全さを実証する。
関連論文リスト
- Towards Adaptive Environment Generation for Training Embodied Agents [6.22572530511425]
身体的なエージェントは、新しい環境に一般化するのに苦労します。
これらのトレーニング環境を生成するための現在のアプローチは、オープンループのパラダイムに従っている。
エージェントの現在の能力に難易度を適応させるクローズドループ環境生成のための概念実証を行う。
論文 参考訳(メタデータ) (2026-02-06T03:50:46Z) - Path Planning through Multi-Agent Reinforcement Learning in Dynamic Environments [2.116865312302264]
動的環境における経路計画のための拡張性のある地域対応強化学習フレームワークを提案する。
本手法は, 環境変化は動的ではあるが, しばしば境界領域内で局所化されるという観察に基づいている。
論文 参考訳(メタデータ) (2025-11-19T09:48:44Z) - Exploration-Driven Generative Interactive Environments [53.05314852577144]
我々は、低コストで自動収集されたインタラクションデータに多くの仮想環境を使用することに重点を置いている。
仮想環境におけるランダムエージェントのみを用いたトレーニングフレームワークを提案する。
我々のエージェントは環境固有の報酬に完全に依存しているため、新しい環境に容易に適応できる。
論文 参考訳(メタデータ) (2025-04-03T12:01:41Z) - Aquatic Navigation: A Challenging Benchmark for Deep Reinforcement Learning [53.3760591018817]
ゲームエンジンとDeep Reinforcement Learningの統合の最近の進歩を利用して,水上ナビゲーションのための新しいベンチマーク環境を提案する。
具体的には、最も広く受け入れられているアルゴリズムの一つであるPPOに着目し、先進的なトレーニング手法を提案する。
実験により,これらの成分をうまく組み合わせることで,有望な結果が得られることが示された。
論文 参考訳(メタデータ) (2024-05-30T23:20:23Z) - Learning Curricula in Open-Ended Worlds [17.138779075998084]
この論文は、Unsupervised Environment Design (UED)と呼ばれる手法のクラスを開発する。
環境設計空間が与えられたら、UEDは自動的に訓練環境の無限のシーケンスやカリキュラムを生成する。
本論文は,UEDオートキュリキュラがRL薬を産生し,ロバスト性を大幅に改善することを示した。
論文 参考訳(メタデータ) (2023-12-03T16:44:00Z) - Scenic4RL: Programmatic Modeling and Generation of Reinforcement
Learning Environments [89.04823188871906]
リアルタイム戦略(RTS)環境では,多様な現実シナリオの生成が難しい。
既存のシミュレータのほとんどは環境をランダムに生成することに頼っている。
我々は、研究者を支援するために、既存の形式シナリオ仕様言語であるSCENICを採用する利点を紹介する。
論文 参考訳(メタデータ) (2021-06-18T21:49:46Z) - Emergent Complexity and Zero-shot Transfer via Unsupervised Environment
Design [121.73425076217471]
本研究では,未知のパラメータを持つ環境を提供するUnsupervised Environment Design (UED)を提案する。
プロタゴニスト・アンタゴニストによるレグレト環境デザイン(PAIRED)と呼ぶ。
実験により, PAIREDは複雑な環境の自然なカリキュラムを生産し, PAIREDエージェントは, 高度に新規な環境での試験において, 高いゼロショット転送性能が得られることを示した。
論文 参考訳(メタデータ) (2020-12-03T17:37:01Z) - Variational Dynamic for Self-Supervised Exploration in Deep Reinforcement Learning [12.76337275628074]
本研究では,条件付き変分推論に基づく変動力学モデルを提案し,多モード性および生成性をモデル化する。
環境遷移の負の対数類似度の上界を導出し、その上界を探査の本質的な報酬として利用する。
提案手法は,最先端の環境モデルに基づく探索手法よりも優れている。
論文 参考訳(メタデータ) (2020-10-17T09:54:51Z) - The Chef's Hat Simulation Environment for Reinforcement-Learning-Based
Agents [54.63186041942257]
本稿では,人間-ロボットインタラクションのシナリオで使用されるように設計されたChef's Hatカードゲームを実装する仮想シミュレーション環境を提案する。
本稿では,強化学習アルゴリズムにおける制御可能かつ再現可能なシナリオを提案する。
論文 参考訳(メタデータ) (2020-03-12T15:52:49Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。