論文の概要: Novel RL approach for efficient Elevator Group Control Systems
- arxiv url: http://arxiv.org/abs/2507.00011v1
- Date: Thu, 12 Jun 2025 11:54:59 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-07 02:47:44.376849
- Title: Novel RL approach for efficient Elevator Group Control Systems
- Title(参考訳): 効率的なエレベータ群制御システムのための新しいRLアプローチ
- Authors: Nathan Vaartjes, Vincent Francois-Lavet,
- Abstract要約: エンドツーエンド強化学習(RL)エレベータ制御システム(EGCS)を訓練する。
主なイノベーションは、エレベーターディスパッチの複雑さを扱う新しいアクションスペースエンコーディングである。
提案したRLに基づくEGCSは,変動パターンに適応し,交通環境から学習し,従来のルールベースアルゴリズムより優れていることを示す。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Efficient elevator traffic management in large buildings is critical for minimizing passenger travel times and energy consumption. Because heuristic- or pattern-detection-based controllers struggle with the stochastic and combinatorial nature of dispatching, we model the six-elevator, fifteen-floor system at Vrije Universiteit Amsterdam as a Markov Decision Process and train an end-to-end Reinforcement Learning (RL) Elevator Group Control System (EGCS). Key innovations include a novel action space encoding to handle the combinatorial complexity of elevator dispatching, the introduction of infra-steps to model continuous passenger arrivals, and a tailored reward signal to improve learning efficiency. In addition, we explore various ways to adapt the discounting factor to the infra-step formulation. We investigate RL architectures based on Dueling Double Deep Q-learning, showing that the proposed RL-based EGCS adapts to fluctuating traffic patterns, learns from a highly stochastic environment, and thereby outperforms a traditional rule-based algorithm.
- Abstract(参考訳): 大きな建物における効率的なエレベーター交通管理は、乗客の移動時間とエネルギー消費を最小化するために重要である。
ヒューリスティック型あるいはパターン検出型コントローラは、ディスパッチの確率的・組合せ的な性質に苦しむため、Vrije Universiteit Amsterdamの6階のエレベータ、15階のシステムをマルコフ決定プロセスとしてモデル化し、エンドツーエンドの強化学習(RL)エレベータ群制御システム(EGCS)を訓練する。
主なイノベーションは、エレベーターの発送の組合せ複雑さを扱うための新しいアクション空間の符号化、連続した乗客の到着をモデル化するための赤外線ステップの導入、学習効率を向上させるための調整された報酬信号である。
さらに,ディスカウント係数をフレームステップの定式化に適応させる様々な方法について検討する。
本稿では,Dueling Double Deep Q-learningに基づくRLアーキテクチャについて検討し,提案したRLに基づくEGCSが交通パターンの変動に適応し,高度確率環境から学習し,従来のルールベースアルゴリズムより優れていることを示す。
関連論文リスト
- Attention on flow control: transformer-based reinforcement learning for lift regulation in highly disturbed flows [0.0]
本研究では, ピッチ制御によるガスト列の空力昇降制御を効果的に行うための変圧器を用いた強化学習フレームワークを提案する。
学習戦略は,ガッツ数の増加に伴って性能ギャップが拡大し,最高の比例制御よりも優れることを示す。
論文 参考訳(メタデータ) (2025-06-11T20:14:28Z) - Enhancing Spectrum Efficiency in 6G Satellite Networks: A GAIL-Powered Policy Learning via Asynchronous Federated Inverse Reinforcement Learning [67.95280175998792]
ビームフォーミング,スペクトルアロケーション,リモートユーザ機器(RUE)アソシエイトを最適化するために,GAILを利用した新しいポリシー学習手法を提案する。
手動チューニングなしで報酬関数を自動的に学習するために、逆RL(IRL)を用いる。
提案手法は従来のRL手法よりも優れており,コンバージェンスと報酬値の14.6%の改善が達成されている。
論文 参考訳(メタデータ) (2024-09-27T13:05:02Z) - Confidence-Controlled Exploration: Efficient Sparse-Reward Policy Learning for Robot Navigation [72.24964965882783]
強化学習(RL)はロボットナビゲーションにおいて有望なアプローチであり、ロボットは試行錯誤を通じて学習することができる。
現実世界のロボットタスクは、しばしばまばらな報酬に悩まされ、非効率な探索と準最適政策に繋がる。
本稿では,RLに基づくロボットナビゲーションにおいて,報酬関数を変更せずにサンプル効率を向上させる新しい手法であるConfidence-Controlled Exploration (CCE)を紹介する。
論文 参考訳(メタデータ) (2023-06-09T18:45:15Z) - Application of Deep Q Learning with Stimulation Results for Elevator
Optimization [8.124288380367018]
本稿では,エレベータ待ち時間を最適化するために,プログラミングと数学を組み合わせる手法を提案する。
まず,エレベータの背後にある論理の直感的な理解からナイーブモデルを開発する。
同じ評価フレームワークを用いて,エレベータ制御のためのハードコードナイーブアプローチに適合するディープQ学習モデルの開発を進める。
論文 参考訳(メタデータ) (2022-09-30T19:53:00Z) - Skip Training for Multi-Agent Reinforcement Learning Controller for
Industrial Wave Energy Converters [94.84709449845352]
近年のウェーブ・エナジー・コンバータ(WEC)は、発電を最大化するために複数の脚と発電機を備えている。
従来のコントローラは複雑な波のパターンを捕捉する制限を示しており、コントローラはエネルギー捕獲を効率的に最大化する必要がある。
本稿では,従来のスプリングダンパよりも優れたマルチエージェント強化学習コントローラ(MARL)を提案する。
論文 参考訳(メタデータ) (2022-09-13T00:20:31Z) - Improving Robustness of Reinforcement Learning for Power System Control
with Adversarial Training [71.7750435554693]
電力系統制御のために提案された最先端のRLエージェントが敵攻撃に対して脆弱であることを示す。
具体的には、敵のマルコフ決定プロセスを用いて攻撃方針を学習し、攻撃の有効性を実証する。
本稿では,RLエージェントの攻撃に対する堅牢性を高め,実行不可能な運用上の決定を回避するために,敵の訓練を利用することを提案する。
論文 参考訳(メタデータ) (2021-10-18T00:50:34Z) - Reinforcement Learning with Evolutionary Trajectory Generator: A General
Approach for Quadrupedal Locomotion [29.853927354893656]
進化的足跡生成器を含む新しいRLに基づくアプローチを提案する。
ジェネレータは、与えられたタスクの出力軌跡の形状を継続的に最適化し、ポリシー学習のガイドとなる多様な動作前を提供する。
我々は,12-DoF四足歩行ロボットのシミュレーションで学習したコントローラをデプロイし,効率の良い歩行で挑戦的なシナリオを横切ることに成功した。
論文 参考訳(メタデータ) (2021-09-14T02:51:50Z) - RL-Controller: a reinforcement learning framework for active structural
control [0.0]
フレキシブルでスケーラブルなシミュレーション環境であるRL-Controllerを導入することで,アクティブコントローラを設計するための新しいRLベースのアプローチを提案する。
提案するフレームワークは,5階建てのベンチマークビルディングに対して,平均65%の削減率で,容易に学習可能であることを示す。
LQG 能動制御法との比較研究において,提案したモデルフリーアルゴリズムはより最適なアクチュエータ強制戦略を学習することを示した。
論文 参考訳(メタデータ) (2021-03-13T04:42:13Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。