論文の概要: A Novel Hybrid Heuristic-Reinforcement Learning Optimization Approach for a Class of Railcar Shunting Problems
- arxiv url: http://arxiv.org/abs/2603.05579v1
- Date: Thu, 05 Mar 2026 17:49:17 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-09 13:17:44.291612
- Title: A Novel Hybrid Heuristic-Reinforcement Learning Optimization Approach for a Class of Railcar Shunting Problems
- Title(参考訳): ハイブリッド・ヒューリスティック・強化学習最適化による鉄道車両シャンティング問題の一解法
- Authors: Ruonan Zhao, Joseph Geunes,
- Abstract要約: 鉄道車両の絞首刑は貨物鉄道の中核的な計画課題である。
両側の線路はキュー構造のように機能し、一方の端からレールカーを追加して反対側から除去することができる。
本稿では,鉄道固有のソリューションアプローチと強化学習手法を統合するハイブリッド・ヒューリスティック・強化学習フレームワークを提案する。
- 参考スコア(独自算出の注目度): 3.7212626924366123
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Railcar shunting is a core planning task in freight railyards, where yard planners need to disassemble and reassemble groups of railcars to form outbound trains. Classification tracks with access from one side only can be considered as stack structures, where railcars are added and removed from only one end, leading to a last-in-first-out (LIFO) retrieval order. In contrast, two-sided tracks function like queue structures, allowing railcars to be added from one end and removed from the opposite end, following a first-in-first-out (FIFO) order. We consider a problem requiring assembly of multiple outbound trains using two locomotives in a railyard with two-sided classification track access. To address this combinatorially challenging problem class, we decompose the problem into two subproblems, each with one-sided classification track access and a locomotive on each side. We present a novel Hybrid Heuristic-Reinforcement Learning (HHRL) framework that integrates railway-specific heuristic solution approaches with a reinforcement learning method, specifically Q-learning. The proposed framework leverages methods to decrease the state-action space and guide exploration during reinforcement learning. The results of a series of numerical experiments demonstrate the efficiency and quality of the HHRL algorithm in both one-sided access, single-locomotive problems and two-sided access, two-locomotive problems.
- Abstract(参考訳): 鉄道車両の絞首刑は貨物鉄道の中核的な計画課題であり、ヤードプランナーはアウトバウンド列車を形成するために車両群を解体して再組み立てする必要がある。
片側からのみアクセス可能な分類トラックはスタック構造とみなすことができ、片側のみから鉄道車両を追加・削除し、終端のLIFO(fin-in-first-out)検索順序に繋がる。
対照的に、両側の線路はキュー構造のように機能し、一方の端からレールカーを追加して反対の端から取り除くことができる。
本稿では,2両編成の客車を用いた2両編成のアウトバウンド列車組立の必要性を考察する。
この組合せ的に難しい問題に対処するために, 両サイドに1つの分類トラックアクセスと1つの機関車を持つ2つのサブプロブレムに分解する。
本稿では,鉄道固有のヒューリスティック・ソリューション・アプローチと強化学習,特にQ-ラーニングを統合するハイブリッド・ヒューリスティック・強化学習(HHRL)フレームワークを提案する。
提案フレームワークは,強化学習における状態行動空間の削減とガイド探索の手法を活用する。
数値実験の結果,一方のアクセス問題,一方のアクセス問題,一方のアクセス問題,両側のアクセス問題の両方において,HHRLアルゴリズムの効率性と品質が示された。
関連論文リスト
- TrajMoE: Scene-Adaptive Trajectory Planning with Mixture of Experts and Reinforcement Learning [24.158051656957166]
現在の自律運転システムは、画像のようなセンサー入力を受け取り、ニューラルネットワークを介して軌跡空間にマッピングすることを学ぶエンドツーエンドのフレームワークを好んでいることが多い。
従来の研究は、モデルに軌道の事前分布を与えると、より良い計画性能が得られることを示した。
論文 参考訳(メタデータ) (2025-12-08T03:40:10Z) - Reinforcement learning with combinatorial actions for coupled restless bandits [62.89013331120493]
提案するSEQUOIAは,動作空間に対する長期報酬を直接最適化するRLアルゴリズムである。
我々は,複数介入,経路制約,二部間マッチング,容量制約という,制約を伴う4つの新しいレスレス・バンディット問題に対して,SEQUOIAを実証的に検証した。
論文 参考訳(メタデータ) (2025-03-01T21:25:21Z) - HEART: Achieving Timely Multi-Model Training for Vehicle-Edge-Cloud-Integrated Hierarchical Federated Learning [30.75025062952915]
AI対応のIoT of Vehicles(IoV)の急速な成長は、効率的な機械学習(ML)ソリューションを求めている。
車両はしばしば複数のMLタスクを同時に実行する必要がある。
本稿では,グローバルトレーニング遅延の最小化を目的とした動的VEC-HFLにおけるマルチモデルトレーニングフレームワークを提案する。
論文 参考訳(メタデータ) (2025-01-17T03:15:03Z) - Using Reinforcement Learning for the Three-Dimensional Loading Capacitated Vehicle Routing Problem [40.50169360761464]
効率を上げるためのソリューションとして、協調車両ルーティングが提案されている。
現在の運用研究手法は、問題の大きさを増大させる非線形スケーリングに悩まされている。
約線形時間で3次元負荷容量化車両ルーティング問題を解くための強化学習モデルを開発した。
論文 参考訳(メタデータ) (2023-07-22T18:05:28Z) - NeurIPS 2022 Competition: Driving SMARTS [60.948652154552136]
ドライビングSMARTSは、動的相互作用コンテキストにおける分散シフトに起因する問題に対処するために設計された定期的な競争である。
提案するコンペティションは,強化学習(RL)やオフライン学習など,方法論的に多様なソリューションをサポートする。
論文 参考訳(メタデータ) (2022-11-14T17:10:53Z) - Supervised Permutation Invariant Networks for Solving the CVRP with
Bounded Fleet Size [3.5235974685889397]
車両ルーティング問題などの最適化問題を解くための学習は、大きな計算上の利点をもたらす。
本研究では,アプリオリ固定数の車両を尊重しながら,スクラッチから完全なツアー計画を構築する強力な教師付きディープラーニングフレームワークを提案する。
効率的な後処理方式と組み合わせることで,教師付きアプローチはより高速かつ容易にトレーニングできるだけでなく,競争力のある結果が得られる。
論文 参考訳(メタデータ) (2022-01-05T10:32:18Z) - Quadratic and Higher-Order Unconstrained Binary Optimization of Railway
Rescheduling for Quantum Computing [0.5161531917413706]
本稿では,鉄道交通管理の問題の再スケジューリングのためのQUBOおよびHOBO表現について紹介する。
我々は、列車間の出入口の最小化、駅での滞在の最小化、線路の占有、車両の循環について検討する。
論文 参考訳(メタデータ) (2021-07-07T14:07:07Z) - Value Function is All You Need: A Unified Learning Framework for Ride
Hailing Platforms [57.21078336887961]
DiDi、Uber、Lyftなどの大型配車プラットフォームは、都市内の数万台の車両を1日中数百万の乗車要求に接続している。
両課題に対処するための統合価値に基づく動的学習フレームワーク(V1D3)を提案する。
論文 参考訳(メタデータ) (2021-05-18T19:22:24Z) - Solving the single-track train scheduling problem via Deep Reinforcement
Learning [0.0]
引き起こされた遅延がネットワークを通じて伝播し、需要のミスマッチと商品や乗客の供給につながった。
人間の交通管制官は、交通への影響を最小限に抑えるために最善を尽くす。
本稿では,この問題に対処するための機械学習に基づく手法について検討し,二つの異なるQ-Learning手法を提案する。
論文 参考訳(メタデータ) (2020-09-01T14:03:56Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。