論文の概要: Reinforcement Learning-based Sequential Route Recommendation for System-Optimal Traffic Assignment
- arxiv url: http://arxiv.org/abs/2505.20889v1
- Date: Tue, 27 May 2025 08:33:02 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-28 17:05:58.517817
- Title: Reinforcement Learning-based Sequential Route Recommendation for System-Optimal Traffic Assignment
- Title(参考訳): システム最適交通割当てのための強化学習に基づく逐次経路勧告
- Authors: Leizhen Wang, Peibo Duan, Cheng Lyu, Zhenliang Ma,
- Abstract要約: 本稿では,静的なSOトラフィック割り当て問題を単一エージェントの深層強化学習タスクとして再構成する学習ベースフレームワークを提案する。
我々は,従来の交通割当手法の反復構造をRL学習プロセスに統合する,MSA誘導深度Q-ラーニングアルゴリズムを開発した。
その結果, RL はBraess ネットワークにおける理論 SO 解に収束し, OW ネットワークにおける 0.35% の偏差しか得られないことがわかった。
- 参考スコア(独自算出の注目度): 8.598431584462944
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Modern navigation systems and shared mobility platforms increasingly rely on personalized route recommendations to improve individual travel experience and operational efficiency. However, a key question remains: can such sequential, personalized routing decisions collectively lead to system-optimal (SO) traffic assignment? This paper addresses this question by proposing a learning-based framework that reformulates the static SO traffic assignment problem as a single-agent deep reinforcement learning (RL) task. A central agent sequentially recommends routes to travelers as origin-destination (OD) demands arrive, to minimize total system travel time. To enhance learning efficiency and solution quality, we develop an MSA-guided deep Q-learning algorithm that integrates the iterative structure of traditional traffic assignment methods into the RL training process. The proposed approach is evaluated on both the Braess and Ortuzar-Willumsen (OW) networks. Results show that the RL agent converges to the theoretical SO solution in the Braess network and achieves only a 0.35% deviation in the OW network. Further ablation studies demonstrate that the route action set's design significantly impacts convergence speed and final performance, with SO-informed route sets leading to faster learning and better outcomes. This work provides a theoretically grounded and practically relevant approach to bridging individual routing behavior with system-level efficiency through learning-based sequential assignment.
- Abstract(参考訳): 現代のナビゲーションシステムと共有モビリティプラットフォームは、個々の旅行経験と運用効率を改善するために、パーソナライズされたルートレコメンデーションに依存している。
このようなシーケンシャルでパーソナライズされたルーティング決定は、総合的にシステム最適化(SO)トラフィック割り当てにつながるか?
本稿では,静的なSOトラフィック割り当て問題を単一エージェント深層学習(RL)タスクとして再構成する学習ベースフレームワークを提案する。
中央エージェントは、システム全体の移動時間を最小化するために、オリジン・デスティネーション(OD)の要求が到着するにつれて、旅行者へのルートを順次推奨する。
学習効率とソリューション品質を向上させるため,従来の交通割当手法の反復構造をRLトレーニングプロセスに統合したMSA誘導深度Q-ラーニングアルゴリズムを開発した。
提案手法はBraess と Ortuzar-Willumsen (OW) の両ネットワークで評価される。
その結果, RL はBraess ネットワークにおける理論 SO 解に収束し, OW ネットワークにおける 0.35% の偏差しか得られないことがわかった。
さらなるアブレーション研究では、ルートアクションセットの設計が収束速度と最終性能に大きく影響し、SOインフォームされたルートセットがより高速な学習とより良い結果をもたらすことが示されている。
この研究は、学習に基づくシーケンシャルな割り当てを通じて、個々のルーティング動作をシステムレベルの効率でブリッジする理論的な基礎と実践的なアプローチを提供する。
関連論文リスト
- Accelerating Vehicle Routing via AI-Initialized Genetic Algorithms [55.78505925402658]
車両ルーティング問題(VRP)は、トラベリングセールスパーソン問題の延長であり、進化的最適化における基本的なNPハードチャレンジである。
遺伝的アルゴリズムによってさらに最適化された初期解を迅速に生成するために、強化学習エージェント(事前インスタンスで訓練された)を使用した新しい最適化フレームワークを導入する。
例えば、EARLIは1秒以内に500カ所の車両ルーティングを処理し、同じソリューション品質の現在のソルバよりも10倍高速で、リアルタイムやインタラクティブなルーティングのようなアプリケーションを可能にする。
論文 参考訳(メタデータ) (2025-04-08T15:21:01Z) - Intelligent Routing Algorithm over SDN: Reusable Reinforcement Learning Approach [1.799933345199395]
本稿では,再利用可能なRLSRルーティングアルゴリズム RLSR-Routing をSDN上で開発する。
我々のアルゴリズムは従来の手法よりもロードバランシングの点で優れた性能を示している。
また、複数のトラフィック要求のパスを見つける際には、再利用不可能なRLアプローチよりも早く収束する。
論文 参考訳(メタデータ) (2024-09-23T17:15:24Z) - An Efficient Learning-based Solver Comparable to Metaheuristics for the
Capacitated Arc Routing Problem [67.92544792239086]
我々は,高度メタヒューリスティックスとのギャップを著しく狭めるため,NNベースの解法を導入する。
まず,方向対応型注意モデル(DaAM)を提案する。
第2に、教師付き事前学習を伴い、堅牢な初期方針を確立するための教師付き強化学習スキームを設計する。
論文 参考訳(メタデータ) (2024-03-11T02:17:42Z) - A Deep Reinforcement Learning Approach for Adaptive Traffic Routing in
Next-gen Networks [1.1586742546971471]
次世代ネットワークは、トラフィックダイナミクスに基づいたネットワーク構成を自動化し、適応的に調整する必要がある。
交通政策を決定する伝統的な手法は、通常は手作りのプログラミング最適化とアルゴリズムに基づいている。
我々は適応的なトラフィックルーティングのための深層強化学習(DRL)アプローチを開発する。
論文 参考訳(メタデータ) (2024-02-07T01:48:29Z) - MARLIN: Soft Actor-Critic based Reinforcement Learning for Congestion
Control in Real Networks [63.24965775030673]
そこで本研究では,汎用的な渋滞制御(CC)アルゴリズムを設計するための新しい強化学習(RL)手法を提案する。
我々の解であるMARLINは、Soft Actor-Criticアルゴリズムを用いてエントロピーとリターンの両方を最大化する。
我々は,MARLINを実ネットワーク上で訓練し,実ミスマッチを克服した。
論文 参考訳(メタデータ) (2023-02-02T18:27:20Z) - DL-DRL: A double-level deep reinforcement learning approach for
large-scale task scheduling of multi-UAV [65.07776277630228]
分割・征服フレームワーク(DCF)に基づく二重レベル深層強化学習(DL-DRL)手法を提案する。
特に,上層部DRLモデルにおけるエンコーダ・デコーダ構成ポリシネットワークを設計し,タスクを異なるUAVに割り当てる。
また、低レベルDRLモデルにおける別の注意に基づくポリシーネットワークを利用して、各UAVの経路を構築し、実行されたタスク数を最大化する。
論文 参考訳(メタデータ) (2022-08-04T04:35:53Z) - A Deep Value-network Based Approach for Multi-Driver Order Dispatching [55.36656442934531]
そこで本研究では,注文発送のための深層強化学習に基づくソリューションを提案する。
DiDiの配車プラットフォーム上で大規模なオンラインA/Bテストを実施している。
その結果,CVNetは近年提案されているディスパッチ手法よりも一貫して優れていた。
論文 参考訳(メタデータ) (2021-06-08T16:27:04Z) - Deep Reinforcement Learning for Crowdsourced Urban Delivery: System
States Characterization, Heuristics-guided Action Choice, and
Rule-Interposing Integration [0.8099700053397277]
本稿では,クラウドソーシング型都市デリバリの文脈において,アドホック宅配業者に送料要求を割り当てることの問題点について検討する。
本稿では,この課題に対処するための新しい深層強化学習(DRL)アプローチを提案する。
論文 参考訳(メタデータ) (2020-11-29T19:50:34Z) - Track-Assignment Detailed Routing Using Attention-based Policy Model
With Supervision [0.27998963147546135]
本稿では、トラック割り当ての詳細ルーティング問題を解決するための機械学習駆動方式を提案する。
我々のアプローチは、注意に基づく強化学習(RL)ポリシーモデルを採用する。
特に複雑な問題に対して, 教師付きRL法が高品質な解であることを示す。
論文 参考訳(メタデータ) (2020-10-26T16:40:11Z) - Dynamics Generalization via Information Bottleneck in Deep Reinforcement
Learning [90.93035276307239]
本稿では,RLエージェントのより優れた一般化を実現するために,情報理論正則化目標とアニーリングに基づく最適化手法を提案する。
迷路ナビゲーションからロボットタスクまで、さまざまな領域において、我々のアプローチの極端な一般化の利点を実証する。
この研究は、タスク解決のために冗長な情報を徐々に取り除き、RLの一般化を改善するための原則化された方法を提供する。
論文 参考訳(メタデータ) (2020-08-03T02:24:20Z) - Towards Cognitive Routing based on Deep Reinforcement Learning [17.637357380527583]
本稿では,Deep Reinforcement Learning(DRL)に基づく認知的ルーティングの定義と実装アプローチを提案する。
DRLに基づく認知ルーティングの研究を容易にするために,DRLに基づくルーティングアルゴリズムの開発とシミュレーションのためのシミュレータRL4Netを導入する。
実例ネットワークトポロジのシミュレーション結果から,DDPGに基づくルーティングアルゴリズムはOSPFやランダムウェイトアルゴリズムよりも優れた性能を示すことが示された。
論文 参考訳(メタデータ) (2020-03-19T03:32:43Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。