論文の概要: Bi-level RL-Heuristic Optimization for Real-world Winter Road Maintenance
- arxiv url: http://arxiv.org/abs/2602.24097v1
- Date: Fri, 27 Feb 2026 15:37:35 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-02 19:48:24.490822
- Title: Bi-level RL-Heuristic Optimization for Real-world Winter Road Maintenance
- Title(参考訳): 実世界の冬期道路整備のための2レベルRLヒューリスティック最適化
- Authors: Yue Xie, Zizhen Xu, William Beazley, Fumiya Iida,
- Abstract要約: 冬の道路整備は、公共の安全を確保し、環境への影響を減らすために重要である。
既存の手法では、大規模なルーティング問題を効果的に管理することができず、主に人間の判断に応答する。
本研究は,イギリスの戦略的道路網における実運用データに基づく,スケーラブルな2段階最適化フレームワークを提案する。
- 参考スコア(独自算出の注目度): 3.7856931422411346
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Winter road maintenance is critical for ensuring public safety and reducing environmental impacts, yet existing methods struggle to manage large-scale routing problems effectively and mostly reply on human decision. This study presents a novel, scalable bi-level optimization framework, validated on real operational data on UK strategic road networks (M25, M6, A1), including interconnected local road networks in surrounding areas for vehicle traversing, as part of the highway operator's efforts to solve existing planning challenges. At the upper level, a reinforcement learning (RL) agent strategically partitions the road network into manageable clusters and optimally allocates resources from multiple depots. At the lower level, a multi-objective vehicle routing problem (VRP) is solved within each cluster, minimizing the maximum vehicle travel time and total carbon emissions. Unlike existing approaches, our method handles large-scale, real-world networks efficiently, explicitly incorporating vehicle-specific constraints, depot capacities, and road segment requirements. Results demonstrate significant improvements, including balanced workloads, reduced maximum travel times below the targeted two-hour threshold, lower emissions, and substantial cost savings. This study illustrates how advanced AI-driven bi-level optimization can directly enhance operational decision-making in real-world transportation and logistics.
- Abstract(参考訳): 冬期道路整備は、公共の安全を確保し、環境への影響を減らすために重要であるが、既存の手法は大規模な経路問題の効率的な管理に苦慮し、主に人間の判断に答える。
本研究は、既存の計画課題を解決するための高速道路事業者の取り組みの一環として、イギリスにおける戦略的道路網(M25, M6, A1)の実際の運用データに基づく、新しいスケーラブルな二段階最適化フレームワークを提案する。
上位レベルでは、強化学習(RL)エージェントが道路ネットワークを戦略的に管理可能なクラスタに分割し、複数の補給所から資源を最適に割り当てる。
低レベルでは、各クラスタ内で多目的車両ルーティング問題(VRP)を解き、最大走行時間と総二酸化炭素排出量を最小化する。
既存手法とは異なり,本手法は車両固有の制約,デポ容量,道路セグメント要件を明示的に組み込んで,大規模で現実的なネットワークを効率的に処理する。
その結果、バランスの取れたワークロード、目標となる2時間の閾値以下での最大走行時間削減、排出の削減、大幅なコスト削減など、大幅な改善が示された。
この研究は、AI駆動の2レベル最適化が、現実の輸送と物流における運用上の意思決定を直接的に強化する方法について説明する。
関連論文リスト
- Accelerating Vehicle Routing via AI-Initialized Genetic Algorithms [53.75036695728983]
車両ルーティング問題 (VRP) は進化的最適化における基本的なNPハード問題である。
本稿では、強化学習エージェントを事前のインスタンスで訓練し、初期解を迅速に生成する最適化フレームワークを提案する。
このフレームワークは、様々な時間予算において、現在の最先端のソルバよりも一貫して優れています。
論文 参考訳(メタデータ) (2025-04-08T15:21:01Z) - Multi-objective Optimal Roadside Units Deployment in Urban Vehicular Networks [7.951541004150428]
都市車両網では,交通効率,安全,関連サービスの重要性が増している。
このようなネットワーク内では、道路側ユニット(RSU)が通信を容易にする中間体として機能する。
都市環境においては、建物、庭園、湖沼、その他のインフラなど様々な障害が存在することが、RSUの展開に課題を提起している。
論文 参考訳(メタデータ) (2024-01-14T05:02:12Z) - TOP-Former: A Multi-Agent Transformer Approach for the Team Orienteering Problem [47.40841984849682]
車両群のためのルートプランニングは、荷物の配送、監視、輸送といった応用において重要な課題である。
ToP-Formerは、チームのオリエンテーリング問題を効率的に正確に解くために設計されたマルチエージェント経路計画ニューラルネットワークである。
論文 参考訳(メタデータ) (2023-11-30T16:10:35Z) - Adaptive Resource Allocation for Virtualized Base Stations in O-RAN with Online Learning [55.08287089554127]
基地局(vBS)を備えたオープンラジオアクセスネットワークシステムは、柔軟性の向上、コスト削減、ベンダーの多様性、相互運用性のメリットを提供する。
本研究では,予期せぬ「混み合う」環境下であっても,効率的なスループットとvBSエネルギー消費のバランスをとるオンライン学習アルゴリズムを提案する。
提案手法は, 課題のある環境においても, 平均最適性ギャップをゼロにすることで, サブ線形後悔を実現する。
論文 参考訳(メタデータ) (2023-09-04T17:30:21Z) - Using Reinforcement Learning for the Three-Dimensional Loading Capacitated Vehicle Routing Problem [40.50169360761464]
効率を上げるためのソリューションとして、協調車両ルーティングが提案されている。
現在の運用研究手法は、問題の大きさを増大させる非線形スケーリングに悩まされている。
約線形時間で3次元負荷容量化車両ルーティング問題を解くための強化学習モデルを開発した。
論文 参考訳(メタデータ) (2023-07-22T18:05:28Z) - DenseLight: Efficient Control for Large-scale Traffic Signals with Dense
Feedback [109.84667902348498]
交通信号制御(TSC)は、道路網における車両の平均走行時間を短縮することを目的としている。
従来のTSC手法は、深い強化学習を利用して制御ポリシーを探索する。
DenseLightは、不偏報酬関数を用いてポリシーの有効性をフィードバックする新しいRTLベースのTSC手法である。
論文 参考訳(メタデータ) (2023-06-13T05:58:57Z) - A Deep RL Approach on Task Placement and Scaling of Edge Resources for Cellular Vehicle-to-Network Service Provisioning [6.756220853104791]
エッジリソースのサービスタスク配置とスケーリングの相互依存問題に対処する。
本稿では,ハイブリッド行動空間で動作する新しいDeep Reinforcement Learning (DRL) アプローチを提案する。
実世界のC-V2Nトラフィックデータセットを用いたシミュレーションによりDHPGの性能を評価する。
論文 参考訳(メタデータ) (2023-05-16T22:19:19Z) - LCS-TF: Multi-Agent Deep Reinforcement Learning-Based Intelligent
Lane-Change System for Improving Traffic Flow [16.34175752810212]
既存のインテリジェントレーン変更ソリューションは主に、エゴ車の性能を最適化することに焦点を当てている。
近年、マルチエージェント強化学習(MARL)に基づくアプローチへの関心が高まっている。
本稿では,エゴ車両の局部性能を両立させるために設計したAV用ハイブリッドMARLを用いたインテリジェントレーン交換システムを提案する。
論文 参考訳(メタデータ) (2023-03-16T04:03:17Z) - An ASP Framework for Efficient Urban Traffic Optimization [0.0]
本稿では,数百台の車両による大規模道路網における交通流を効率的にシミュレートし,最適化する枠組みを提案する。
このフレームワークは、Answer Set Programming (ASP)エンコーディングを利用して、ネットワーク内の車両の動きを正式に記述する。
これにより、ネットワーク内の車両の経路を最適化し、関連するメトリクスの幅を減らすことができる。
論文 参考訳(メタデータ) (2022-08-05T10:50:38Z) - AI-aided Traffic Control Scheme for M2M Communications in the Internet
of Vehicles [61.21359293642559]
交通のダイナミクスと異なるIoVアプリケーションの異種要求は、既存のほとんどの研究では考慮されていない。
本稿では,ハイブリッド交通制御方式とPPO法を併用して検討する。
論文 参考訳(メタデータ) (2022-03-05T10:54:05Z) - Decentralized Cooperative Lane Changing at Freeway Weaving Areas Using
Multi-Agent Deep Reinforcement Learning [1.6752182911522522]
マージやウィービングエリアなどの高速道路ボトルネックにおける渋滞時の車線変化は、さらに道路の容量を減少させる。
ディープ・リテンション・ラーニング(RL)とコネクテッド・アンド・オートマチック・カー・テクノロジーの出現は、協調車線変更による高速道路のボトルネックにおけるモビリティとエネルギー効率を改善するための解決策となる。
本研究では,多エージェント深部RLパラダイムを用いた分散協調車線切替制御器を開発した。
本研究では, 交通量, 車両速度, 車両当たりの停止数, 燃料効率, 排出エミッションの観点から, 多エージェント深部RLによる協調車線変更は, 運転者にとって優れた性能を示すことを示した。
論文 参考訳(メタデータ) (2021-10-05T18:29:13Z) - Value Function is All You Need: A Unified Learning Framework for Ride
Hailing Platforms [57.21078336887961]
DiDi、Uber、Lyftなどの大型配車プラットフォームは、都市内の数万台の車両を1日中数百万の乗車要求に接続している。
両課題に対処するための統合価値に基づく動的学習フレームワーク(V1D3)を提案する。
論文 参考訳(メタデータ) (2021-05-18T19:22:24Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。