論文の概要: Multi-Objective Reinforcement Learning for Large-Scale Mixed Traffic Control
- arxiv url: http://arxiv.org/abs/2512.11247v1
- Date: Fri, 12 Dec 2025 03:10:26 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-15 15:48:11.63813
- Title: Multi-Objective Reinforcement Learning for Large-Scale Mixed Traffic Control
- Title(参考訳): 大規模混在交通制御のための多目的強化学習
- Authors: Iftekharul Islam, Weizi Li,
- Abstract要約: 本稿では,多目的強化学習と局所的交差点制御,ネットワークレベルの協調のための戦略的ルーティングを組み合わせた階層型フレームワークを提案する。
提案手法では,競合回避のための明示的なリスクシグナルをエージェントに提供するConflict Threat Vectorを導入し,すべてのトラフィックストリームに対して公平なサービスを保証するキューパリティペナルティを実現する。
- 参考スコア(独自算出の注目度): 3.1133295867933057
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Effective mixed traffic control requires balancing efficiency, fairness, and safety. Existing approaches excel at optimizing efficiency and enforcing safety constraints but lack mechanisms to ensure equitable service, resulting in systematic starvation of vehicles on low-demand approaches. We propose a hierarchical framework combining multi-objective reinforcement learning for local intersection control with strategic routing for network-level coordination. Our approach introduces a Conflict Threat Vector that provides agents with explicit risk signals for proactive conflict avoidance, and a queue parity penalty that ensures equitable service across all traffic streams. Extensive experiments on a real-world network across different robot vehicle (RV) penetration rates demonstrate substantial improvements: up to 53% reductions in average wait time, up to 86% reductions in maximum starvation, and up to 86\% reduction in conflict rate compared to baselines, while maintaining fuel efficiency. Our analysis reveals that strategic routing effectiveness scales with RV penetration, becoming increasingly valuable at higher autonomy levels. The results demonstrate that multi-objective optimization through well-curated reward functions paired with strategic RV routing yields significant benefits in fairness and safety metrics critical for equitable mixed-autonomy deployment.
- Abstract(参考訳): 効果的な混合交通制御には、効率性、公正性、安全性のバランスが必要である。
既存のアプローチは、効率の最適化と安全性の制約の強化に優れているが、適切なサービスを確保するためのメカニズムが欠如しているため、低要求のアプローチによる車両のシステマティックな飢餓が生じる。
本稿では,多目的強化学習と局所的交差点制御,ネットワークレベルの協調のための戦略的ルーティングを組み合わせた階層型フレームワークを提案する。
提案手法では,競合回避のための明示的なリスクシグナルをエージェントに提供するConflict Threat Vectorを導入し,すべてのトラフィックストリームに対して公平なサービスを保証するキューパリティペナルティを実現する。
異なるロボット車両(RV)の侵入率の実際のネットワークに対する大規模な実験は、平均待ち時間の最大53%の削減、最大飢餓の最大86%の削減、ベースラインと比較して最大866%の競合率の削減、燃料効率の維持など、大幅に改善された。
我々の分析によると、戦略的ルーティングの有効性はRVの浸透とともにスケールし、より高い自律性レベルではますます価値が増している。
その結果,高度に計算された報酬関数と戦略的RVルーティングを組み合わせた多目的最適化は,公平性や安全性の指標において重要なメリットをもたらすことが示された。
関連論文リスト
- MAGNNET: Multi-Agent Graph Neural Network-based Efficient Task Allocation for Autonomous Vehicles with Deep Reinforcement Learning [2.5022287664959446]
本稿では,グラフニューラルネットワーク(GNN)を一元的トレーニングと分散実行(CTDE)パラダイムに統合する新しいフレームワークを提案する。
本手法により,無人航空機 (UAV) と無人地上車両 (UGV) は, 中央調整を必要とせず, 効率よくタスクを割り当てることができる。
論文 参考訳(メタデータ) (2025-02-04T13:29:56Z) - Auto-RT: Automatic Jailbreak Strategy Exploration for Red-Teaming Large Language Models [62.12822290276912]
Auto-RTは、複雑な攻撃戦略を探索し最適化する強化学習フレームワークである。
探索効率を大幅に改善し、攻撃戦略を自動的に最適化することにより、Auto-RTはボーダの脆弱性範囲を検出し、検出速度が速く、既存の方法と比較して16.63%高い成功率を達成する。
論文 参考訳(メタデータ) (2025-01-03T14:30:14Z) - Neighbor-Aware Reinforcement Learning for Mixed Traffic Optimization in Large-scale Networks [1.9413548770753521]
本稿では,交差する交差点を横断する混在トラフィックを調整するための強化学習フレームワークを提案する。
我々の重要な貢献は、RVがネットワーク間のバランスの取れた分散を維持することができる隣り合わせの報酬メカニズムである。
その結果,最先端の単一断面制御方式と比較して平均待ち時間を39.2%削減できることがわかった。
論文 参考訳(メタデータ) (2024-12-17T07:35:56Z) - Cluster-Based Multi-Agent Task Scheduling for Space-Air-Ground Integrated Networks [60.085771314013044]
低高度経済は、コミュニケーションやセンシングなどの分野で発展する大きな可能性を秘めている。
本稿では,SAGINにおけるマルチUAV協調タスクスケジューリング問題に対処するため,クラスタリングに基づく多エージェントDeep Deterministic Policy Gradient (CMADDPG)アルゴリズムを提案する。
論文 参考訳(メタデータ) (2024-12-14T06:17:33Z) - A Conflicts-free, Speed-lossless KAN-based Reinforcement Learning Decision System for Interactive Driving in Roundabouts [16.714573474722282]
本稿では,様々な交通状況における安全かつ効率的な運転を促進する学習に基づくアルゴリズムを提案する。
KAN(Kolmogorov-Arnold Network)は、AVの環境理解を改善する。
実験結果から,提案システムは最先端の手法よりも一貫して優れていることがわかった。
論文 参考訳(メタデータ) (2024-08-15T16:10:25Z) - iPLAN: Intent-Aware Planning in Heterogeneous Traffic via Distributed
Multi-Agent Reinforcement Learning [57.24340061741223]
本稿では,高密度および不均一な交通シナリオにおける軌跡や意図を予測できる分散マルチエージェント強化学習(MARL)アルゴリズムを提案する。
インテント対応プランニングのアプローチであるiPLANにより、エージェントは近くのドライバーの意図をローカルな観察からのみ推測できる。
論文 参考訳(メタデータ) (2023-06-09T20:12:02Z) - Unified Automatic Control of Vehicular Systems with Reinforcement
Learning [64.63619662693068]
本稿では,車載マイクロシミュレーションの合理化手法について述べる。
最小限の手動設計で高性能な制御戦略を発見する。
この研究は、波動緩和、交通信号、ランプ計測に類似した多くの創発的挙動を明らかにしている。
論文 参考訳(メタデータ) (2022-07-30T16:23:45Z) - Transferable Deep Reinforcement Learning Framework for Autonomous
Vehicles with Joint Radar-Data Communications [69.24726496448713]
本稿では,AVの最適決定を支援するために,マルコフ決定プロセス(MDP)に基づくインテリジェントな最適化フレームワークを提案する。
そこで我々は,近年の深層強化学習技術を活用した効果的な学習アルゴリズムを開発し,AVの最適方針を見出す。
提案手法は,従来の深部強化学習手法と比較して,AVによる障害物ミス検出確率を最大67%削減することを示す。
論文 参考訳(メタデータ) (2021-05-28T08:45:37Z) - Optimizing Mixed Autonomy Traffic Flow With Decentralized Autonomous
Vehicles and Multi-Agent RL [63.52264764099532]
本研究では、完全分散制御方式を用いて、混合自律環境でのボトルネックのスループットを向上させる自動運転車の能力について検討する。
この問題にマルチエージェント強化アルゴリズムを適用し、5%の浸透速度で20%から40%の浸透速度で33%までのボトルネックスループットの大幅な改善が達成できることを実証した。
論文 参考訳(メタデータ) (2020-10-30T22:06:05Z) - A Deep Multi-Agent Reinforcement Learning Approach to Autonomous
Separation Assurance [5.196149362684628]
可変数の航空機間の衝突を識別・解決するために, 深層多エージェント強化学習フレームワークを提案する。
提案手法は,BlueSkyの航空交通制御環境における3つのケーススタディで検証された。
論文 参考訳(メタデータ) (2020-03-17T16:50:34Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。