論文の概要: Multi-Agent Soft Actor-Critic with Global Loss for Autonomous Mobility-on-Demand Fleet Control
- arxiv url: http://arxiv.org/abs/2404.06975v1
- Date: Wed, 10 Apr 2024 13:49:20 GMT
- ステータス: 処理完了
- システム内更新日: 2024-04-11 14:31:03.009244
- Title: Multi-Agent Soft Actor-Critic with Global Loss for Autonomous Mobility-on-Demand Fleet Control
- Title(参考訳): 自律移動型艦隊制御のための大域的損失を考慮したマルチエージェントソフトアクタ臨界
- Authors: Zeno Woywood, Jasper I. Wiltfang, Julius Luy, Tobias Enders, Maximilian Schiffer,
- Abstract要約: 自律型モビリティ・オン・デマンドシステムの利益を最大化する演算子に対する逐次決定問題について検討する。
重み付きバイパルタイトマッチングと組み合わせたマルチエージェントソフトアクター・クライブアルゴリズムを用いる。
このアプローチは、ディスパッチで最大12.9%、統合された再バランシングで最大38.9%、最先端のベンチマークよりも優れています。
- 参考スコア(独自算出の注目度): 1.9503475832401784
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We study a sequential decision-making problem for a profit-maximizing operator of an Autonomous Mobility-on-Demand system. Optimizing a central operator's vehicle-to-request dispatching policy requires efficient and effective fleet control strategies. To this end, we employ a multi-agent Soft Actor-Critic algorithm combined with weighted bipartite matching. We propose a novel vehicle-based algorithm architecture and adapt the critic's loss function to appropriately consider global actions. Furthermore, we extend our algorithm to incorporate rebalancing capabilities. Through numerical experiments, we show that our approach outperforms state-of-the-art benchmarks by up to 12.9% for dispatching and up to 38.9% with integrated rebalancing.
- Abstract(参考訳): 自律型モビリティ・オン・デマンドシステムの利益を最大化する演算子に対する逐次決定問題について検討する。
中央オペレーターの車両要求派遣ポリシーを最適化するには、効率的かつ効果的な艦隊統制戦略が必要である。
この目的のために、重み付き二分法マッチングと組み合わせたマルチエージェントのソフトアクター・クライブアルゴリズムを用いる。
本稿では,車両に基づく新しいアルゴリズムアーキテクチャを提案し,批判者の損失関数を適用して,グローバルなアクションを適切に検討する。
さらに、リバランシング機能を組み込むためにアルゴリズムを拡張します。
数値実験により、我々の手法は、ディスパッチで最大12.9%、統合された再バランシングで最大38.9%、最先端のベンチマークより優れていることを示す。
関連論文リスト
- Sample-Efficient Multi-Agent RL: An Optimization Perspective [103.35353196535544]
一般関数近似に基づく汎用マルコフゲーム(MG)のためのマルチエージェント強化学習(MARL)について検討した。
汎用MGに対するマルチエージェントデカップリング係数(MADC)と呼ばれる新しい複雑性尺度を導入する。
我々のアルゴリズムは既存の研究に匹敵するサブリニアな後悔を与えることを示す。
論文 参考訳(メタデータ) (2023-10-10T01:39:04Z) - Cooperative Multi-Objective Reinforcement Learning for Traffic Signal
Control and Carbon Emission Reduction [3.3454373538792552]
本稿では,多目的多元的深層決定主義政策グラディエントという協調型多目的アーキテクチャを提案する。
MOMA-DDPGは、年齢遅延重みを用いた信号制御最適化のための複数の報酬項を推定する。
以上の結果から,MOMA-DDPGの有効性が示された。
論文 参考訳(メタデータ) (2023-06-16T07:37:05Z) - Local Optimization Achieves Global Optimality in Multi-Agent
Reinforcement Learning [139.53668999720605]
本稿では,各エージェントのローカルポリシーをバニラPPOと同様に更新するマルチエージェントPPOアルゴリズムを提案する。
マルコフゲームにおける標準正則条件と問題依存量により、我々のアルゴリズムはサブリニアレートで大域的最適ポリシーに収束することを示す。
論文 参考訳(メタデータ) (2023-05-08T16:20:03Z) - Learning-based Online Optimization for Autonomous Mobility-on-Demand
Fleet Control [8.020856741504794]
自律移動オンデマンドシステムのためのオンライン制御アルゴリズムについて検討する。
我々は、オンラインディスパッチとリバランスポリシーを学習する、新しいハイブリッド強化機械学習パイプラインを開発した。
提案手法は,最先端の欲求とモデル予測制御のアプローチより優れていることを示す。
論文 参考訳(メタデータ) (2023-02-08T09:40:30Z) - Hybrid Multi-agent Deep Reinforcement Learning for Autonomous Mobility
on Demand Systems [31.23491481430466]
本稿では,自律型モビリティ・オン・デマンドシステムの利益を最大化する運用者に対して,積極的要求の割当と拒否決定を行うというシーケンシャルな意思決定問題を考察する。
我々はマルコフ決定過程としてこの問題を定式化し、予測制御ポリシを得るために、マルチエージェントのソフトアクター・クリティカルと重み付きバイパートイトマッチングを組み合わせた新しい組み合わせを提案する。
論文 参考訳(メタデータ) (2022-12-14T16:19:51Z) - DC-MRTA: Decentralized Multi-Robot Task Allocation and Navigation in
Complex Environments [55.204450019073036]
本稿では,倉庫環境における移動ロボットのためのタスク割り当てと分散ナビゲーションアルゴリズムを提案する。
本稿では,共同分散タスク割り当てとナビゲーションの問題について考察し,それを解決するための2段階のアプローチを提案する。
ロボットの衝突のない軌道の計算では,タスク完了時間において最大14%の改善と最大40%の改善が観察される。
論文 参考訳(メタデータ) (2022-09-07T00:35:27Z) - Evolving Pareto-Optimal Actor-Critic Algorithms for Generalizability and
Stability [67.8426046908398]
汎用性と安定性は,実世界における強化学習(RL)エージェントの運用において重要な2つの目的である。
本稿では,アクター・クリティック・ロス関数の自動設計法であるMetaPGを提案する。
論文 参考訳(メタデータ) (2022-04-08T20:46:16Z) - Combining Reinforcement Learning with Model Predictive Control for
On-Ramp Merging [10.480121529429631]
自律運転における運動計画問題の解法として,モデル予測制御(MPC)と強化学習(RL)の2つの幅広い手法が提案されている。
まず、シミュレーションにより最先端のMPCとRLベースの技術の長所と短所を確立する。
その後、モデルフリーなRLエージェントとMPCソリューションをブレンドして、乗客の快適性、効率性、衝突速度、堅牢性といったすべての指標間のトレードオフを改善できることを示すアルゴリズムを提案する。
論文 参考訳(メタデータ) (2020-11-17T07:42:11Z) - Optimizing Mixed Autonomy Traffic Flow With Decentralized Autonomous
Vehicles and Multi-Agent RL [63.52264764099532]
本研究では、完全分散制御方式を用いて、混合自律環境でのボトルネックのスループットを向上させる自動運転車の能力について検討する。
この問題にマルチエージェント強化アルゴリズムを適用し、5%の浸透速度で20%から40%の浸透速度で33%までのボトルネックスループットの大幅な改善が達成できることを実証した。
論文 参考訳(メタデータ) (2020-10-30T22:06:05Z) - Reinforcement Learning Based Vehicle-cell Association Algorithm for
Highly Mobile Millimeter Wave Communication [53.47785498477648]
本稿では,ミリ波通信網における車とセルの関連性について検討する。
まず、ユーザ状態(VU)問題を離散的な非車両関連最適化問題として定式化する。
提案手法は,複数のベースライン設計と比較して,ユーザの複雑性とVUEの20%削減の合計で最大15%のゲインが得られる。
論文 参考訳(メタデータ) (2020-01-22T08:51:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。