Fugu-MT 論文翻訳(概要): A Value Based Parallel Update MCTS Method for Multi-Agent Cooperative Decision Making of Connected and Automated Vehicles

論文の概要: A Value Based Parallel Update MCTS Method for Multi-Agent Cooperative Decision Making of Connected and Automated Vehicles

arxiv url: http://arxiv.org/abs/2409.13783v1
Date: Fri, 20 Sep 2024 03:13:01 GMT
ステータス: 翻訳完了
システム内更新日: 2024-11-07 05:13:17.369658
Title: A Value Based Parallel Update MCTS Method for Multi-Agent Cooperative Decision Making of Connected and Automated Vehicles
Title（参考訳）: 連系・自動車両の多エージェント協調決定のための値ベース並列更新MCTS法
Authors: Ye Han, Lijun Zhang, Dejian Meng, Xingyu Hu, Songyu Weng,
Abstract要約: 本稿では,マルチエージェント・マルコフゲームに対する並列更新によるモンテカルロ木探索(MCTS)手法を提案する。部分定常交通流における多車両共同動作空間の並列動作を解析することにより、並列更新法は潜在的危険な動作を迅速に排除することができる。
参考スコア（独自算出の注目度）: 9.840325772591024
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: To solve the problem of lateral and logitudinal joint decision-making of multi-vehicle cooperative driving for connected and automated vehicles (CAVs), this paper proposes a Monte Carlo tree search (MCTS) method with parallel update for multi-agent Markov game with limited horizon and time discounted setting. By analyzing the parallel actions in the multi-vehicle joint action space in the partial-steady-state traffic flow, the parallel update method can quickly exclude potential dangerous actions, thereby increasing the search depth without sacrificing the search breadth. The proposed method is tested in a large number of randomly generated traffic flow. The experiment results show that the algorithm has good robustness and better performance than the SOTA reinforcement learning algorithms and heuristic methods. The vehicle driving strategy using the proposed algorithm shows rationality beyond human drivers, and has advantages in traffic efficiency and safety in the coordinating zone.
Abstract（参考訳）: 本稿では,コネクテッド・オートマチック車両(CAV)用多車協調運転における横方向および対数方向の連成決定の問題を解決するために,マルチエージェント・マルコフゲームに対する並列更新によるモンテカルロ木探索(MCTS)法を提案する。部分定常交通流における多車両共同動作空間における並列動作を解析することにより、並列更新法は潜在的危険な動作を迅速に排除し、探索幅を犠牲にすることなく探索深度を増大させることができる。提案手法は,ランダムに発生する多数のトラフィックフローにおいて検証される。実験の結果,SOTA強化学習アルゴリズムやヒューリスティック手法よりも頑健さと性能がよいことがわかった。提案アルゴリズムを用いた車両運転戦略は,人間の運転者を超えた合理性を示し,コーディネートゾーンにおける交通効率と安全性の優位性を示す。

関連論文リスト

BIDA: A Bi-level Interaction Decision-making Algorithm for Autonomous Vehicles in Dynamic Traffic Scenarios [5.193590097161461]
対話型モンテカルロ木探索(MCTS)と深部強化学習(DRL)を統合した双方向インタラクション意思決定アルゴリズム(BIDA)を設計する。具体的には、3種類のDRLアルゴリズムを用いて、インタラクティブMCTSのオンライン推論プロセスをガイドする信頼性の高い価値ネットワークとポリシーネットワークを構築する。実験により, BIDAは対話型推論を向上し, 計算コストを低減させるだけでなく, 最新のベンチマークよりも優れていることが示された。
論文参考訳（メタデータ） (2025-06-19T19:03:40Z)
Reinforcement learning with combinatorial actions for coupled restless bandits [62.89013331120493]
提案するSEQUOIAは,動作空間に対する長期報酬を直接最適化するRLアルゴリズムである。我々は,複数介入,経路制約,二部間マッチング,容量制約という,制約を伴う4つの新しいレスレス・バンディット問題に対して,SEQUOIAを実証的に検証した。
論文参考訳（メタデータ） (2025-03-01T21:25:21Z)
A Differentiated Reward Method for Reinforcement Learning based Multi-Vehicle Cooperative Decision-Making Algorithms [11.53293198806926]
強化学習(Reinforcement Learning, RL)は, 状態-動作-回帰フィードバックループを通じて, 多車両協調運転戦略を最適化する大きな可能性を示す。本稿では、状態遷移勾配情報を報酬設計に組み込んだ定常遷移系に基づく微分報酬法を提案する。
論文参考訳（メタデータ） (2025-02-01T07:16:15Z)
Towards Interactive and Learnable Cooperative Driving Automation: a Large Language Model-Driven Decision-Making Framework [79.088116316919]
コネクテッド・オートモービルズ(CAV)は世界中の道路試験を開始したが、複雑なシナリオにおける安全性と効率性はまだ十分ではない。本稿では,対話型かつ学習可能なLLM駆動協調運転フレームワークCoDrivingLLMを提案する。
論文参考訳（メタデータ） (2024-09-19T14:36:00Z)
Multi-agent Path Finding for Cooperative Autonomous Driving [8.8305853192334]
我々は,既存のアルゴリズムを著しく上回る最適かつ完全なアルゴリズムであるオーダーベース検索をKinematics Arrival Time Scheduling (OBS-KATS) により考案した。当社の作業は、同じようなスケールのトラフィックや、有向車線を備えたマルチロボットシナリオに直接適用可能です。
論文参考訳（メタデータ） (2024-02-01T04:39:15Z)
Deep Reinforcement Learning for Autonomous Vehicle Intersection Navigation [0.24578723416255746]
強化学習アルゴリズムは、これらの課題に対処するための有望なアプローチとして登場した。そこで本研究では,低コスト単一エージェントアプローチを用いて,T断面積を効率よく安全にナビゲートする問題に対処する。提案手法により,AVはT断面積を効果的にナビゲートし,走行遅延,衝突最小化,総コストの面で従来の手法より優れていることがわかった。
論文参考訳（メタデータ） (2023-09-30T10:54:02Z)
Roulette-Wheel Selection-Based PSO Algorithm for Solving the Vehicle Routing Problem with Time Windows [58.891409372784516]
本稿では,Roulette Wheel Method (RWPSO) を用いた新しいPSO手法を提案する。 RWPSOのSolomon VRPTWベンチマークデータセットを用いた実験は、RWPSOが文学の他の最先端アルゴリズムと競合していることを示している。
論文参考訳（メタデータ） (2023-06-04T09:18:02Z)
Real-time Cooperative Vehicle Coordination at Unsignalized Road Intersections [7.860567520771493]
信号のない道路交差点での協調作業は、連結車両と自動車両の安全運転交通スループットを向上させることを目的としている。我々はモデルフリーなマルコフ決定プロセス(MDP)を導入し、深層強化学習フレームワークにおける双遅延Deep Deterministic Policy(TD3)に基づく戦略によりそれに取り組む。提案手法は, 準定常調整シナリオにおいて, ほぼ最適性能を達成し, 現実的な連続流れの制御を大幅に改善できることが示唆された。
論文参考訳（メタデータ） (2022-05-03T02:56:02Z)
End-to-End Intersection Handling using Multi-Agent Deep Reinforcement Learning [63.56464608571663]
交差点をナビゲートすることは、自動運転車にとって大きな課題の1つです。本研究では,交通標識のみが提供された交差点をナビゲート可能なシステムの実装に着目する。本研究では,時間ステップ毎に加速度と操舵角を予測するためのニューラルネットワークの訓練に用いる,モデルフリーの連続学習アルゴリズムを用いたマルチエージェントシステムを提案する。
論文参考訳（メタデータ） (2021-04-28T07:54:40Z)
Multi-Modal Fusion Transformer for End-to-End Autonomous Driving [59.60483620730437]
画像表現とLiDAR表現を注目で統合する,新しいマルチモードフュージョントランスフォーマであるTransFuserを提案する。本手法は, 衝突を76%低減しつつ, 最先端駆動性能を実現する。
論文参考訳（メタデータ） (2021-04-19T11:48:13Z)
Real-world Ride-hailing Vehicle Repositioning using Deep Reinforcement Learning [52.2663102239029]
アイドルヘイリングプラットフォーム上での現実世界の車両の深層強化学習と意思決定時間計画に基づく新しい実用的枠組みを提示する。本手法は,重み付きバッチ学習アルゴリズムを用いて乗車時の状態値関数を学習する。配車シミュレーション環境におけるベースラインでアルゴリズムをベンチマークし、収益効率の向上における優位性を実証します。
論文参考訳（メタデータ） (2021-03-08T05:34:05Z)
A Multi-intersection Vehicular Cooperative Control based on End-Edge-Cloud Computing [25.05518638792962]
複数の交差点を有する広いエリアにおける車両間の協調を可能にするために,多断面車両協調制御(MiVeCC)を提案する。まず、車両間のエッジクラウド垂直協調と水平協調を容易にするために、車両用エンドエッジクラウドコンピューティングフレームワークを提案する。高密度トラフィックに対処するため, 車両選択法を提案し, 性能劣化を伴わずに, 状態空間を小さくし, アルゴリズムの収束を加速する。
論文参考訳（メタデータ） (2020-12-01T14:15:14Z)
An End-to-end Deep Reinforcement Learning Approach for the Long-term Short-term Planning on the Frenet Space [0.0]
本稿では,自動運転車の意思決定と動作計画に向けた,エンドツーエンドの継続的強化学習手法を提案する。初めて、Frenet空間上の状態と行動空間の両方を定義して、走行挙動を道路曲率に変化させないようにする。このアルゴリズムは、フィードバックコントローラが追跡するFrenetフレーム上で連続時間軌道を生成する。
論文参考訳（メタデータ） (2020-11-26T02:40:07Z)
Reinforcement Learning Based Vehicle-cell Association Algorithm for Highly Mobile Millimeter Wave Communication [53.47785498477648]
本稿では,ミリ波通信網における車とセルの関連性について検討する。まず、ユーザ状態(VU)問題を離散的な非車両関連最適化問題として定式化する。提案手法は,複数のベースライン設計と比較して,ユーザの複雑性とVUEの20%削減の合計で最大15%のゲインが得られる。
論文参考訳（メタデータ） (2020-01-22T08:51:05Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。