論文の概要: From Single Agent to Multi-Agent: Improving Traffic Signal Control
- arxiv url: http://arxiv.org/abs/2406.13693v1
- Date: Wed, 19 Jun 2024 16:46:15 GMT
- ステータス: 処理完了
- システム内更新日: 2024-06-21 18:54:50.814898
- Title: From Single Agent to Multi-Agent: Improving Traffic Signal Control
- Title(参考訳): シングルエージェントからマルチエージェントへ:交通信号制御の改善
- Authors: Maksim Tislenko, Dmitrii Kisilev,
- Abstract要約: 本稿では,様々な既存手法を解析し,平均走行時間を短縮するエージェント数を増やすための選択肢を提案する。
その結果、場合によっては、複数のエージェントの実装によって既存のメソッドが改善されることが示されている。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Due to accelerating urbanization, the importance of solving the signal control problem increases. This paper analyzes various existing methods and suggests options for increasing the number of agents to reduce the average travel time. Experiments were carried out with 2 datasets. The results show that in some cases, the implementation of multiple agents can improve existing methods. For a fine-tuned large language model approach there is small enhancement on all metrics.
- Abstract(参考訳): 都市化の加速により,信号制御問題の解決の重要性が高まっている。
本稿では,様々な既存手法を解析し,平均走行時間を短縮するエージェント数を増やすための選択肢を提案する。
2つのデータセットで実験を行った。
その結果、場合によっては、複数のエージェントの実装によって既存のメソッドが改善されることが示されている。
微調整された大きな言語モデルアプローチでは、すべてのメトリクスに小さな拡張があります。
関連論文リスト
- Textualized Agent-Style Reasoning for Complex Tasks by Multiple Round LLM Generation [49.27250832754313]
我々は、llmベースの自律エージェントフレームワークであるAgentCOTを紹介する。
それぞれのステップで、AgentCOTはアクションを選択し、それを実行して、証拠を裏付ける中間結果を得る。
エージェントCOTの性能を高めるための2つの新しい戦略を導入する。
論文 参考訳(メタデータ) (2024-09-19T02:20:06Z) - Multi-agent transformer-accelerated RL for satisfaction of STL specifications [45.451687009627165]
時間依存型マルチエージェント変換器を提案し,時間依存型マルチエージェント問題を効率的に解く。
我々は統計学のツールを用いて、ポリシーの下で生成された軌道がタスクを満足する確率を検証する。
両事例において,本手法は文献ベースラインアルゴリズムよりも優れた性能を示した。
論文 参考訳(メタデータ) (2024-03-23T19:13:01Z) - Agent-FLAN: Designing Data and Methods of Effective Agent Tuning for Large Language Models [56.00992369295851]
オープンソースのLarge Language Models(LLM)は、さまざまなNLPタスクで大きな成功を収めていますが、エージェントとして振る舞う場合、それでもAPIベースのモデルよりもはるかに劣っています。
本稿では,(1) エージェント学習コーパスを,(1) エージェント学習データの分布から大きくシフトするエージェント推論と,(2) エージェントタスクが必要とする能力に異なる学習速度を示すエージェント学習コーパスと,(3) 幻覚を導入することでエージェント能力を改善する際の副作用について述べる。
本稿では,エージェントのためのFLANモデルを効果的に構築するためのエージェントFLANを提案する。
論文 参考訳(メタデータ) (2024-03-19T16:26:10Z) - Latent Interactive A2C for Improved RL in Open Many-Agent Systems [12.41853254173419]
対話的アドバンテージアクター批評家(IA2C)は、分散トレーニングと分散実行に従事している。
本稿では,エンコーダ・デコーダアーキテクチャを用いて隠れ状態と他のエージェントの動作の潜在表現を学習する潜時IA2Cを提案する。
2つのドメイン(それぞれ多くのエージェントが居住している)における実験により、潜伏型IA2Cは分散を低減し、より速く収束することにより、試料効率を著しく向上することが明らかとなった。
論文 参考訳(メタデータ) (2023-05-09T04:03:40Z) - Cooperative Reinforcement Learning on Traffic Signal Control [3.759936323189418]
交通信号の制御は、道路交差点での車両の移動を調整することで、全体の走行時間を最小化することを目的とした、現実的な課題である。
既存の信号制御システムは、過度に単純化された情報とルールベースの方法に大きく依存している。
本稿では,交通信号制御最適化のための複数の報酬項をより正確に推定するために,年齢遅延重み付き協調型多目的アーキテクチャを提案する。
論文 参考訳(メタデータ) (2022-05-23T13:25:15Z) - Retrieval-Augmented Reinforcement Learning [63.32076191982944]
過去の経験のデータセットを最適な行動にマップするために、ネットワークをトレーニングします。
検索プロセスは、現在のコンテキストで有用なデータセットから情報を取得するために訓練される。
検索強化R2D2はベースラインR2D2エージェントよりもかなり高速に学習し,より高いスコアを得ることを示す。
論文 参考訳(メタデータ) (2022-02-17T02:44:05Z) - Explaining Reinforcement Learning Policies through Counterfactual
Trajectories [147.7246109100945]
人間の開発者は、RLエージェントがテスト時にうまく機能することを検証しなければならない。
本手法では, エージェントの挙動をより広い軌道分布で示すことにより, エージェントの挙動を分布変化下で表現する。
本研究では,2つのエージェント検証タスクのうちの1つに対して,ベースライン法よりも優れたスコアを得られることを示す。
論文 参考訳(メタデータ) (2022-01-29T00:52:37Z) - Effects of Smart Traffic Signal Control on Air Quality [0.0]
マルチエージェント深部強化学習(MARL)は交通システムにおいて実験的に研究されている。
MA2Cと呼ばれる、確立されたアドバンテージアクター・クリティカル(A2C)アルゴリズムのマルチエージェント版が最近開発され、エージェント間の通信の有望なアイデアを活用している。
この観点から、エージェントは他のエージェントと戦略を共有し、エージェントの数や多様性が増大しても学習プロセスを安定化させる。
論文 参考訳(メタデータ) (2021-07-06T02:48:42Z) - SA-MATD3:Self-attention-based multi-agent continuous control method in
cooperative environments [12.959163198988536]
既存のアルゴリズムは、エージェントの数が増加するにつれて、不均一な学習度の問題に悩まされる。
マルチエージェントアクター批評家のための新しい構造を提案し,批評家ネットワークに自己注意機構を適用した。
提案アルゴリズムは、リプレイメモリバッファ内のサンプルをフル活用して、エージェントのクラスの振る舞いを学習する。
論文 参考訳(メタデータ) (2021-07-01T08:15:05Z) - Optimizing Mixed Autonomy Traffic Flow With Decentralized Autonomous
Vehicles and Multi-Agent RL [63.52264764099532]
本研究では、完全分散制御方式を用いて、混合自律環境でのボトルネックのスループットを向上させる自動運転車の能力について検討する。
この問題にマルチエージェント強化アルゴリズムを適用し、5%の浸透速度で20%から40%の浸透速度で33%までのボトルネックスループットの大幅な改善が達成できることを実証した。
論文 参考訳(メタデータ) (2020-10-30T22:06:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。