Fugu-MT 論文翻訳(概要): Robust Dynamic Bus Control: A Distributional Multi-agent Reinforcement Learning Approach

論文の概要: Robust Dynamic Bus Control: A Distributional Multi-agent Reinforcement Learning Approach

arxiv url: http://arxiv.org/abs/2111.01946v1
Date: Tue, 2 Nov 2021 23:41:09 GMT
ステータス: 翻訳完了
システム内更新日: 2021-11-04 13:44:12.660456
Title: Robust Dynamic Bus Control: A Distributional Multi-agent Reinforcement Learning Approach
Title（参考訳）: ロバスト動的バス制御:分散マルチエージェント強化学習アプローチ
Authors: Jiawei Wang, Lijun Sun
Abstract要約: バスの束縛は、バスシステムの効率性と信頼性を損なう一般的な現象である。我々は,連続制御学習のための分散MARLフレームワーク,IQNC-Mを開発した。提案するIQNC-Mフレームワークは,様々な極端な事象を効果的に処理できることを示す。
参考スコア（独自算出の注目度）: 11.168121941015013
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Bus system is a critical component of sustainable urban transportation. However, the operation of a bus fleet is unstable in nature, and bus bunching has become a common phenomenon that undermines the efficiency and reliability of bus systems. Recently research has demonstrated the promising application of multi-agent reinforcement learning (MARL) to achieve efficient vehicle holding control to avoid bus bunching. However, existing studies essentially overlook the robustness issue resulting from various events, perturbations and anomalies in a transit system, which is of utmost importance when transferring the models for real-world deployment/application. In this study, we integrate implicit quantile network and meta-learning to develop a distributional MARL framework -- IQNC-M -- to learn continuous control. The proposed IQNC-M framework achieves efficient and reliable control decisions through better handling various uncertainties/events in real-time transit operations. Specifically, we introduce an interpretable meta-learning module to incorporate global information into the distributional MARL framework, which is an effective solution to circumvent the credit assignment issue in the transit system. In addition, we design a specific learning procedure to train each agent within the framework to pursue a robust control policy. We develop simulation environments based on real-world bus services and passenger demand data and evaluate the proposed framework against both traditional holding control models and state-of-the-art MARL models. Our results show that the proposed IQNC-M framework can effectively handle the various extreme events, such as traffic state perturbations, service interruptions, and demand surges, thus improving both efficiency and reliability of the system.
Abstract（参考訳）: バスシステムは持続可能な都市交通の重要な要素である。しかし、バス車両の運用は本質的に不安定であり、バス輸送はバスシステムの効率と信頼性を損なう一般的な現象となっている。近年,マルチエージェント強化学習(MARL)による効率的な車両保持制御を実現し,バスの群れ回避を図っている。しかしながら、既存の研究では、トランジットシステムにおけるさまざまなイベント、摂動、異常に起因する堅牢性の問題を見落としている。本研究では,暗黙の質的ネットワークとメタラーニングを統合し,分布型marlフレームワーク iqnc-m を開発し,連続制御を学習する。提案するiqnc-mフレームワークは、リアルタイムトランジット操作における様々な不確実性/事象の処理を改善することにより、効率的で信頼性の高い制御決定を実現する。具体的には,グローバル情報を分散marlフレームワークに組み込むための解釈可能なメタラーニングモジュールを提案する。さらに,フレームワーク内の各エージェントを訓練し,堅牢な制御ポリシーを追求する,特定の学習手順を設計する。実世界のバスサービスと乗客需要データに基づくシミュレーション環境を構築し、従来の保持制御モデルと最先端のmarlモデルの両方に対して提案手法を評価する。提案するIQNC-Mフレームワークは,交通状態の摂動,サービス中断,需要急増といった極端な事象を効果的に処理し,システムの効率性と信頼性を向上できることを示す。

関連論文リスト

CoT-VLM4Tar: Chain-of-Thought Guided Vision-Language Models for Traffic Anomaly Resolution [14.703196966156288]
CoT-VLM4Tar:(交通異常解消のための思考視覚言語モデルの構造) 本稿では,より合理的かつ効果的に交通異常を解析し,推論し,解決する上で,VLMを導くための新たなチェーン・オブ・思想を提案する。本結果は,VLMがリアルタイム交通異常の解消に有効であることを示し,自律的な交通管理システムへの統合の実証となる。
論文参考訳（メタデータ） (2025-03-03T15:07:25Z)
SafeAuto: Knowledge-Enhanced Safe Autonomous Driving with Multimodal Foundation Models [63.71984266104757]
MLLM(Multimodal Large Language Models)は、視覚データとテキストデータの両方を処理する。構造化されていない知識と構造化されていない知識の両方を取り入れることでMLLMベースの自動運転システムを強化する新しいフレームワークであるSafeAutoを提案する。
論文参考訳（メタデータ） (2025-02-28T21:53:47Z)
TeLL-Drive: Enhancing Autonomous Driving with Teacher LLM-Guided Deep Reinforcement Learning [61.33599727106222]
TeLL-Driveは、Teacher LLMを統合して、注意に基づく学生DRLポリシーをガイドするハイブリッドフレームワークである。自己維持機構はDRLエージェントの探索とこれらの戦略を融合させ、政策収束を加速し、堅牢性を高める。
論文参考訳（メタデータ） (2025-02-03T14:22:03Z)
CoDriveVLM: VLM-Enhanced Urban Cooperative Dispatching and Motion Planning for Future Autonomous Mobility on Demand Systems [17.765742276150565]
CoDriveVLMは、将来の自律型モビリティ・オン・デマンド(AMoD)システムのために、高忠実な同時ディスパッチと協調動作計画を統合する新しいフレームワークである。提案手法は,視覚言語モデル(VLM)を用いて多モード情報処理を強化し,包括的ディスパッチと衝突リスク評価を可能にする。
論文参考訳（メタデータ） (2025-01-10T17:44:57Z)
MetaTrading: An Immersion-Aware Model Trading Framework for Vehicular Metaverse Services [94.61039892220037]
本稿では,車載メタバースにおける拡張現実(AR)サービスの学習モデルを支援するために,メタバースユーザ(MU)にインセンティブを与える新しい没入型モデルトレーディングフレームワークを提案する。動的ネットワーク条件とプライバシの懸念を考慮して、マルチエージェントマルコフ決定プロセスとしてMSPの報酬決定を定式化する。実験により,提案フレームワークは,実AR関連車両データセット上でのARサービスにおいて,オブジェクト検出と分類のための高価値モデルを効果的に提供できることが示されている。
論文参考訳（メタデータ） (2024-10-25T16:20:46Z)
Agent-Agnostic Centralized Training for Decentralized Multi-Agent Cooperative Driving [17.659812774579756]
本研究では,自律走行車における分散型協調運転ポリシーを学習する非対称アクター・批判モデルを提案する。マスキングを用いたアテンションニューラルネットワークを用いることで,実世界の交通動態と部分観測可能性の効率よく管理できる。
論文参考訳（メタデータ） (2024-03-18T16:13:02Z)
LLM-Assisted Light: Leveraging Large Language Model Capabilities for Human-Mimetic Traffic Signal Control in Complex Urban Environments [3.7788636451616697]
本研究は,大規模言語モデルを交通信号制御システムに統合する革新的なアプローチを導入する。 LLMを知覚と意思決定ツールのスイートで強化するハイブリッドフレームワークが提案されている。シミュレーションの結果から,交通環境の多種性に適応するシステムの有効性が示された。
論文参考訳（メタデータ） (2024-03-13T08:41:55Z)
MTR++: Multi-Agent Motion Prediction with Symmetric Scene Modeling and Guided Intention Querying [110.83590008788745]
自律運転システムにとって、複雑な運転シナリオを理解し、情報的な決定を下すためには、動きの予測が不可欠である。本稿では,これらの課題に対処するためのMotion TRansformer (MTR) フレームワークを提案する。最初のMTRフレームワークは、学習可能な意図クエリを備えたトランスフォーマーエンコーダ-デコーダ構造を利用する。複数のエージェントに対するマルチモーダル動作を同時に予測するMTR++フレームワークを導入する。
論文参考訳（メタデータ） (2023-06-30T16:23:04Z)
Model-Based Reinforcement Learning with Isolated Imaginations [61.67183143982074]
モデルに基づく強化学習手法であるIso-Dream++を提案する。我々は、切り離された潜在的想像力に基づいて政策最適化を行う。これにより、野生の混合力学源を孤立させることで、長い水平振動子制御タスクの恩恵を受けることができる。
論文参考訳（メタデータ） (2023-03-27T02:55:56Z)
MMRNet: Improving Reliability for Multimodal Object Detection and Segmentation for Bin Picking via Multimodal Redundancy [68.7563053122698]
マルチモーダル冗長性(MMRNet)を用いた信頼度の高いオブジェクト検出・分割システムを提案する。これは、マルチモーダル冗長の概念を導入し、デプロイ中のセンサ障害問題に対処する最初のシステムである。システム全体の出力信頼性と不確実性を測定するために,すべてのモダリティからの出力を利用する新しいラベルフリーマルチモーダル整合性(MC)スコアを提案する。
論文参考訳（メタデータ） (2022-10-19T19:15:07Z)
Isolating and Leveraging Controllable and Noncontrollable Visual Dynamics in World Models [65.97707691164558]
Iso-DreamはDream-to-Controlフレームワークを2つの側面で改善する。まず、逆動力学を最適化することにより、世界モデルに制御可能で制御不能な情報源を学習させることを奨励する。第2に、エージェントの挙動を世界モデルの切り離された潜在的想像力に最適化する。
論文参考訳（メタデータ） (2022-05-27T08:07:39Z)
UMBRELLA: Uncertainty-Aware Model-Based Offline Reinforcement Learning Leveraging Planning [1.1339580074756188]
オフライン強化学習(RL)は、オフラインデータから意思決定を学ぶためのフレームワークを提供する。自動運転車(SDV)は、おそらく準最適データセットの振る舞いよりも優れるポリシーを学ぶ。これはモデルベースのオフラインRLアプローチの使用を動機付け、プランニングを活用する。
論文参考訳（メタデータ） (2021-11-22T10:37:52Z)
A Modular and Transferable Reinforcement Learning Framework for the Fleet Rebalancing Problem [2.299872239734834]
モデルフリー強化学習(RL)に基づく艦隊再バランスのためのモジュラーフレームワークを提案する。動作領域のグリッド上の分布としてRL状態とアクション空間を定式化し,フレームワークをスケーラブルにする。実世界の旅行データとネットワークデータを用いた数値実験は、このアプローチがベースライン法よりもいくつかの異なる利点があることを実証している。
論文参考訳（メタデータ） (2021-05-27T16:32:28Z)
Reducing Bus Bunching with Asynchronous Multi-Agent Reinforcement Learning [11.168121941015013]
バスフラッキングは、バスサービスの信頼性と効率を損なう一般的な現象である。経路レベルのバスフリート制御を非同期マルチエージェント強化学習問題として定式化する。古典的なアクタークリティカルアーキテクチャを拡張して、非同期問題を扱う。
論文参考訳（メタデータ） (2021-05-02T02:08:07Z)
MetaVIM: Meta Variationally Intrinsic Motivated Reinforcement Learning for Decentralized Traffic Signal Control [54.162449208797334]
交通信号制御は、交差点を横断する交通信号を調整し、地域や都市の交通効率を向上させることを目的としている。近年,交通信号制御に深部強化学習(RL)を適用し,各信号がエージェントとみなされる有望な性能を示した。本稿では,近隣情報を考慮した各交差点の分散化政策を潜時的に学習するメタ変動固有モチベーション(MetaVIM)RL法を提案する。
論文参考訳（メタデータ） (2021-01-04T03:06:08Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。