論文の概要: A Hysteretic Q-learning Coordination Framework for Emerging Mobility
Systems in Smart Cities
- arxiv url: http://arxiv.org/abs/2011.03137v1
- Date: Thu, 5 Nov 2020 23:30:05 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-29 13:09:53.892194
- Title: A Hysteretic Q-learning Coordination Framework for Emerging Mobility
Systems in Smart Cities
- Title(参考訳): スマートシティにおける新しいモビリティシステムのためのヒステリックq学習コーディネーションフレームワーク
- Authors: Behdad Chalaki and Andreas A. Malikopoulos
- Abstract要約: 接続された自動車両(CAV)は交通渋滞や大気汚染を緩和し、安全性を向上させる。
本稿では,移動時間を最小限に抑え,燃料効率を向上させるために,信号のない交差点におけるCAVの分散コーディネートフレームワークを提案する。
- 参考スコア(独自算出の注目度): 3.563646182996609
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Connected and automated vehicles (CAVs) can alleviate traffic congestion, air
pollution, and improve safety. In this paper, we provide a decentralized
coordination framework for CAVs at a signal-free intersection to minimize
travel time and improve fuel efficiency. We employ a simple yet powerful
reinforcement learning approach, an off-policy temporal difference learning
called Q-learning, enhanced with a coordination mechanism to address this
problem. Then, we integrate a first-in-first-out queuing policy to improve the
performance of our system. We demonstrate the efficacy of our proposed approach
through simulation and comparison with the classical optimal control method
based on Pontryagin's minimum principle.
- Abstract(参考訳): 接続された自動車両(CAV)は交通渋滞や大気汚染を緩和し、安全性を向上させる。
本稿では,移動時間を最小限に抑え,燃料効率を向上させるために,信号のない交差点におけるCAVの分散コーディネートフレームワークを提案する。
我々は、シンプルかつ強力な強化学習アプローチ、q-learningと呼ばれるオフポリシーの時間的差異学習を採用し、この問題に対処するコーディネーションメカニズムを強化した。
そこで,本システムの性能向上のために,第1次キューイングポリシを統合した。
本稿では,ポントリャーギンの最小原理に基づく古典的最適制御法との比較とシミュレーションによる提案手法の有効性を示す。
関連論文リスト
- CoDriveVLM: VLM-Enhanced Urban Cooperative Dispatching and Motion Planning for Future Autonomous Mobility on Demand Systems [17.765742276150565]
CoDriveVLMは、将来の自律型モビリティ・オン・デマンド(AMoD)システムのために、高忠実な同時ディスパッチと協調動作計画を統合する新しいフレームワークである。
提案手法は,視覚言語モデル(VLM)を用いて多モード情報処理を強化し,包括的ディスパッチと衝突リスク評価を可能にする。
論文 参考訳(メタデータ) (2025-01-10T17:44:57Z) - Semantic Communication for Cooperative Perception using HARQ [51.148203799109304]
我々は重要セマンティック情報を抽出するために重要地図を活用し、協調的な知覚セマンティックコミュニケーションフレームワークを導入する。
周波数分割多重化(OFDM)とチャネル推定と等化戦略を併用して,時間変化によるマルチパスフェーディングによる課題に対処する。
我々は,ハイブリッド自動繰り返し要求(HARQ)の精神において,我々の意味コミュニケーションフレームワークと統合された新しい意味エラー検出手法を提案する。
論文 参考訳(メタデータ) (2024-08-29T08:53:26Z) - Modeling Adaptive Platoon and Reservation Based Autonomous Intersection
Control: A Deep Reinforcement Learning Approach [0.0]
本研究では, 深部強化学習(DRL)技術を利用した適応型小隊型自律交叉制御モデルを提案する。
交通マイクロシミュレータ上での試験では, 走行効率, 燃料保存性能が, 最先端の手法と比較して優れていた。
論文 参考訳(メタデータ) (2022-06-24T08:50:36Z) - Real-time Cooperative Vehicle Coordination at Unsignalized Road
Intersections [7.860567520771493]
信号のない道路交差点での協調作業は、連結車両と自動車両の安全運転交通スループットを向上させることを目的としている。
我々はモデルフリーなマルコフ決定プロセス(MDP)を導入し、深層強化学習フレームワークにおける双遅延Deep Deterministic Policy(TD3)に基づく戦略によりそれに取り組む。
提案手法は, 準定常調整シナリオにおいて, ほぼ最適性能を達成し, 現実的な連続流れの制御を大幅に改善できることが示唆された。
論文 参考訳(メタデータ) (2022-05-03T02:56:02Z) - Learning to Help Emergency Vehicles Arrive Faster: A Cooperative
Vehicle-Road Scheduling Approach [24.505687255063986]
車両中心のスケジューリングアプローチは、緊急車両の最適経路を推奨する。
道路中心のスケジューリングアプローチは、交通状況を改善し、EVが交差点を通過するための優先度を高めることを目的としている。
本稿では,リアルタイム経路計画モジュールと協調交通信号制御モジュールを含む協調型VehIcle-roaDスケジューリング手法であるLEVIDを提案する。
論文 参考訳(メタデータ) (2022-02-20T10:25:15Z) - Hybrid Reinforcement Learning-Based Eco-Driving Strategy for Connected
and Automated Vehicles at Signalized Intersections [3.401874022426856]
視覚知覚法は車間通信(V2I)と統合され、より高モビリティとエネルギー効率を実現する。
HRLフレームワークには3つのコンポーネントがある。ルールベースのドライビングマネージャで、ルールベースのポリシーとRLポリシーの協調を運用する。
実験により, HRL法によりエネルギー消費量を12.70%削減し, 11.75%の移動時間を省くことができた。
論文 参考訳(メタデータ) (2022-01-19T19:31:12Z) - Transferable Deep Reinforcement Learning Framework for Autonomous
Vehicles with Joint Radar-Data Communications [69.24726496448713]
本稿では,AVの最適決定を支援するために,マルコフ決定プロセス(MDP)に基づくインテリジェントな最適化フレームワークを提案する。
そこで我々は,近年の深層強化学習技術を活用した効果的な学習アルゴリズムを開発し,AVの最適方針を見出す。
提案手法は,従来の深部強化学習手法と比較して,AVによる障害物ミス検出確率を最大67%削減することを示す。
論文 参考訳(メタデータ) (2021-05-28T08:45:37Z) - End-to-End Intersection Handling using Multi-Agent Deep Reinforcement
Learning [63.56464608571663]
交差点をナビゲートすることは、自動運転車にとって大きな課題の1つです。
本研究では,交通標識のみが提供された交差点をナビゲート可能なシステムの実装に着目する。
本研究では,時間ステップ毎に加速度と操舵角を予測するためのニューラルネットワークの訓練に用いる,モデルフリーの連続学習アルゴリズムを用いたマルチエージェントシステムを提案する。
論文 参考訳(メタデータ) (2021-04-28T07:54:40Z) - Optimization-driven Deep Reinforcement Learning for Robust Beamforming
in IRS-assisted Wireless Communications [54.610318402371185]
Intelligent Reflecting Surface (IRS)は、マルチアンテナアクセスポイント(AP)から受信機へのダウンリンク情報伝達を支援する有望な技術である。
我々は、APのアクティブビームフォーミングとIRSのパッシブビームフォーミングを共同最適化することで、APの送信電力を最小化する。
過去の経験からビームフォーミング戦略に適応できる深層強化学習(DRL)手法を提案する。
論文 参考訳(メタデータ) (2020-05-25T01:42:55Z) - Decentralized MCTS via Learned Teammate Models [89.24858306636816]
本稿では,モンテカルロ木探索に基づくトレーニング可能なオンライン分散計画アルゴリズムを提案する。
深層学習と畳み込みニューラルネットワークを用いて正確なポリシー近似を作成可能であることを示す。
論文 参考訳(メタデータ) (2020-03-19T13:10:20Z) - Information Theoretic Model Predictive Q-Learning [64.74041985237105]
本稿では,情報理論的MPCとエントロピー正規化RLとの新たな理論的関連性を示す。
バイアスモデルを利用したQ-ラーニングアルゴリズムを開発した。
論文 参考訳(メタデータ) (2019-12-31T00:29:22Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。