論文の概要: Macroscopic Characteristics of Mixed Traffic Flow with Deep Reinforcement Learning Based Automated and Human-Driven Vehicles
- arxiv url: http://arxiv.org/abs/2603.25328v1
- Date: Thu, 26 Mar 2026 11:14:20 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-27 20:52:48.260058
- Title: Macroscopic Characteristics of Mixed Traffic Flow with Deep Reinforcement Learning Based Automated and Human-Driven Vehicles
- Title(参考訳): 深部強化学習と人力自動車を併用した混合交通流のマクロ特性
- Authors: Pankaj Kumar, Pranamesh Chakraborty, Subrahmanya Swamy Peruru,
- Abstract要約: 本研究は,混合交通におけるDRLモデルにおけるマクロな交通流特性と燃料効率の解析に焦点をあてる。
ツイン遅延Deep Deterministic Policy Gradient (TD3)アルゴリズムは、AVの制御のために実装され、NGSIMハイウェイデータセットを使用して訓練される。
その結果,交通性能は安全時間ギャップの分布やRL車両の割合に敏感であることがわかった。
- 参考スコア(独自算出の注目度): 2.7245836197421673
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Automated Vehicle (AV) control in mixed traffic, where AVs coexist with human-driven vehicles, poses significant challenges in balancing safety, efficiency, comfort, fuel efficiency, and compliance with traffic rules while capturing heterogeneous driver behavior. Traditional car-following models, such as the Intelligent Driver Model (IDM), often struggle to generalize across diverse traffic scenarios and typically do not account for fuel efficiency, motivating the use of learning-based approaches. Although Deep Reinforcement Learning (DRL) has shown strong microscopic performance in car-following conditions, its macroscopic traffic flow characteristics remain underexplored. This study focuses on analyzing the macroscopic traffic flow characteristics and fuel efficiency of DRL-based models in mixed traffic. A Twin Delayed Deep Deterministic Policy Gradient (TD3) algorithm is implemented for AVs' control and trained using the NGSIM highway dataset, enabling realistic interaction with human-driven vehicles. Traffic performance is evaluated using the Fundamental Diagram (FD) under varying driver heterogeneity, heterogeneous time-gap penetration levels, and different shares of RL-controlled vehicles. A macroscopic level comparison of fuel efficiency between the RL-based AV model and the IDM is also conducted. Results show that traffic performance is sensitive to the distribution of safe time gaps and the proportion of RL vehicles. Transitioning from fully human-driven to fully RL-controlled traffic can increase road capacity by approximately 7.52%. Further, RL-based AVs also improve average fuel efficiency by about 28.98% at higher speeds (above 50 km/h), and by 1.86% at lower speeds (below 50 km/h) compared to the IDM. Overall, the DRL framework enhances traffic capacity and fuel efficiency without compromising safety.
- Abstract(参考訳): AVが人間の運転する車両と共存する混合交通における自動車両(AV)制御は、安全、効率、快適性、燃料効率、交通規則の遵守のバランスをとる上で大きな課題となる。
Intelligent Driver Model (IDM)のような従来の自動車追従モデルは、様々な交通シナリオにまたがる一般化に苦しむことが多く、通常は燃料効率を考慮せず、学習ベースのアプローチの使用を動機付けている。
深部強化学習 (DRL) は, 自動車追従条件下では強い微視的性能を示したが, そのマクロな交通流特性は未解明のままである。
本研究は,混合交通におけるDRLモデルにおけるマクロな交通流特性と燃料効率の解析に焦点をあてる。
ツイン遅延Deep Deterministic Policy Gradient (TD3)アルゴリズムは、AVの制御のために実装され、NGSIMハイウェイデータセットを使用してトレーニングされた。
運転者の異種性、異種時間ギャップ浸透レベル、RL制御車両の異種シェアに基づく基本図(FD)による交通性能の評価を行った。
また, RL-based AVモデルとIMMの燃料効率のマクロレベル比較を行った。
その結果,交通性能は安全時間ギャップの分布やRL車両の割合に敏感であることがわかった。
完全に人間主導の交通から完全にRL制御の交通への移行は、道路の容量を約7.52%増加させる。
さらに、RLベースのAVは、高速(50km/h以上)で28.98%、低速(50km/h以下)で1.86%改善している。
総合的に、DRLフレームワークは、安全を損なうことなく、交通容量と燃料効率を向上させる。
関連論文リスト
- HONEST-CAV: Hierarchical Optimization of Network Signals and Trajectories for Connected and Automated Vehicles with Multi-Agent Reinforcement Learning [17.40474300735107]
本研究では、HV(Human-driven Vehicles)、Connected and Automated Vehicles(CAV)からなる混在交通のための階層型ネットワークレベルのトラフィックフロー制御フレームワークを提案する。
このフレームワークは、車両レベルのエコドライブ行動と交差点レベルの交通信号制御を共同で最適化し、全体のネットワーク効率を高め、エネルギー消費を減少させる。
論文 参考訳(メタデータ) (2026-02-21T07:27:45Z) - Learn2Drive: A neural network-based framework for socially compliant automated vehicle control [8.217174490984299]
本研究では,自動走行における適応型クルーズ制御(ACC)のための新しい制御フレームワークを提案する。
社会的価値指向(SVO)を組み込んだニューラルネットワークに基づく社会的に適合したAV制御フレームワークを提案する。
数値計算により, 提案手法が様々な交通条件に適応することを示す。
論文 参考訳(メタデータ) (2025-09-30T22:33:44Z) - Overtake Detection in Trucks Using CAN Bus Signals: A Comparative Study of Machine Learning Methods [51.28632782308621]
ボルボグループが提供する5台の車載トラックから収集した制御エリアネットワーク(CAN)バスデータを用いたオーバーテイク検出に焦点を当てた。
車両操作検出、ニューラルネットワーク(ANN)、ランダムフォレスト(RF)、サポートベクトルマシン(SVM)の3つの共通分類器の評価を行った。
当社のパートラック分析では、特にオーバーテイクにおいて、車両毎のトレーニングデータの量に依存する分類精度も明らかにしています。
論文 参考訳(メタデータ) (2025-07-01T09:20:41Z) - Deep reinforcement learning-based longitudinal control strategy for automated vehicles at signalised intersections [2.9398787168955116]
本研究では,信号交差点における深部強化学習に基づく縦方向車両制御戦略を提案する。
総合的な報酬関数は、特に距離方向に基づく効率報酬に焦点を当てて定式化されている。
DDPG(Deep Deterministic Policy Gradient)とSAC(Soft-Actor Critic)という2つのDRLアルゴリズムが組み込まれている。
論文 参考訳(メタデータ) (2025-05-13T18:38:42Z) - Joint Pedestrian and Vehicle Traffic Optimization in Urban Environments using Reinforcement Learning [11.107470982920262]
強化学習は適応的な交通信号制御に重要な可能性を秘めている。
本研究では,現実世界の都市回廊に沿った8つの交通信号の適応制御のための深いRLフレームワークを提案する。
その結果、従来の固定時間信号よりも大幅に性能が向上した。
論文 参考訳(メタデータ) (2025-04-07T12:41:58Z) - TeLL-Drive: Enhancing Autonomous Driving with Teacher LLM-Guided Deep Reinforcement Learning [61.33599727106222]
TeLL-Driveは、Teacher LLMを統合して、注意に基づく学生DRLポリシーをガイドするハイブリッドフレームワークである。
自己維持機構はDRLエージェントの探索とこれらの戦略を融合させ、政策収束を加速し、堅牢性を高める。
論文 参考訳(メタデータ) (2025-02-03T14:22:03Z) - DenseLight: Efficient Control for Large-scale Traffic Signals with Dense
Feedback [109.84667902348498]
交通信号制御(TSC)は、道路網における車両の平均走行時間を短縮することを目的としている。
従来のTSC手法は、深い強化学習を利用して制御ポリシーを探索する。
DenseLightは、不偏報酬関数を用いてポリシーの有効性をフィードバックする新しいRTLベースのTSC手法である。
論文 参考訳(メタデータ) (2023-06-13T05:58:57Z) - iPLAN: Intent-Aware Planning in Heterogeneous Traffic via Distributed
Multi-Agent Reinforcement Learning [57.24340061741223]
本稿では,高密度および不均一な交通シナリオにおける軌跡や意図を予測できる分散マルチエージェント強化学習(MARL)アルゴリズムを提案する。
インテント対応プランニングのアプローチであるiPLANにより、エージェントは近くのドライバーの意図をローカルな観察からのみ推測できる。
論文 参考訳(メタデータ) (2023-06-09T20:12:02Z) - Unified Automatic Control of Vehicular Systems with Reinforcement
Learning [64.63619662693068]
本稿では,車載マイクロシミュレーションの合理化手法について述べる。
最小限の手動設計で高性能な制御戦略を発見する。
この研究は、波動緩和、交通信号、ランプ計測に類似した多くの創発的挙動を明らかにしている。
論文 参考訳(メタデータ) (2022-07-30T16:23:45Z) - Learning energy-efficient driving behaviors by imitating experts [75.12960180185105]
本稿では,コミュニケーション・センシングにおける制御戦略と現実的限界のギャップを埋める上で,模倣学習が果たす役割について考察する。
擬似学習は、車両の5%に採用されれば、局地的な観測のみを用いて、交通条件の異なるネットワークのエネルギー効率を15%向上させる政策を導出できることを示す。
論文 参考訳(メタデータ) (2022-06-28T17:08:31Z) - Hybrid Reinforcement Learning-Based Eco-Driving Strategy for Connected
and Automated Vehicles at Signalized Intersections [3.401874022426856]
視覚知覚法は車間通信(V2I)と統合され、より高モビリティとエネルギー効率を実現する。
HRLフレームワークには3つのコンポーネントがある。ルールベースのドライビングマネージャで、ルールベースのポリシーとRLポリシーの協調を運用する。
実験により, HRL法によりエネルギー消費量を12.70%削減し, 11.75%の移動時間を省くことができた。
論文 参考訳(メタデータ) (2022-01-19T19:31:12Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。