論文の概要: Multi-Objective Reinforcement Learning for Efficient Tactical Decision Making for Trucks in Highway Traffic
- arxiv url: http://arxiv.org/abs/2601.18783v1
- Date: Mon, 26 Jan 2026 18:50:21 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-27 15:23:09.021592
- Title: Multi-Objective Reinforcement Learning for Efficient Tactical Decision Making for Trucks in Highway Traffic
- Title(参考訳): 道路交通におけるトラックの効率的な戦術決定のための多目的強化学習
- Authors: Deepthi Pathare, Leo Laine, Morteza Haghir Chehreghani,
- Abstract要約: 近似ポリシー最適化に基づく多目的強化学習フレームワークを提案する。
ハイウェイ運転におけるトレードオフを明確に示す一連のポリシーを学習する。
異なる運転ポリシー間のシームレスな移行を可能にする。
- 参考スコア(独自算出の注目度): 8.166690500441243
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Balancing safety, efficiency, and operational costs in highway driving poses a challenging decision-making problem for heavy-duty vehicles. A central difficulty is that conventional scalar reward formulations, obtained by aggregating these competing objectives, often obscure the structure of their trade-offs. We present a Proximal Policy Optimization based multi-objective reinforcement learning framework that learns a continuous set of policies explicitly representing these trade-offs and evaluates it on a scalable simulation platform for tactical decision making in trucks. The proposed approach learns a continuous set of Pareto-optimal policies that capture the trade-offs among three conflicting objectives: safety, quantified in terms of collisions and successful completion; energy efficiency and time efficiency, quantified using energy cost and driver cost, respectively. The resulting Pareto frontier is smooth and interpretable, enabling flexibility in choosing driving behavior along different conflicting objectives. This framework allows seamless transitions between different driving policies without retraining, yielding a robust and adaptive decision-making strategy for autonomous trucking applications.
- Abstract(参考訳): ハイウェイ運転における安全性、効率、運転コストのバランスをとることは、重厚車両にとって困難な意思決定問題となる。
主な難しさは、従来のスカラー報酬の定式化は、これらの競合する目的を集約することで得られるものであり、しばしばそれらのトレードオフの構造を曖昧にすることである。
本稿では,これらのトレードオフを明確に表現したポリシーの連続的な集合を学習し,トラックにおける戦術的意思決定のためのスケーラブルなシミュレーションプラットフォーム上で評価する,近接ポリシー最適化に基づく多目的強化学習フレームワークを提案する。
提案手法は,衝突と完了の点で定量化された安全,エネルギー効率と時間効率,エネルギーコストと運転コストの3つの相反する目標のトレードオフを捉えた,パレート最適政策の連続的な集合を学習する。
結果として得られるParetoフロンティアは滑らかで解釈可能であり、異なる競合する目標に沿って運転行動を選択する柔軟性を実現する。
このフレームワークは、異なる運転ポリシー間のシームレスな移行を可能にする。
関連論文リスト
- Steerable Adversarial Scenario Generation through Test-Time Preference Alignment [58.37104890690234]
対立シナリオ生成は、自律運転システムの安全性評価のためのコスト効率の良いアプローチである。
textbfSteerable textbfAdversarial scenario textbfGEnerator (SAGE) という新しいフレームワークを導入する。
SAGEは、逆境とリアリズムの間のトレードオフを、再トレーニングなしできめ細かいテストタイムコントロールを可能にします。
論文 参考訳(メタデータ) (2025-09-24T13:27:35Z) - Multi-residual Mixture of Experts Learning for Cooperative Control in Multi-vehicle Systems [5.5597941107270215]
ラグランジアン交通制御のためのMRMEL(Multi-Residual Mixture of Expert Learning)を提案する。
MRMELは、残留補正を学習することで、最適でない名目AV制御ポリシーを強化する。
アトランタ, ダラスフォートワース, ソルトレイクシティの信号化交差点における協調的エコドライブのケーススタディを用いて, MRMELの検証を行った。
論文 参考訳(メタデータ) (2025-07-14T00:17:12Z) - TeLL-Drive: Enhancing Autonomous Driving with Teacher LLM-Guided Deep Reinforcement Learning [61.33599727106222]
TeLL-Driveは、Teacher LLMを統合して、注意に基づく学生DRLポリシーをガイドするハイブリッドフレームワークである。
自己維持機構はDRLエージェントの探索とこれらの戦略を融合させ、政策収束を加速し、堅牢性を高める。
論文 参考訳(メタデータ) (2025-02-03T14:22:03Z) - Hybrid Action Based Reinforcement Learning for Multi-Objective Compatible Autonomous Driving [9.39122455540358]
マルチオブジェクト対応自律運転のためのハイブリッドパラメタライズアクションを用いた多目的アンサンブル・クリティカル強化学習法を提案する。
実験により,シミュレータベースと高次元データセットベースの両方のマルチレーンハイウェイシナリオにおいて,本手法は多目的対応ポリシーを効率的に学習することを示した。
論文 参考訳(メタデータ) (2025-01-14T13:10:13Z) - Towards Interactive and Learnable Cooperative Driving Automation: a Large Language Model-Driven Decision-Making Framework [87.7482313774741]
コネクテッド・オートモービルズ(CAV)は世界中の道路試験を開始したが、複雑なシナリオにおける安全性と効率性はまだ十分ではない。
本稿では,対話型かつ学習可能なLLM駆動協調運転フレームワークCoDrivingLLMを提案する。
論文 参考訳(メタデータ) (2024-09-19T14:36:00Z) - Parameterized Decision-making with Multi-modal Perception for Autonomous
Driving [12.21578713219778]
AUTOと呼ばれる深層強化学習に基づくマルチモーダル認識を用いたパラメータ化意思決定フレームワークを提案する。
ハイブリッド報酬関数は、安全、交通効率、乗客の快適性、および最適な行動を生成するためのフレームワークを導く影響を考慮に入れている。
論文 参考訳(メタデータ) (2023-12-19T08:27:02Z) - Robust Driving Policy Learning with Guided Meta Reinforcement Learning [49.860391298275616]
本稿では,ソーシャルカーの多種多様な運転方針を一つのメタ政治として訓練する効率的な方法を提案する。
ソーシャルカーのインタラクションに基づく報酬関数をランダム化することにより、多様な目的を生み出し、メタ政治を効率的に訓練することができる。
本研究では,社会自動車が学習メタ政治によって制御される環境を利用して,エゴ自動車の運転方針の堅牢性を高めるためのトレーニング戦略を提案する。
論文 参考訳(メタデータ) (2023-07-19T17:42:36Z) - Decision-making for Autonomous Vehicles on Highway: Deep Reinforcement
Learning with Continuous Action Horizon [14.059728921828938]
本稿では,高速道路における連続水平決定問題に対処するために,深部強化学習(DRL)手法を用いる。
エゴ自動車両の走行目標は、衝突することなく効率的でスムーズなポリシーを実行することである。
PPO-DRLに基づく意思決定戦略は、最適性、学習効率、適応性など、複数の観点から推定される。
論文 参考訳(メタデータ) (2020-08-26T22:49:27Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。