論文の概要: Learning to Model Diverse Driving Behaviors in Highly Interactive
Autonomous Driving Scenarios with Multi-Agent Reinforcement Learning
- arxiv url: http://arxiv.org/abs/2402.13481v1
- Date: Wed, 21 Feb 2024 02:44:33 GMT
- ステータス: 処理完了
- システム内更新日: 2024-02-22 17:19:44.052170
- Title: Learning to Model Diverse Driving Behaviors in Highly Interactive
Autonomous Driving Scenarios with Multi-Agent Reinforcement Learning
- Title(参考訳): マルチエージェント強化学習を用いた対話型自律走行シナリオにおける異種運転行動のモデル化
- Authors: Liu Weiwei, Hu Wenxuan, Jing Wei, Lei Lanxin, Gao Lingping and Liu
Yong
- Abstract要約: MARL(Multi-Agent Reinforcement Learning)は多くの運転シナリオにおいて印象的な結果を示している。
しかし、これらの訓練された政策のパフォーマンスは、様々な運転スタイルや個性に直面した場合に影響を及ぼす可能性がある。
本稿では、協調価値関数とパーソナリティパラメータを含むPersonality Modeling Network(PeMN)を紹介する。
- 参考スコア(独自算出の注目度): 0.751422531359304
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Autonomous vehicles trained through Multi-Agent Reinforcement Learning (MARL)
have shown impressive results in many driving scenarios. However, the
performance of these trained policies can be impacted when faced with diverse
driving styles and personalities, particularly in highly interactive
situations. This is because conventional MARL algorithms usually operate under
the assumption of fully cooperative behavior among all agents and focus on
maximizing team rewards during training. To address this issue, we introduce
the Personality Modeling Network (PeMN), which includes a cooperation value
function and personality parameters to model the varied interactions in
high-interactive scenarios. The PeMN also enables the training of a background
traffic flow with diverse behaviors, thereby improving the performance and
generalization of the ego vehicle. Our extensive experimental studies, which
incorporate different personality parameters in high-interactive driving
scenarios, demonstrate that the personality parameters effectively model
diverse driving styles and that policies trained with PeMN demonstrate better
generalization compared to traditional MARL methods.
- Abstract(参考訳): マルチエージェント強化学習(marl)によって訓練された自動運転車は、多くの運転シナリオで印象的な結果を示している。
しかしながら、これらの訓練されたポリシーのパフォーマンスは、特に高度にインタラクティブな状況において、様々な運転スタイルや個性に直面した場合に影響を受ける可能性がある。
これは、従来のMARLアルゴリズムが全てのエージェント間で完全に協調的な振る舞いを仮定して動作し、トレーニング中のチーム報酬の最大化に集中するためである。
この問題に対処するために,協調価値関数とパーソナリティパラメータを含むPersonality Modeling Network (PeMN)を導入し,多種多様な相互作用を高対話シナリオでモデル化する。
pemnはまた、さまざまな行動を伴うバックグラウンドトラフィックフローのトレーニングを可能にし、ego車両の性能と一般化を改善している。
その結果,パーソナリティパラメータが多種多様な運転スタイルを効果的にモデル化し,pemnで訓練した政策が従来のmarl法よりも優れた一般化を示すことが示された。
関連論文リスト
- Importance Sampling-Guided Meta-Training for Intelligent Agents in Highly Interactive Environments [43.144056801987595]
本研究では,ガイド付きメタRLと重要サンプリング(IS)を統合し,トレーニング分布を最適化する新たなトレーニングフレームワークを提案する。
現実世界のデータセットから自然な分布を推定することにより、このフレームワークは、共通および極端な駆動シナリオ間のバランスのとれたフォーカスを保証する。
論文 参考訳(メタデータ) (2024-07-22T17:57:12Z) - PersLLM: A Personified Training Approach for Large Language Models [66.16513246245401]
社会実践, 一貫性, 動的発達という, 心理学に根ざした個性の原則を統合したPersLLMを提案する。
モデルパラメータに直接パーソナリティ特性を組み込み、誘導に対するモデルの抵抗性を高め、一貫性を高め、パーソナリティの動的進化を支援する。
論文 参考訳(メタデータ) (2024-07-17T08:13:22Z) - Probing Multimodal LLMs as World Models for Driving [72.18727651074563]
自律運転におけるMLLM(Multimodal Large Language Models)の適用について検討する。
GPT-4oのようなモデルの開発は進んでいるが、複雑な運転環境における性能は未解明のままである。
論文 参考訳(メタデータ) (2024-05-09T17:52:42Z) - Delving into Multi-modal Multi-task Foundation Models for Road Scene Understanding: From Learning Paradigm Perspectives [56.2139730920855]
本稿では,道路シーンに特化して設計されたMM-VUFMの系統解析について述べる。
本研究の目的は,タスク特化モデル,統合マルチモーダルモデル,統合マルチタスクモデル,基礎モデル推進技術など,共通プラクティスの包括的概要を提供することである。
我々は、クローズドループ駆動システム、解釈可能性、エンボディドドライブエージェント、世界モデルなど、重要な課題と今後のトレンドに関する洞察を提供する。
論文 参考訳(メタデータ) (2024-02-05T12:47:09Z) - Looking for a better fit? An Incremental Learning Multimodal Object
Referencing Framework adapting to Individual Drivers [0.0]
自動車産業の急速な進歩により、タッチベースや音声コマンドシステムといった従来の車両のインタラクション方法は、車両外の物体を参照するなど、幅広い非運転関連のタスクには不十分である。
textitIcRegressは、オブジェクトの駆動と参照という2つのタスクに携わるドライバーの振る舞いや特徴に適応する、新しい回帰に基づく漸進的学習手法である。
論文 参考訳(メタデータ) (2024-01-29T12:48:56Z) - Interactive Autonomous Navigation with Internal State Inference and
Interactivity Estimation [58.21683603243387]
本稿では,関係時間的推論を伴う3つの補助的タスクを提案し,それらを標準のディープラーニングフレームワークに統合する。
これらの補助的なタスクは、他の対話的エージェントの行動パターンを推測するための追加の監視信号を提供する。
提案手法は,標準評価指標の観点から,頑健かつ最先端のパフォーマンスを実現する。
論文 参考訳(メタデータ) (2023-11-27T18:57:42Z) - Multi-Agent Imitation Learning with Copulas [102.27052968901894]
マルチエージェント模倣学習は、観察と行動のマッピングを学習することで、デモからタスクを実行するために複数のエージェントを訓練することを目的としている。
本稿では,確率変数間の依存を捉える強力な統計ツールである copula を用いて,マルチエージェントシステムにおける相関関係と協調関係を明示的にモデル化する。
提案モデルでは,各エージェントの局所的行動パターンと,エージェント間の依存構造のみをフルにキャプチャするコプラ関数を別々に学習することができる。
論文 参考訳(メタデータ) (2021-07-10T03:49:41Z) - Pedestrian Behavior Prediction via Multitask Learning and Categorical
Interaction Modeling [13.936894582450734]
マルチモーダルデータに頼って歩行者の軌跡や行動を同時に予測するマルチタスク学習フレームワークを提案する。
本モデルでは, トラジェクティブと動作予測を最大22%, 6%向上させる。
論文 参考訳(メタデータ) (2020-12-06T15:57:11Z) - Behaviorally Diverse Traffic Simulation via Reinforcement Learning [16.99423598448411]
本稿では,自律運転エージェントのための簡易なポリシー生成アルゴリズムを提案する。
提案アルゴリズムは,深層強化学習の表現能力と探索能力を活用することで,多様性と運転能力のバランスをとる。
本手法の有効性を,いくつかの挑戦的な交差点シーンにおいて実験的に示す。
論文 参考訳(メタデータ) (2020-11-11T12:49:11Z) - SMARTS: Scalable Multi-Agent Reinforcement Learning Training School for
Autonomous Driving [96.50297622371457]
マルチエージェントインタラクションは、現実の世界における自律運転の基本的な側面である。
研究と開発が10年以上続いたにもかかわらず、様々なシナリオで多様な道路ユーザーと対話する方法の問題は未解決のままである。
SMARTSと呼ばれる,多種多様な運転インタラクションを生成する専用シミュレーションプラットフォームを開発した。
論文 参考訳(メタデータ) (2020-10-19T18:26:10Z) - Parallel Knowledge Transfer in Multi-Agent Reinforcement Learning [0.2538209532048867]
本稿では,MARL(Parallel Attentional Transfer)における新しい知識伝達フレームワークを提案する。
PAT,学生モード,自己学習モードの2つの動作モードを設計する。
エージェントが環境に不慣れな場合、学生モードにおける共有注意機構は、エージェントの行動を決定するために、他のエージェントからの学習知識を効果的に選択する。
論文 参考訳(メタデータ) (2020-03-29T17:42:00Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。