Fugu-MT 論文翻訳(概要): Adversarial Agent Behavior Learning in Autonomous Driving Using Deep Reinforcement Learning

論文の概要: Adversarial Agent Behavior Learning in Autonomous Driving Using Deep Reinforcement Learning

arxiv url: http://arxiv.org/abs/2508.15207v1
Date: Thu, 21 Aug 2025 03:38:33 GMT
ステータス: 翻訳完了
システム内更新日: 2025-08-22 16:26:46.166988
Title: Adversarial Agent Behavior Learning in Autonomous Driving Using Deep Reinforcement Learning
Title（参考訳）: 深部強化学習を用いた自律運転における対立エージェント行動学習
Authors: Arjun Srinivasan, Anubhav Paras, Aniket Bera,
Abstract要約: 自律運転のような安全クリティカルな応用においては、ルールベースのエージェントが適切にモデル化されることが重要である。本稿では,ルールベースエージェントが障害シナリオを発生させる際の逆挙動を導出する学習ベース手法を提案する。
参考スコア（独自算出の注目度）: 19.988256679803065
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Existing approaches in reinforcement learning train an agent to learn desired optimal behavior in an environment with rule based surrounding agents. In safety critical applications such as autonomous driving it is crucial that the rule based agents are modelled properly. Several behavior modelling strategies and IDM models are used currently to model the surrounding agents. We present a learning based method to derive the adversarial behavior for the rule based agents to cause failure scenarios. We evaluate our adversarial agent against all the rule based agents and show the decrease in cumulative reward.
Abstract（参考訳）: 強化学習における既存のアプローチは、エージェントにルールに基づく環境における望ましい最適な行動を学ぶよう訓練する。自律運転のような安全クリティカルな応用においては、ルールベースのエージェントが適切にモデル化されることが重要である。いくつかの行動モデリング戦略とIMMモデルは、現在、周辺エージェントをモデル化するために使われている。本稿では,ルールベースエージェントが障害シナリオを発生させる際の逆挙動を導出する学習ベース手法を提案する。我々は,ルールベースエージェントに対する敵エージェントの評価を行い,累積報酬の減少を示す。

関連論文リスト

From Novice to Expert: LLM Agent Policy Optimization via Step-wise Reinforcement Learning [62.54484062185869]
本稿では,エージェントの強化学習プロセスの最適化にステップワイド報酬を利用するStepAgentを紹介する。エージェント反射とポリシー調整を容易にする暗黙の逆・逆の強化学習手法を提案する。
論文参考訳（メタデータ） (2024-11-06T10:35:11Z)
Improving Agent Behaviors with RL Fine-tuning for Autonomous Driving [17.27549891731047]
我々は,強化学習を用いた行動モデルのクローズドループ微調整によりエージェント動作の信頼性を向上させる。本手法は,衝突速度などの目標値の改善とともに,全体的な性能の向上を示す。シミュレーションエージェントが自律走行車プランナーの質を計測する能力を直接評価するための新しいポリシー評価ベンチマークを提案する。
論文参考訳（メタデータ） (2024-09-26T23:40:33Z)
Contrastive learning-based agent modeling for deep reinforcement learning [29.16867602635975]
エージェントモデリングは、マルチエージェントシステムにおけるインテリジェントマシンエージェントの適応ポリシーを設計する際に必須である。我々は,エゴエージェントの訓練・実行時の局所的な観察のみに依存する,コントラスト学習に基づくエージェントモデリング(CLAM)手法を考案した。 CLAMは、各エピソードの冒頭から、リアルタイムに一貫した高品質なポリシー表現を生成することができる。
論文参考訳（メタデータ） (2023-12-30T03:44:12Z)
Explaining Reinforcement Learning Policies through Counterfactual Trajectories [147.7246109100945]
人間の開発者は、RLエージェントがテスト時にうまく機能することを検証しなければならない。本手法では, エージェントの挙動をより広い軌道分布で示すことにより, エージェントの挙動を分布変化下で表現する。本研究では,2つのエージェント検証タスクのうちの1つに対して,ベースライン法よりも優れたスコアを得られることを示す。
論文参考訳（メタデータ） (2022-01-29T00:52:37Z)
Deep Interactive Bayesian Reinforcement Learning via Meta-Learning [63.96201773395921]
他のエージェントの戦略に対する不確実性下での最適適応行動は、インタラクティブベイズ強化学習フレームワークを用いて計算することができる。本稿では,メタラーン近似的信念推論とベイズ最適行動を提案する。提案手法は, モデルフリーアプローチ, 近似後部からのサンプル採取, 他者のメモリフリーモデル維持, あるいは環境の既知の構造を完全に活用しない既存手法よりも優れていることを示す。
論文参考訳（メタデータ） (2021-01-11T13:25:13Z)
Safe Reinforcement Learning via Curriculum Induction [94.67835258431202]
安全クリティカルなアプリケーションでは、自律エージェントはミスが非常にコストがかかる環境で学ぶ必要がある。既存の安全な強化学習手法は、エージェントが危険な状況を避けるために、事前にエージェントを頼りにしている。本稿では,エージェントが自動インストラクターの指導の下で学習する,人間の指導にインスパイアされた代替手法を提案する。
論文参考訳（メタデータ） (2020-06-22T10:48:17Z)
Agent Modelling under Partial Observability for Deep Reinforcement Learning [12.903487594031276]
エージェントモデリングの既存の方法は、実行中にローカルな観察とモデル化されたエージェントの選択されたアクションの知識を仮定する。制御されたエージェントの局所的な観察に基づいて,モデル化されたエージェントの表現を抽出することを学ぶ。これらの表現は、深い強化学習を通じて訓練された制御エージェントの決定ポリシーを強化するために使用される。
論文参考訳（メタデータ） (2020-06-16T18:43:42Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。