Fugu-MT 論文翻訳(概要): Generalized dynamic cognitive hierarchy models for strategic driving behavior

論文の概要: Generalized dynamic cognitive hierarchy models for strategic driving behavior

arxiv url: http://arxiv.org/abs/2109.09861v1
Date: Mon, 20 Sep 2021 21:49:52 GMT
ステータス: 翻訳完了
システム内更新日: 2021-09-22 14:12:06.292519
Title: Generalized dynamic cognitive hierarchy models for strategic driving behavior
Title（参考訳）: 戦略的駆動行動のための一般化された動的認知階層モデル
Authors: Atrisha Sarkar, Kate Larson, Krzysztof Czarnecki
Abstract要約: 我々は、自然主義的人間運転行動と自律走行車における行動計画の両方をモデル化するための一般化された動的認知階層の枠組みを開発する。 2つの大きな自然主義的データセットの評価に基づいて、動的レベル-kフレームワークにおけるレベル-0の振る舞いにオートマトン戦略が適していることを示す。
参考スコア（独自算出の注目度）: 13.415452801139843
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: While there has been an increasing focus on the use of game theoretic models for autonomous driving, empirical evidence shows that there are still open questions around dealing with the challenges of common knowledge assumptions as well as modeling bounded rationality. To address some of these practical challenges, we develop a framework of generalized dynamic cognitive hierarchy for both modelling naturalistic human driving behavior as well as behavior planning for autonomous vehicles (AV). This framework is built upon a rich model of level-0 behavior through the use of automata strategies, an interpretable notion of bounded rationality through safety and maneuver satisficing, and a robust response for planning. Based on evaluation on two large naturalistic datasets as well as simulation of critical traffic scenarios, we show that i) automata strategies are well suited for level-0 behavior in a dynamic level-k framework, and ii) the proposed robust response to a heterogeneous population of strategic and non-strategic reasoners can be an effective approach for game theoretic planning in AV.
Abstract（参考訳）: 自律運転におけるゲーム理論モデルの使用に焦点が当てられているが、実証的な証拠は、共通知識仮定の課題への対処や有界な合理性をモデル化することに関して、まだオープンな疑問が存在することを示している。これらの課題に対処するために,自然主義的人間運転行動と自律走行車(AV)の行動計画の両方をモデル化するための,一般化された動的認知階層の枠組みを開発する。このフレームワークは、オートマタ戦略の使用によるレベル-0の振る舞いの豊富なモデル、安全性と操作の満足度による境界的合理性の解釈可能な概念、計画に対する堅牢な反応に基づいている。 2つの大きな自然主義的データセットの評価と重要な交通シナリオのシミュレーションに基づいて、そのことを示す。 i) オートマトン戦略は、動的レベルkフレームワークにおけるレベル-0の振る舞いに適しており、また、二戦略的・非戦略的推論者の異種集団に対する頑健な対応は、AVにおけるゲーム理論計画に有効なアプローチである。

関連論文リスト

SPACeR: Self-Play Anchoring with Centralized Reference Models [50.55045557371374]
Simエージェントポリシーは、現実的で、人間らしく、高速で、マルチエージェント設定でスケーラブルである。大規模な拡散モデルやトークン化モデルを用いた模倣学習の最近の進歩は、人間の運転データから直接行動を把握することができることを示している。本研究では,事前訓練されたトークン化自己回帰運動モデルを利用したSPACeRを提案する。
論文参考訳（メタデータ） (2025-10-20T19:53:02Z)
Discrete Diffusion for Reflective Vision-Language-Action Models in Autonomous Driving [55.13109926181247]
離散拡散による安全な軌道生成のためのリフレクション機構を統合した学習ベースのフレームワークであるReflectDriveを紹介する。我々のアプローチの中心は、勾配のない反復的な自己補正を行う、安全を意識した反射機構である。本手法は目標条件付き軌道生成から始まり,マルチモーダル運転動作をモデル化する。
論文参考訳（メタデータ） (2025-09-24T13:35:15Z)
ReAL-AD: Towards Human-Like Reasoning in End-to-End Autonomous Driving [27.75047397292818]
エンドツーエンドの自動運転は、単一のフレームワーク内で認識、予測、計画を統合するための有望なアプローチとして現れています。本稿では,3階層の認知モデルに基づいて自律運転における意思決定を構造化するReAL-ADを提案する。我々のフレームワークを統合することで、計画の正確さと安全性が30%以上向上し、エンドツーエンドの自動運転がより解釈可能になり、人間のような階層的推論に適合することを示します。
論文参考訳（メタデータ） (2025-07-16T02:23:24Z)
Test Automation for Interactive Scenarios via Promptable Traffic Simulation [48.240394447516664]
本稿では,対話型シナリオにおけるAVプランナ評価のための,現実的かつ安全クリティカルな人間の行動を生成する自動化手法を提案する。我々は低次元目標位置を用いて複雑な人間の行動のパラメータ化を行い、それをプロンプト可能な交通シミュレータProSimに入力する。テスト生成を自動化するために,目標領域を探索し,ベイズ最適化を用いて安全クリティカルな動作を効率的に識別するプロンプト生成モジュールを導入する。
論文参考訳（メタデータ） (2025-06-01T22:29:32Z)
AdaWM: Adaptive World Model based Planning for Autonomous Driving [34.57859869929471]
世界モデルに基づく強化学習(RL)が自律運転の有望なアプローチとして登場した。プレトレイン-ファイントゥンパラダイムは、オンラインRLが事前訓練されたモデルによってパフォーマンスされ、オフラインで学習されるポリシーで使用されることが多い。本稿では,アダプティブ・ワールド・モデルに基づく計画手法であるAdaWMを紹介する。(a)ミスマッチを定量化し,微調整戦略を通知するミスマッチ識別と,(b)ポリシーやモデルを必要に応じて選択的に更新するアライメント駆動微調整である。
論文参考訳（メタデータ） (2025-01-22T18:34:51Z)
A Survey of World Models for Autonomous Driving [63.33363128964687]
自律運転の最近の進歩は、堅牢な世界モデリングの進歩によって推進されている。本稿では、自律運転の世界モデルにおける最近の進歩を体系的にレビューする。
論文参考訳（メタデータ） (2025-01-20T04:00:02Z)
Reinforcement Learning under Latent Dynamics: Toward Statistical and Algorithmic Modularity [51.40558987254471]
強化学習の現実的な応用は、エージェントが複雑な高次元の観察を行う環境を含むことが多い。本稿では,統計的・アルゴリズム的な観点から,textit General$ latent dynamicsの下での強化学習の課題に対処する。
論文参考訳（メタデータ） (2024-10-23T14:22:49Z)
Adversarial Safety-Critical Scenario Generation using Naturalistic Human Driving Priors [2.773055342671194]
本研究では,自然主義的人間運転先行と強化学習技術を用いた自然逆シナリオ生成ソリューションを提案する。本研究は,本モデルにより,自然性と逆性の両方をカバーする現実的な安全クリティカルなテストシナリオを生成できることを示す。
論文参考訳（メタデータ） (2024-08-06T13:58:56Z)
Learning to Steer Markovian Agents under Model Uncertainty [23.603487812521657]
我々は,希望する政策に向けて,マルチエージェントシステムに付加的な報酬を課す方法について検討する。既存の作業の制限によって動機づけられた我々は、emphMarkovian agentと呼ばれる学習力学の新しいカテゴリーを考える。我々は、エージェントの学習力学に関する本質的なモデルの不確実性を扱うために、歴史に依存した運営戦略を学習する。
論文参考訳（メタデータ） (2024-07-14T14:01:38Z)
SAFE-SIM: Safety-Critical Closed-Loop Traffic Simulation with Diffusion-Controllable Adversaries [94.84458417662407]
制御可能なクローズドループ安全クリティカルシミュレーションフレームワークであるSAFE-SIMを紹介する。提案手法は,1)現実の環境を深く反映した現実的な長距離安全クリティカルシナリオの生成,2)より包括的でインタラクティブな評価のための制御可能な敵行動の提供,の2つの利点をもたらす。複数のプランナにまたがるnuScenesとnuPlanデータセットを使用して、我々のフレームワークを実証的に検証し、リアリズムと制御性の両方の改善を実証した。
論文参考訳（メタデータ） (2023-12-31T04:14:43Z)
Dual policy as self-model for planning [71.73710074424511]
エージェントの自己モデルとして決定をシミュレートするために使用されるモデルについて述べる。現在の強化学習アプローチと神経科学にインスパイアされた我々は、蒸留政策ネットワークを自己モデルとして利用することの利点と限界を探求する。
論文参考訳（メタデータ） (2023-06-07T13:58:45Z)
Hierarchical Model-Based Imitation Learning for Planning in Autonomous Driving [47.59287162318435]
都市密集型自動運転の課題に対するモデルベース生成逆相似学習(MGAIL)の大規模適用を実証した。我々は、任意の目標経路への一般化を可能にする階層モデルを用いて標準MGAILを拡張し、シミュレーションされた対話エージェントを用いたクローズドループ評価フレームワークを用いて性能を測定する。私たちは、サンフランシスコで10万マイル以上を走行する実車から収集した専門家の軌跡からのポリシーを訓練し、ゼロショット環境でも堅牢にナビゲートできるステアブルなポリシーを実証します。
論文参考訳（メタデータ） (2022-10-18T02:15:34Z)
UMBRELLA: Uncertainty-Aware Model-Based Offline Reinforcement Learning Leveraging Planning [1.1339580074756188]
オフライン強化学習(RL)は、オフラインデータから意思決定を学ぶためのフレームワークを提供する。自動運転車(SDV)は、おそらく準最適データセットの振る舞いよりも優れるポリシーを学ぶ。これはモデルベースのオフラインRLアプローチの使用を動機付け、プランニングを活用する。
論文参考訳（メタデータ） (2021-11-22T10:37:52Z)
A taxonomy of strategic human interactions in traffic conflicts [13.415452801139843]
交通紛争における相互作用パターンに基づく戦略的相互作用のための分類法を開発した。戦略プランナーが作成した戦略を分類学のカテゴリーに自動マッピングする過程を実証する。 AV、QLk、Subgameの戦略的プランニングで使われる2つの一般的なソリューション概念を、完全$epsilon$-Nash Equilibriumで評価する。
論文参考訳（メタデータ） (2021-09-27T22:19:30Z)
Solution Concepts in Hierarchical Games under Bounded Rationality with Applications to Autonomous Driving [8.500525426182115]
階層型ゲームを用いた運転行動のゲーム理論モデルを作成する。本研究では,自然主義データに適合するモデルと,その予測能力に基づいて行動モデルを評価する。以上の結果から, 運転行動モデルとして評価された動作モデルのうち, レベル0の振る舞いをルールフォローとしてモデル化したQuantal Level-kモデルの適応として, 運転行動のモデル化が, 自然主義的な運転行動に最も適していることが示唆された。
論文参考訳（メタデータ） (2020-09-21T17:13:50Z)
Goal-Aware Prediction: Learning to Model What Matters [105.43098326577434]
学習した前進力学モデルを使用する際の根本的な課題の1つは、学習したモデルの目的と下流のプランナーやポリシーの目標とのミスマッチである。本稿では,タスク関連情報への直接的予測を提案し,そのモデルが現在のタスクを認識し,状態空間の関連量のみをモデル化することを奨励する。提案手法は,目標条件付きシーンの関連部分を効果的にモデル化し,その結果,標準タスク非依存のダイナミックスモデルやモデルレス強化学習より優れていることがわかった。
論文参考訳（メタデータ） (2020-07-14T16:42:59Z)
Context-aware Dynamics Model for Generalization in Model-Based Reinforcement Learning [124.9856253431878]
グローバルなダイナミクスモデルを学習するタスクを,(a)ローカルなダイナミクスをキャプチャするコンテキスト潜在ベクトルを学習し,(b)次に条件付き状態を予測するという2つの段階に分割する。本研究では,コンテキスト潜在ベクトルに動的情報をエンコードするために,コンテキスト潜在ベクトルを前方と後方の両方のダイナミクスを予測するのに役立つような新しい損失関数を導入する。提案手法は,既存のRL方式と比較して,様々なシミュレーションロボットや制御タスクの一般化能力に優れる。
論文参考訳（メタデータ） (2020-05-14T08:10:54Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。