論文の概要: Modeling Human Driver Interactions Using an Infinite Policy Space
Through Gaussian Processes
- arxiv url: http://arxiv.org/abs/2201.01733v1
- Date: Mon, 3 Jan 2022 17:45:58 GMT
- ステータス: 処理完了
- システム内更新日: 2022-01-06 14:23:12.807373
- Title: Modeling Human Driver Interactions Using an Infinite Policy Space
Through Gaussian Processes
- Title(参考訳): 無限方針空間を用いたガウス過程による運転者インタラクションのモデル化
- Authors: Cem Okan Yaldiz and Yildiray Yildiz
- Abstract要約: 本稿では,多出力ガウス過程に依存する人間のドライバインタラクションをモデル化する手法を提案する。
提案手法は,実際のトラフィックデータセット上で,そのコントリビューションと意味を実証するために検証される。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This paper proposes a method for modeling human driver interactions that
relies on multi-output gaussian processes. The proposed method is developed as
a refinement of the game theoretical hierarchical reasoning approach called
"level-k reasoning" which conventionally assigns discrete levels of behaviors
to agents. Although it is shown to be an effective modeling tool, the level-k
reasoning approach may pose undesired constraints for predicting human decision
making due to a limited number (usually 2 or 3) of driver policies it extracts.
The proposed approach is put forward to fill this gap in the literature by
introducing a continuous domain framework that enables an infinite policy
space. By using the approach presented in this paper, more accurate driver
models can be obtained, which can then be employed for creating high fidelity
simulation platforms for the validation of autonomous vehicle control
algorithms. The proposed method is validated on a real traffic dataset and
compared with the conventional level-k approach to demonstrate its
contributions and implications.
- Abstract(参考訳): 本稿では,複数出力ガウス過程に依存するヒューマンドライバインタラクションのモデル化手法を提案する。
提案手法は,従来の行動の離散レベルをエージェントに割り当てる「レベルk推論」と呼ばれるゲーム理論的階層的推論手法の改良として開発された。
効果的なモデリングツールであることが示されているが、レベルk推論アプローチは、抽出するドライバーポリシーの限られた数(通常2または3)による人間の意思決定を予測するために望ましくない制約をもたらす可能性がある。
提案手法は、無限のポリシー空間を可能にする連続的なドメインフレームワークを導入することで、文献のこのギャップを埋めるものである。
本論文で示したアプローチを用いることで、より正確な運転モデルが得られるようになり、自動運転車制御アルゴリズムの検証のために高忠実度シミュレーションプラットフォームを作成することができる。
提案手法は,実際のトラヒックデータセット上で検証され,従来のlevel-kアプローチと比較してその貢献と意義を示す。
関連論文リスト
- Constrained Reinforcement Learning with Average Reward Objective: Model-Based and Model-Free Algorithms [34.593772931446125]
モノグラフは、平均報酬決定過程(MDPs)の文脈内で制約された様々なモデルベースおよびモデルフリーアプローチの探索に焦点を当てている
このアルゴリズムは制約付きMDPの解法として検討されている。
論文 参考訳(メタデータ) (2024-06-17T12:46:02Z) - Tractable Joint Prediction and Planning over Discrete Behavior Modes for
Urban Driving [15.671811785579118]
自己回帰閉ループモデルのパラメータ化は,再学習を伴わずに可能であることを示す。
離散潜在モード上での完全反応性閉ループ計画を提案する。
当社のアプローチは、CARLAにおける従来の最先端技術よりも、高密度なトラフィックシナリオに挑戦する上で優れています。
論文 参考訳(メタデータ) (2024-03-12T01:00:52Z) - Learning Transferable Conceptual Prototypes for Interpretable
Unsupervised Domain Adaptation [79.22678026708134]
本稿では,Transferable Prototype Learning (TCPL) という,本質的に解釈可能な手法を提案する。
この目的を達成するために、ソースドメインからターゲットドメインにカテゴリの基本概念を転送する階層的なプロトタイプモジュールを設計し、基礎となる推論プロセスを説明するためにドメイン共有プロトタイプを学習する。
総合的な実験により,提案手法は有効かつ直感的な説明を提供するだけでなく,従来の最先端技術よりも優れていることが示された。
論文 参考訳(メタデータ) (2023-10-12T06:36:41Z) - Model Predictive Control with Gaussian-Process-Supported Dynamical
Constraints for Autonomous Vehicles [82.65261980827594]
本研究では、学習したガウス過程を利用して人間の運転行動を予測する自動運転車のモデル予測制御手法を提案する。
マルチモード予測制御アプローチは、人間のドライバーの意図を考察する。
論文 参考訳(メタデータ) (2023-03-08T17:14:57Z) - Multi-Objective Policy Gradients with Topological Constraints [108.10241442630289]
本稿では, PPOアルゴリズムの簡単な拡張により, TMDPにおけるポリシー勾配に対する新しいアルゴリズムを提案する。
シミュレーションと実ロボットの両方の目的を任意に並べた実世界の多目的ナビゲーション問題に対して,これを実証する。
論文 参考訳(メタデータ) (2022-09-15T07:22:58Z) - Planning with Diffusion for Flexible Behavior Synthesis [125.24438991142573]
我々は、できるだけ多くの軌道最適化パイプラインをモデリング問題に折り畳むことがどう見えるか検討する。
我々の技術的アプローチの核心は、軌道を反復的にデノベーションすることで計画する拡散確率モデルにある。
論文 参考訳(メタデータ) (2022-05-20T07:02:03Z) - Verified Probabilistic Policies for Deep Reinforcement Learning [6.85316573653194]
我々は、深い強化学習のための確率的政策を検証する問題に取り組む。
本稿では,マルコフ決定プロセスの間隔に基づく抽象的アプローチを提案する。
本稿では,抽象的解釈,混合整数線形プログラミング,エントロピーに基づく洗練,確率的モデルチェックを用いて,これらのモデルを構築・解決する手法を提案する。
論文 参考訳(メタデータ) (2022-01-10T23:55:04Z) - Safe Continuous Control with Constrained Model-Based Policy Optimization [0.0]
制約付き高次元制御のためのモデルベースセーフ探索アルゴリズムを提案する。
また、モデル生成データによるポリシー探索を高速化する実用的なアルゴリズムも導入する。
論文 参考訳(メタデータ) (2021-04-14T15:20:55Z) - Risk-Sensitive Sequential Action Control with Multi-Modal Human
Trajectory Forecasting for Safe Crowd-Robot Interaction [55.569050872780224]
本稿では,リスクに敏感な最適制御に基づく安全な群集ロボットインタラクションのためのオンラインフレームワークを提案し,そのリスクをエントロピーリスク尺度でモデル化する。
私たちのモジュラーアプローチは、クラウドとロボットの相互作用を学習ベースの予測とモデルベースの制御に分離します。
シミュレーション研究と実世界の実験により、このフレームワークは、現場にいる50人以上の人間との衝突を避けながら、安全で効率的なナビゲーションを実現することができることが示された。
論文 参考訳(メタデータ) (2020-09-12T02:02:52Z) - Control as Hybrid Inference [62.997667081978825]
本稿では、反復推論と償却推論のバランスを自然に仲介するCHIの実装について述べる。
連続的な制御ベンチマークでアルゴリズムのスケーラビリティを検証し、強力なモデルフリーおよびモデルベースラインを上回る性能を示す。
論文 参考訳(メタデータ) (2020-07-11T19:44:09Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。