Fugu-MT 論文翻訳(概要): Interactive Trajectory Planning with Learning-based Distributionally Robust Model Predictive Control and Markov Systems

論文の概要: Interactive Trajectory Planning with Learning-based Distributionally Robust Model Predictive Control and Markov Systems

arxiv url: http://arxiv.org/abs/2605.07768v1
Date: Fri, 08 May 2026 14:09:54 GMT
ステータス: 翻訳完了
システム内更新日: 2026-05-11 19:43:39.098863
Title: Interactive Trajectory Planning with Learning-based Distributionally Robust Model Predictive Control and Markov Systems
Title（参考訳）: 学習に基づくロバスト分布モデル予測制御とマルコフシステムによる対話的軌道計画
Authors: Erik Börve, Nikolce Murgovski, Morteza Haghir Chehreghani, Leo Laine,
Abstract要約: 本研究では,周辺エージェントの意思決定における不確実性を考慮した対話的軌道計画について検討する。エゴエージェントを制御するために,まず決定分布を学習し,モデル予測制御問題を解くことを目的とする。
参考スコア（独自算出の注目度）: 12.610033027576094
License: http://creativecommons.org/licenses/by-sa/4.0/
Abstract: We investigate interactive trajectory planning subject to uncertainty in the decisions of surrounding agents. To control the ego-agent, we aim to first learn the decision distribution and solve a Stochastic Model Predictive Control (SMPC) problem. To account for errors in the learned distribution, we show that it is possible to utilize Probably Approximately Correct (PAC) learning in combination with Distributionally Robust (DR) optimization to obtain a solution which accounts for the errors induced by the learning model. The results indicate that our PAC learning-based DR-MPC framework provides a method to interpolate between a robust MPC and an omnipotent SMPC, based on the available number of samples.
Abstract（参考訳）: 本研究では,周辺エージェントの意思決定における不確実性を考慮した対話的軌道計画について検討する。エゴエージェントを制御するために,まず決定分布を学習し,確率モデル予測制御(SMPC)問題を解くことを目的とする。学習した分布の誤差を考慮し,確率的近似(PAC)学習と分布ロバスト(DR)最適化を組み合わせることで,学習モデルによって引き起こされる誤りを考慮に入れた解が得られることを示す。その結果,我々のPAC学習に基づくDR-MPCフレームワークは,使用可能なサンプル数に基づいて,ロバストなMPCと全能なSMPCを補間する方法を提供することがわかった。

関連論文リスト

On Discriminative Probabilistic Modeling for Self-Supervised Representation Learning [85.75164588939185]
本研究では,(マルチモーダル)自己教師型表現学習のデータ予測タスクにおいて,連続領域における識別確率モデルについて検討する。我々は、自己教師付き表現学習における現在のInfoNCEに基づくコントラスト損失の制限を明らかにするために一般化誤差解析を行う。 MISが要求する条件付き確率密度の和を近似する新しい非パラメトリック手法を提案する。
論文参考訳（メタデータ） (2024-10-11T18:02:46Z)
Integrating Reinforcement Learning and Model Predictive Control with Applications to Microgrids [14.389086937116582]
本研究は,有限水平最適制御問題を効率的に解くために,強化学習とモデル予測制御(MPC)を統合するアプローチを提案する。我々のアプローチは、離散変数の決定を連続変数の決定から切り離すことによってこの問題を軽減することを目的としている。提案手法では,MPC制御器のオンライン問題を混合整数線形プログラムから線形プログラムへ簡易化する。
論文参考訳（メタデータ） (2024-09-17T15:17:16Z)
Actively Learning Reinforcement Learning: A Stochastic Optimal Control Approach [3.453622106101339]
本研究では,2つの相互に結びついた目的を達成するための枠組みを提案する。 (i) 積極的な探索と意図的な情報収集を伴う強化学習と, (ii) 最適制御法の計算的難易度を克服する枠組みである。我々は、強化学習を用いて最適制御則を計算することにより、両方の目的にアプローチする。一定の探索と搾取バランスとは異なり、学習プロセスが終了しても、警告と探索はリアルタイムでコントローラによって自動的に行われる。
論文参考訳（メタデータ） (2023-09-18T18:05:35Z)
Decision-Dependent Distributionally Robust Markov Decision Process Method in Dynamic Epidemic Control [4.644416582073023]
Susceptible-Exposed-Infectious-Recovered (SEIR) モデルは感染症の拡散を表すために広く用いられている。本稿では,動的流行制御問題に対処するために,分布ロバストマルコフ決定プロセス(DRMDP)を提案する。
論文参考訳（メタデータ） (2023-06-24T20:19:04Z)
Reinforcement Learning with a Terminator [80.34572413850186]
我々は, TerMDP のパラメータを学習し, 推定問題の構造を活用し, 状態ワイドな信頼境界を提供する。我々はこれらを用いて証明可能な効率のよいアルゴリズムを構築し、終端を考慮し、その後悔を抑える。
論文参考訳（メタデータ） (2022-05-30T18:40:28Z)
Stein Variational Model Predictive Control [130.60527864489168]
不確実性の下での意思決定は、現実の自律システムにとって極めて重要である。モデル予測制御 (MPC) 法は, 複雑な分布を扱う場合, 適用範囲が限られている。この枠組みが、挑戦的で非最適な制御問題における計画の成功に繋がることを示す。
論文参考訳（メタデータ） (2020-11-15T22:36:59Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。