論文の概要: Multiple Plans are Better than One: Diverse Stochastic Planning
- arxiv url: http://arxiv.org/abs/2012.15485v1
- Date: Thu, 31 Dec 2020 07:29:11 GMT
- ステータス: 処理完了
- システム内更新日: 2021-04-17 17:00:50.888403
- Title: Multiple Plans are Better than One: Diverse Stochastic Planning
- Title(参考訳): 複数の計画の方が1より優れている: 異種確率計画
- Authors: Mahsa Ghasemi, Evan Scope Crafts, Bo Zhao, Ufuk Topcu
- Abstract要約: 計画上の問題では、望ましい仕様を完全にモデル化することはしばしば困難です。
特に、人間とロボットの相互作用において、そのような困難は、プライベートまたはモデルに複雑である人間の好みによって生じる可能性がある。
我々は、最適に近い代表行動の集合を生成することを目的とした、多種多様な計画と呼ばれる問題を定式化する。
- 参考スコア(独自算出の注目度): 26.887796946596243
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In planning problems, it is often challenging to fully model the desired
specifications. In particular, in human-robot interaction, such difficulty may
arise due to human's preferences that are either private or complex to model.
Consequently, the resulting objective function can only partially capture the
specifications and optimizing that may lead to poor performance with respect to
the true specifications. Motivated by this challenge, we formulate a problem,
called diverse stochastic planning, that aims to generate a set of
representative -- small and diverse -- behaviors that are near-optimal with
respect to the known objective. In particular, the problem aims to compute a
set of diverse and near-optimal policies for systems modeled by a Markov
decision process. We cast the problem as a constrained nonlinear optimization
for which we propose a solution relying on the Frank-Wolfe method. We then
prove that the proposed solution converges to a stationary point and
demonstrate its efficacy in several planning problems.
- Abstract(参考訳): 計画の問題では、望ましい仕様を完全にモデル化することがしばしば困難である。
特に、人間とロボットの相互作用において、そのような困難は人間の好みによって生じる可能性がある。
その結果、結果として得られた目的関数は、仕様を部分的にキャプチャし、真の仕様に関して性能が低下する可能性のある最適化のみを行えます。
この課題に動機づけられた我々は、既知の目的に関してほぼ最適である一連の代表的行動を生成することを目的とした、多様な確率計画と呼ばれる問題を定式化します。
特に、この問題はマルコフ決定プロセスによってモデル化されたシステムの多様でほぼ最適のポリシーの集合を計算することを目的としている。
この問題を制約付き非線形最適化として,フランク=ウルフ法に依存する解を提案する。
次に,提案手法が定常点に収束し,いくつかの計画問題において有効性を示す。
関連論文リスト
- Learning Proximal Operators to Discover Multiple Optima [66.98045013486794]
非家族問題における近位演算子を学習するためのエンドツーエンド手法を提案する。
本手法は,弱い目的と穏やかな条件下では,世界規模で収束することを示す。
論文 参考訳(メタデータ) (2022-01-28T05:53:28Z) - The Parametric Cost Function Approximation: A new approach for
multistage stochastic programming [4.847980206213335]
決定論的最適化モデルのパラメータ化バージョンは、プログラミングや動的プログラミングの複雑さを伴わずに不確実性を扱う効果的な方法であることを示す。
このアプローチは複雑な高次元状態変数を処理でき、シナリオツリーや値関数近似に関連する通常の近似を避けることができる。
論文 参考訳(メタデータ) (2022-01-01T23:25:09Z) - Gradient-Based Mixed Planning with Discrete and Continuous Actions [34.885999774739055]
本稿では,連続パラメータと候補計画の動作を同時に最適化する二次的枠組みを提案する。
フレームワークはモジュールと組み合わせて、緩和に基づいて初期状態から目標へ移行する最適な計画候補を推定する。
論文 参考訳(メタデータ) (2021-10-19T14:21:19Z) - Evaluating model-based planning and planner amortization for continuous
control [79.49319308600228]
我々は、モデル予測制御(MPC)と学習モデルとモデルフリーポリシー学習を組み合わせたハイブリッドアプローチを採っている。
モデルフリーエージェントは高いDoF制御問題においても強いベースラインであることがわかった。
モデルに基づくプランナを,パフォーマンスを損なうことなく,計画が損なわれるようなポリシーに置き換えることが可能であることを示す。
論文 参考訳(メタデータ) (2021-10-07T12:00:40Z) - Motion Planning by Learning the Solution Manifold in Trajectory
Optimization [6.127237810365965]
本稿では,運動計画問題に対する無限の解集合を生成する最適化手法を提案する。
結果は、実験モデルが運動計画問題のホモトピー解の無限集合を表すことを示している。
論文 参考訳(メタデータ) (2021-07-13T04:47:47Z) - Learning MDPs from Features: Predict-Then-Optimize for Sequential
Decision Problems by Reinforcement Learning [52.74071439183113]
我々は、強化学習を通して解決された逐次決定問題(MDP)の文脈における予測列最適化フレームワークについて検討した。
2つの重要な計算課題は、意思決定中心の学習をMDPに適用することである。
論文 参考訳(メタデータ) (2021-06-06T23:53:31Z) - Modeling the Second Player in Distributionally Robust Optimization [90.25995710696425]
我々は、最悪のケース分布を特徴付けるために神経生成モデルを使うことを議論する。
このアプローチは多くの実装と最適化の課題をもたらします。
提案されたアプローチは、同等のベースラインよりも堅牢なモデルを生み出す。
論文 参考訳(メタデータ) (2021-03-18T14:26:26Z) - Offline Model-Based Optimization via Normalized Maximum Likelihood
Estimation [101.22379613810881]
データ駆動最適化の問題を検討し、一定の点セットでクエリのみを与えられた関数を最大化する必要がある。
この問題は、関数評価が複雑で高価なプロセスである多くの領域に現れる。
我々は,提案手法を高容量ニューラルネットワークモデルに拡張可能なトラクタブル近似を提案する。
論文 参考訳(メタデータ) (2021-02-16T06:04:27Z) - Sufficiently Accurate Model Learning for Planning [119.80502738709937]
本稿では,制約付きSufficiently Accurateモデル学習手法を提案する。
これはそのような問題の例を示し、いくつかの近似解がいかに近いかという定理を提示する。
近似解の質は、関数のパラメータ化、損失と制約関数の滑らかさ、モデル学習におけるサンプルの数に依存する。
論文 参考訳(メタデータ) (2021-02-11T16:27:31Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。