論文の概要: Revisiting Bounded-Suboptimal Safe Interval Path Planning
- arxiv url: http://arxiv.org/abs/2006.01195v1
- Date: Mon, 1 Jun 2020 18:42:52 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-26 07:16:48.577538
- Title: Revisiting Bounded-Suboptimal Safe Interval Path Planning
- Title(参考訳): 境界下最適区間計画の再検討
- Authors: Konstantin Yakovlev, Anton Andreychuk, Roni Stern
- Abstract要約: 安全インターバル経路計画(SIPP)は動的障害物の存在下で経路を見つけるための強力なアルゴリズムである。
ロボットの経路計画などのSIPPの多くの実践的応用において、より短い計画時間で最適性をトレードオフしたい。
- 参考スコア(独自算出の注目度): 16.24691505268453
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Safe-interval path planning (SIPP) is a powerful algorithm for finding a path
in the presence of dynamic obstacles. SIPP returns provably optimal solutions.
However, in many practical applications of SIPP such as path planning for
robots, one would like to trade-off optimality for shorter planning time. In
this paper we explore different ways to build a bounded-suboptimal SIPP and
discuss their pros and cons. We compare the different bounded-suboptimal
versions of SIPP experimentally. While there is no universal winner, the
results provide insights into when each method should be used.
- Abstract(参考訳): 安全インターバル経路計画(SIPP)は動的障害物の存在下で経路を見つけるための強力なアルゴリズムである。
sippは最適な解を返す。
しかし、ロボットの経路計画などのSIPPの実践的応用の多くは、計画時間短縮のために最適性をトレードオフしたい。
本稿では,有界な準最適SIPPを構築するための様々な方法を検討し,その長所と短所について議論する。
sippの異なる有界-準最適バージョンを実験的に比較する。
普遍的な勝者はいないが、結果は各メソッドがいつ使われるべきかについての洞察を提供する。
関連論文リスト
- Towards Efficient and Exact Optimization of Language Model Alignment [97.41422112912574]
本稿では、アライメント目的の効率的な精度最適化(EXO)を提案する。
我々は,EXOがRLアルゴリズムと同じ方向に最適化されることを証明した。
さらに、現実的な人間の嗜好データに対する既存のアプローチよりも、提案手法の利点を実証する。
論文 参考訳(メタデータ) (2024-02-01T18:51:54Z) - Maximum-Likelihood Inverse Reinforcement Learning with Finite-Time
Guarantees [56.848265937921354]
逆強化学習(IRL)は報酬関数と関連する最適ポリシーを回復することを目的としている。
IRLの多くのアルゴリズムは本質的にネスト構造を持つ。
我々は、報酬推定精度を損なわないIRLのための新しいシングルループアルゴリズムを開発した。
論文 参考訳(メタデータ) (2022-10-04T17:13:45Z) - Multi-Objective Policy Gradients with Topological Constraints [108.10241442630289]
本稿では, PPOアルゴリズムの簡単な拡張により, TMDPにおけるポリシー勾配に対する新しいアルゴリズムを提案する。
シミュレーションと実ロボットの両方の目的を任意に並べた実世界の多目的ナビゲーション問題に対して,これを実証する。
論文 参考訳(メタデータ) (2022-09-15T07:22:58Z) - Policy Optimization for Stochastic Shortest Path [43.2288319750466]
最短経路(SSP)問題に対する政策最適化について検討する。
本研究では,有限ホライゾンモデルを厳密に一般化した目標指向強化学習モデルを提案する。
ほとんどの設定において、我々のアルゴリズムは、ほぼ最適の後悔境界に達することが示されている。
論文 参考訳(メタデータ) (2022-02-07T16:25:14Z) - Using Particle Swarm Optimization as Pathfinding Strategy in a Space
with Obstacles [4.899469599577755]
Particle Swarm Optimization (PSO) は集団適応最適化に基づく探索アルゴリズムである。
本稿では,幅広いアプリケーションを対象としたパスプランニングの効率化を図るため,パスフィニング戦略を提案する。
論文 参考訳(メタデータ) (2021-12-16T12:16:02Z) - Understanding the Effect of Stochasticity in Policy Optimization [86.7574122154668]
最適化手法の優位性は、正確な勾配が用いられるかどうかに大きく依存することを示す。
次に,政策最適化におけるコミット率の概念を紹介する。
第三に、外部のオラクル情報がない場合には、収束を加速するために幾何を利用することと、最適性をほぼ確実に達成することとの間に本質的にトレードオフがあることが示される。
論文 参考訳(メタデータ) (2021-10-29T06:35:44Z) - Prioritized SIPP for Multi-Agent Path Finding With Kinematic Constraints [0.0]
MAPF(Multi-Agent Path Finding)は、ロボティクスと人工知能における長年の問題である。
この問題をある程度緩和する手法を提案する。
論文 参考訳(メタデータ) (2021-08-11T10:42:11Z) - Learning Space Partitions for Path Planning [54.475949279050596]
PlaLaMは2次元ナビゲーションタスクにおける既存の経路計画手法よりも優れており、特に難解な局所最適化の存在下では優れている。
これらは高マルチモーダルな実世界のタスクに移行し、コンパイラフェーズでは最大245%、分子設計では最大0.4の強いベースラインを0-1スケールで上回ります。
論文 参考訳(メタデータ) (2021-06-19T18:06:11Z) - RAPTOR: End-to-end Risk-Aware MDP Planning and Policy Learning by
Backpropagation [12.600828753197204]
PyTorch (RAP) を用いたリスクアウェアプランニング(リスクアウェアプランニング)を導入する。
本研究では, 非線形ナビゲーション, HVAC制御, 線形貯水池制御を含む3つの高次要素について, これら2種類のRAPTORを評価し, 比較した。
論文 参考訳(メタデータ) (2021-06-14T09:27:19Z) - Sparsification for Fast Optimal Multi-Robot Path Planning in Lazy
Compilation Schemes [7.766921168069532]
複数のロボット(MRPP)の経路計画は、ロボットが最初の位置から指定された目標位置までナビゲートできる非衝突経路を見つけるタスクを表します。
本稿では,既存の SAT ベースの MRPP アルゴリズムを,対象の Boolean 符号化を導出する各ロボットの候補経路の集合を分割することで拡張する。
論文 参考訳(メタデータ) (2021-03-08T00:57:42Z) - Adaptivity of Stochastic Gradient Methods for Nonconvex Optimization [71.03797261151605]
適応性は現代最適化理論において重要であるが、研究されていない性質である。
提案アルゴリズムは,PL目標に対して既存のアルゴリズムよりも優れた性能を保ちながら,PL目標に対して最適な収束性を実現することを実証した。
論文 参考訳(メタデータ) (2020-02-13T05:42:27Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。