論文の概要: Lazy Probabilistic Roadmaps Revisited
- arxiv url: http://arxiv.org/abs/2209.14471v1
- Date: Wed, 28 Sep 2022 23:38:08 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-30 17:47:36.028790
- Title: Lazy Probabilistic Roadmaps Revisited
- Title(参考訳): 遅延確率的ロードマップの再検討
- Authors: Miquel Ramirez, Daniel Selvaratnam, Chris Manzie
- Abstract要約: 古典的遅延確率ロードマップアルゴリズム (Lazy PRM) を改訂する。
カットは、最小のコストパスに課される動的に生成された制約である。
計画は、最近提案されたアルゴリズムで検証され、有限のトレースにマッピングされる。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This paper describes a revision of the classic Lazy Probabilistic Roadmaps
algorithm (Lazy PRM), that results from pairing PRM and a novel Branch-and-Cut
(BC) algorithm. Cuts are dynamically generated constraints that are imposed on
minimum cost paths over the geometric graphs selected by PRM. Cuts eliminate
paths that cannot be mapped into smooth plans that satisfy suitably defined
kinematic constraints. We generate candidate smooth plans by fitting splines to
vertices in minimum-cost path. Plans are validated with a recently proposed
algorithm that maps them into finite traces, without need to choose a fixed
discretization step. Trace elements exactly describe when plans cross
constraint boundaries modulo arithmetic precision. We evaluate several planners
using our methods over the recently proposed BARN benchmark, and we report
evidence of the scalability of our approach.
- Abstract(参考訳): 本稿では,従来の遅延確率的ロードマップアルゴリズム(Lazy PRM)の改訂について述べる。
カットは、PRMによって選択された幾何グラフに対して最小のコストパスに課される動的に生成される制約である。
カットは、適切に定義されたキネマティック制約を満たす滑らかな計画にマッピングできないパスを排除する。
最小コスト経路の頂点にスプラインを組み込むことにより, 候補平滑な計画を生成する。
計画は、固定的な離散化ステップを選択することなく、それらを有限トレースにマッピングする最近提案されたアルゴリズムで検証される。
トレース要素は、計画が制約境界を超えたときに正確に記述される。
今回提案するbarnベンチマークより,提案手法を用いたプランナー数名の評価を行い,提案手法のスケーラビリティのエビデンスを報告する。
関連論文リスト
- Learning Infinite-Horizon Average-Reward Linear Mixture MDPs of Bounded Span [16.49229317664822]
本稿では,無限水平平均逆線形混合マルコフ決定過程(MDPs)を学習するための計算抽出可能なアルゴリズムを提案する。
線形混合MDPのアルゴリズムは,$widetildemathcalO(dsqrtmathrmsp(v*)T)$$$T$以上の最小限の後悔上限を実現する。
論文 参考訳(メタデータ) (2024-10-19T05:45:50Z) - Nearly Minimax Optimal Regret for Learning Linear Mixture Stochastic
Shortest Path [80.60592344361073]
線形混合遷移カーネルを用いた最短経路(SSP)問題について検討する。
エージェントは繰り返し環境と対話し、累積コストを最小化しながら特定の目標状態に到達する。
既存の作業は、イテレーションコスト関数の厳密な下限や、最適ポリシーに対する期待長の上限を仮定することが多い。
論文 参考訳(メタデータ) (2024-02-14T07:52:00Z) - Optimal Horizon-Free Reward-Free Exploration for Linear Mixture MDPs [60.40452803295326]
線形マルコフ決定過程(MDP)を学習するための新たな報酬なしアルゴリズムを提案する。
我々のアルゴリズムの核心は、探索駆動の擬似回帰を用いた不確実性重み付き値目標回帰である。
我々のアルゴリズムは$tilde O(d2varepsilon-2)$ episodesを探索するだけで、$varepsilon$-optimal policyを見つけることができる。
論文 参考訳(メタデータ) (2023-03-17T17:53:28Z) - Best Policy Identification in Linear MDPs [70.57916977441262]
縮退した線形マルコフ+デルタ決定における最適同定問題について, 生成モデルに基づく固定信頼度設定における検討を行った。
複雑な非最適化プログラムの解としての下位境界は、そのようなアルゴリズムを考案する出発点として用いられる。
論文 参考訳(メタデータ) (2022-08-11T04:12:50Z) - Unfolding Projection-free SDP Relaxation of Binary Graph Classifier via
GDPA Linearization [59.87663954467815]
アルゴリズムの展開は、モデルベースのアルゴリズムの各イテレーションをニューラルネットワーク層として実装することにより、解釈可能で類似のニューラルネットワークアーキテクチャを生成する。
本稿では、Gershgorin disc perfect alignment (GDPA)と呼ばれる最近の線形代数定理を利用して、二進グラフの半定値プログラミング緩和(SDR)のためのプロジェクションフリーアルゴリズムをアンロールする。
実験結果から,我々の未学習ネットワークは純粋モデルベースグラフ分類器よりも優れ,純粋データ駆動ネットワークに匹敵する性能を示したが,パラメータははるかに少なかった。
論文 参考訳(メタデータ) (2021-09-10T07:01:15Z) - Navigating to the Best Policy in Markov Decision Processes [68.8204255655161]
マルコフ決定過程における純粋探索問題について検討する。
エージェントはアクションを逐次選択し、結果のシステム軌道から可能な限り早くベストを目標とする。
論文 参考訳(メタデータ) (2021-06-05T09:16:28Z) - Symmetry Breaking for k-Robust Multi-Agent Path Finding [30.645303869311366]
k-Robust Conflict-BasedSearch (k-CBS)は、最大k遅延のロバストな座標と衝突のない計画を生成するアルゴリズムです。
そこで我々は,k-robust計画に特有な様々な対称性の破れ制約を導入し,矛盾するエージェントのペアに対して,効率よく相反する最適経路を見つける。
論文 参考訳(メタデータ) (2021-02-17T11:09:33Z) - Minimum projective linearizations of trees in linear time [0.12289361708127873]
我々は、$O(n)$時間で疑いなく実行される射影的および平面的ケースに対して単純なアルゴリズムを導出する。
また、射影に制約のあるルート木の線形配置についても検討する。
論文 参考訳(メタデータ) (2021-02-05T16:35:38Z) - Efficient Learning in Non-Stationary Linear Markov Decision Processes [17.296084954104415]
非定常線形(低ランク)マルコフ決定過程(MDP)におけるエピソード強化学習の研究
OPT-WLSVI は最小二乗の重み付け値に基づく楽観的なモデルフリーのアルゴリズムであり、指数重み付けを用いて過去のデータをスムーズに忘れる。
我々のアルゴリズムは、各時点で最高のポリシーと競合するときに、$d$$$widetildemathcalO(d5/4H2 Delta1/4 K3/4)$で上限付けられた後悔を実現する。
論文 参考訳(メタデータ) (2020-10-24T11:02:45Z) - Nearly Dimension-Independent Sparse Linear Bandit over Small Action
Spaces via Best Subset Selection [71.9765117768556]
本研究では,高次元線形モデルの下での文脈的帯域問題について考察する。
この設定は、パーソナライズされたレコメンデーション、オンライン広告、パーソナライズされた医療など、不可欠な応用を見出す。
本稿では,最適部分集合選択法を用いて2重成長エポックを推定する手法を提案する。
論文 参考訳(メタデータ) (2020-09-04T04:10:39Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。