論文の概要: Adaptive Selection of Informative Path Planning Strategies via
Reinforcement Learning
- arxiv url: http://arxiv.org/abs/2108.06618v1
- Date: Sat, 14 Aug 2021 21:32:33 GMT
- ステータス: 処理完了
- システム内更新日: 2021-08-17 15:21:01.207179
- Title: Adaptive Selection of Informative Path Planning Strategies via
Reinforcement Learning
- Title(参考訳): 強化学習による情報経路計画戦略の適応的選択
- Authors: Taeyeong Choi, Grzegorz Cielniak
- Abstract要約: ローカルプランニング」アプローチでは,次回のサンプリング場所の優先順位が予測性能や帰路距離に与える影響を調査するために,様々な空間範囲が採用されている。
温度モニタリングロボットの使用事例実験により、プランナーの動的混合物は高度な情報プランを生成できるだけでなく、予測信頼性を犠牲にすることなく、大幅に距離を縮めることができることが示された。
- 参考スコア(独自算出の注目度): 6.015556590955814
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In our previous work, we designed a systematic policy to prioritize sampling
locations to lead significant accuracy improvement in spatial interpolation by
using the prediction uncertainty of Gaussian Process Regression (GPR) as
"attraction force" to deployed robots in path planning. Although the
integration with Traveling Salesman Problem (TSP) solvers was also shown to
produce relatively short travel distance, we here hypothesise several factors
that could decrease the overall prediction precision as well because
sub-optimal locations may eventually be included in their paths. To address
this issue, in this paper, we first explore "local planning" approaches
adopting various spatial ranges within which next sampling locations are
prioritized to investigate their effects on the prediction performance as well
as incurred travel distance. Also, Reinforcement Learning (RL)-based high-level
controllers are trained to adaptively produce blended plans from a particular
set of local planners to inherit unique strengths from that selection depending
on latest prediction states. Our experiments on use cases of temperature
monitoring robots demonstrate that the dynamic mixtures of planners can not
only generate sophisticated, informative plans that a single planner could not
create alone but also ensure significantly reduced travel distances at no cost
of prediction reliability without any assist of additional modules for shortest
path calculation.
- Abstract(参考訳): 従来の研究では,gaussian process regression (gpr) の予測の不確かさを経路計画におけるロボットの"引き込み力"として用いることで,空間補間の大幅な精度向上を導くためにサンプリング位置を優先する体系的な方針を考案した。
また, トラベリングセールスマン問題 (TSP) と統合することで, 比較的短い走行距離が得られたが, 最終的には準最適位置が経路に含まれるため, 全体の予測精度を低下させる要因がいくつか考えられる。
そこで,本稿ではまず,次のサンプリング位置が優先される様々な空間範囲を取り入れた「ローカルプランニング」アプローチについて検討し,予測性能および帰路距離への影響について検討する。
また、Reinforcement Learning (RL)ベースのハイレベルコントローラは、特定のローカルプランナーセットからブレンドプランを適応的に作成するように訓練され、最新の予測状態に応じてその選択から独自の強みを継承する。
本研究は, 温度モニタリングロボットを用いた実験により, プランナーの動的混合により, 単一のプランナーが単独で作成できない高度な情報プランを生成するだけでなく, 最短経路計算のための追加モジュールを必要とせず, 予測信頼性の犠牲なしに, 大幅に短縮された走行距離を保証できることを示した。
関連論文リスト
- Experiment Planning with Function Approximation [49.50254688629728]
本研究では,文脈的帯域幅問題における関数近似を用いた実験計画の問題点について検討する。
本稿では,関数近似に適合する2つの実験計画戦略を提案する。
そこで, 均一サンプリング器は, 動作数が少ない設定において, 競合最適性を達成できることを示す。
論文 参考訳(メタデータ) (2024-01-10T14:40:23Z) - Interactive Joint Planning for Autonomous Vehicles [19.479300967537675]
対話的な運転シナリオでは、あるエージェントの行動が隣人の行動に大きな影響を及ぼす。
本稿では,MPCを学習予測モデルでブリッジする対話型共同計画(Interactive Joint Planning, IJP)を提案する。
IJPは、共同最適化やサンプリングベースの計画を実行することなく、ベースラインを大幅に上回る。
論文 参考訳(メタデータ) (2023-10-27T17:48:25Z) - Learning-Initialized Trajectory Planning in Unknown Environments [4.2960463890487555]
未知の環境での自律飛行の計画には、空間軌道と時間軌道の両方を正確に計画する必要がある。
本稿ではニューラルdトラジェクトリ・プランナーを用いて最適化を導く新しい手法を提案する。
遅延計画に対する耐性を持って、堅牢なオンラインリプランニングをサポートするフレームワークを提案する。
論文 参考訳(メタデータ) (2023-09-19T15:07:26Z) - Trajectory Test-Train Overlap in Next-Location Prediction Datasets [5.039138978031649]
次の位置予測は、都市計画、ジオマーケティング、病気の普及など、いくつかの分野で重要な意味を持つ。
本稿では,これらの予測器の公共モビリティデータセット上での一般化能力を検証した。
本研究では,空間移動パターンに基づく次位置予測器の出力を再現する手法を提案する。
論文 参考訳(メタデータ) (2022-03-07T08:39:45Z) - Trajectory Forecasting from Detection with Uncertainty-Aware Motion
Encoding [121.66374635092097]
物体検出と追跡から得られる軌道は、必然的にうるさい。
本稿では, 明示的に形成された軌道に依存することなく, 直接検出結果に基づく軌道予測器を提案する。
論文 参考訳(メタデータ) (2022-02-03T09:09:56Z) - Differentiable Spatial Planning using Transformers [87.90709874369192]
本研究では、長距離空間依存を計画して行動を生成する障害マップを与えられた空間計画変換器(SPT)を提案する。
エージェントが地上の真理マップを知らない環境では、エンド・ツー・エンドのフレームワークで事前訓練されたSPTを利用する。
SPTは、操作タスクとナビゲーションタスクの両方のすべてのセットアップにおいて、最先端の差別化可能なプランナーよりも優れています。
論文 参考訳(メタデータ) (2021-12-02T06:48:16Z) - Reinforcement Learning for Low-Thrust Trajectory Design of
Interplanetary Missions [77.34726150561087]
本稿では, 惑星間軌道のロバスト設計における強化学習の適用について検討する。
最先端アルゴリズムのオープンソース実装が採用されている。
その結果得られた誘導制御ネットワークは、堅牢な名目的軌道と関連する閉ループ誘導法の両方を提供する。
論文 参考訳(メタデータ) (2020-08-19T15:22:15Z) - Long-Horizon Visual Planning with Goal-Conditioned Hierarchical
Predictors [124.30562402952319]
未来に予測し、計画する能力は、世界で行動するエージェントにとって基本である。
視覚的予測と計画のための現在の学習手法は、長期的タスクでは失敗する。
本稿では,これらの制約を克服可能な視覚的予測と計画のためのフレームワークを提案する。
論文 参考訳(メタデータ) (2020-06-23T17:58:56Z) - The Importance of Prior Knowledge in Precise Multimodal Prediction [71.74884391209955]
道路にはよく定義された地形、地形、交通規則がある。
本稿では,構造的事前を損失関数として組み込むことを提案する。
実世界の自動運転データセットにおけるアプローチの有効性を実証する。
論文 参考訳(メタデータ) (2020-06-04T03:56:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。