論文の概要: Enhancing Robot Navigation Policies with Task-Specific Uncertainty Management
- arxiv url: http://arxiv.org/abs/2410.15178v2
- Date: Fri, 08 Nov 2024 15:22:26 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-11-11 14:52:40.342487
- Title: Enhancing Robot Navigation Policies with Task-Specific Uncertainty Management
- Title(参考訳): タスク特定不確実性管理によるロボットナビゲーションポリシーの強化
- Authors: Gokul Puthumanaillam, Paulo Padrao, Jose Fuentes, Leonardo Bobadilla, Melkior Ornik,
- Abstract要約: 本稿では,タスク固有の不確実性要件を直接ナビゲーションポリシーに統合するためのフレームワークを提案する。
TSMの条件付けポリシは,タスク固有の不確実性要求を効果的に表現する方法を提供する。
本稿では,GUIDEを強化学習フレームワークに統合することにより,明示的な報酬工学を必要とせずにナビゲーションポリシーを学習できることを示す。
- 参考スコア(独自算出の注目度): 1.614803913005309
- License:
- Abstract: Robots performing navigation tasks in complex environments face significant challenges due to uncertainty in state estimation. Effectively managing this uncertainty is crucial, but the optimal approach varies depending on the specific details of the task: different tasks require varying levels of precision in different regions of the environment. For instance, a robot navigating a crowded space might need precise localization near obstacles but can operate effectively with less precise state estimates in open areas. This varying need for certainty in different parts of the environment, depending on the task, calls for policies that can adapt their uncertainty management strategies based on task-specific requirements. In this paper, we present a framework for integrating task-specific uncertainty requirements directly into navigation policies. We introduce Task-Specific Uncertainty Map (TSUM), which represents acceptable levels of state estimation uncertainty across different regions of the operating environment for a given task. Using TSUM, we propose Generalized Uncertainty Integration for Decision-Making and Execution (GUIDE), a policy conditioning framework that incorporates these uncertainty requirements into the robot's decision-making process. We find that conditioning policies on TSUMs provides an effective way to express task-specific uncertainty requirements and enables the robot to reason about the context-dependent value of certainty. We show how integrating GUIDE into reinforcement learning frameworks allows the agent to learn navigation policies without the need for explicit reward engineering to balance task completion and uncertainty management. We evaluate GUIDE on a variety of real-world navigation tasks and find that it demonstrates significant improvements in task completion rates compared to baselines. Evaluation videos can be found at https://guided-agents.github.io.
- Abstract(参考訳): 複雑な環境でナビゲーションタスクを実行するロボットは、状態推定の不確実性のために重大な課題に直面している。
この不確実性を効果的に管理することは重要であるが、最適なアプローチはタスクの特定の詳細によって異なる。
例えば、混雑した空間をナビゲートするロボットは障害物の近くで正確な位置決めを必要とするかもしれないが、オープンエリアでの精度の低い状態推定で効果的に動作することができる。
このような環境の様々な部分における確実性の必要性は、タスクによって異なり、タスク固有の要求に基づいて、不確実性管理戦略に適応できるポリシーが求められます。
本稿では,タスク固有の不確実性要件を直接ナビゲーションポリシーに統合するためのフレームワークを提案する。
本研究では,あるタスクに対する動作環境の異なる領域における状態推定の不確かさの許容レベルを表すタスク特定不確実性マップ(TSM)を紹介する。
本研究では,これらの不確実性要件をロボットの意思決定プロセスに組み込んだ政策条件付けフレームワークGUIDEを提案する。
TSMの条件付けポリシは,タスク固有の不確実性要件を効果的に表現し,ロボットが確実性の文脈依存的価値を推論できるようにする。
本稿では,GUIDEを強化学習フレームワークに統合することにより,タスク完了と不確実性管理のバランスを取るために,明示的な報酬工学を必要とせずにナビゲーションポリシーを学習することができることを示す。
実世界の各種ナビゲーションタスクにおけるGUIDEを評価し,ベースラインと比較してタスク完了率を大幅に改善したことを示す。
評価ビデオはhttps://guided-agents.github.io.comで見ることができる。
関連論文リスト
- Task-Aware Harmony Multi-Task Decision Transformer for Offline Reinforcement Learning [70.96345405979179]
オフラインマルチタスク強化学習(MTRL)の目的は、オンライン環境相互作用を必要とせず、多様なタスクに適用可能な統一されたポリシーを開発することである。
タスクの内容と複雑さの変化は、政策の定式化において重大な課題を引き起こします。
本稿では,各タスクに対するパラメータの最適な調和部分空間を特定するための新しいソリューションであるHarmoDT(Harmony Multi-Task Decision Transformer)を紹介する。
論文 参考訳(メタデータ) (2024-11-02T05:49:14Z) - No Regrets: Investigating and Improving Regret Approximations for Curriculum Discovery [53.08822154199948]
非教師なし環境設計(UED)手法は、エージェントがイン・オブ・アウト・ディストリビューションタスクに対して堅牢になることを約束する適応的カリキュラムとして近年注目を集めている。
本研究は,既存のUEDメソッドがいかにトレーニング環境を選択するかを検討する。
本研究では,学習性の高いシナリオを直接訓練する手法を開発した。
論文 参考訳(メタデータ) (2024-08-27T14:31:54Z) - Uncertainty-Aware Task Allocation for Distributed Autonomous Robots [3.8182527724852244]
本稿では,分散自律ロボット(DAR)の状況認識における不確実性を伴うタスク配置問題に対処する。
タスク割り当てプロセス上の不確実性伝搬は、Sigma-Pointサンプリング機構を用いたUnscented変換を用いて行われる。
汎用的なタスク割り当てスキームに採用される可能性は非常に高い。
論文 参考訳(メタデータ) (2021-07-21T20:43:05Z) - Estimating Disentangled Belief about Hidden State and Hidden Task for
Meta-RL [27.78147889149745]
メタ強化学習(メタRL)アルゴリズムにより、自律エージェントは少量の経験から新しいタスクを適応できます。
meta-rlでは、現在のタスクの仕様(報酬関数など)がエージェントから隠されている。
タスクと状態に対する偏りのある信念を推定し、タスクと状態が各タスクのグローバルおよびローカルの特徴とみなすことができるという帰納バイアスを活用します。
論文 参考訳(メタデータ) (2021-05-14T06:11:36Z) - MPTP: Motion-Planning-aware Task Planning for Navigation in Belief Space [1.3535770763481902]
大規模環境におけるナビゲーションのための統合型タスク・モーション・プランニング・フレームワークを提案する。
このフレームワークは、動作中の運動計画と感覚の不確かさを意図している。
論文 参考訳(メタデータ) (2021-04-10T06:52:16Z) - Policy Information Capacity: Information-Theoretic Measure for Task
Complexity in Deep Reinforcement Learning [83.66080019570461]
課題の難易度について,環境にとらわれない,アルゴリズムにとらわれない2つの定量的指標を提案する。
これらの指標は、様々な代替案よりも、正規化タスク可解性スコアとの相関が高いことを示す。
これらのメトリクスは、鍵設計パラメータの高速かつ計算効率の良い最適化にも使用できる。
論文 参考訳(メタデータ) (2021-03-23T17:49:50Z) - One Solution is Not All You Need: Few-Shot Extrapolation via Structured
MaxEnt RL [142.36621929739707]
課題を達成するために多様な行動を学ぶことは、様々な環境に一般化する行動を引き起こす可能性があることを示す。
トレーニング中の1つの環境でタスクの複数のソリューションを識別することにより、我々のアプローチは新たな状況に一般化できる。
論文 参考訳(メタデータ) (2020-10-27T17:41:57Z) - Adaptive Procedural Task Generation for Hard-Exploration Problems [78.20918366839399]
ハード探索問題における強化学習を容易にするために,適応手続きタスク生成(APT-Gen)を導入する。
私たちのアプローチの中心は、ブラックボックスの手続き生成モジュールを通じてパラメータ化されたタスク空間からタスクを作成することを学習するタスクジェネレータです。
学習進捗の直接指標がない場合のカリキュラム学習を可能にするために,生成したタスクにおけるエージェントのパフォーマンスと,対象タスクとの類似性をバランスさせてタスクジェネレータを訓練することを提案する。
論文 参考訳(メタデータ) (2020-07-01T09:38:51Z) - Guided Uncertainty-Aware Policy Optimization: Combining Learning and
Model-Based Strategies for Sample-Efficient Policy Learning [75.56839075060819]
従来のロボットのアプローチは、環境の正確なモデル、タスクの実行方法の詳細な説明、現在の状態を追跡するための堅牢な認識システムに依存している。
強化学習アプローチは、タスクを記述するための報酬信号だけで、生の感覚入力から直接操作することができるが、非常にサンプル非効率で脆弱である。
本研究では,ロボットの知覚・運動パイプラインにおける不正確さを克服できる一般的な手法を得るために,モデルに基づく手法の強みと学習に基づく手法の柔軟性を組み合わせる。
論文 参考訳(メタデータ) (2020-05-21T19:47:05Z) - Scalable Uncertainty for Computer Vision with Functional Variational
Inference [18.492485304537134]
関数空間における変分推論の定式化を利用する。
選択したCNNアーキテクチャを1つのフォワードパスのコストで予測不確実性を推定する。
本研究では,高次元タスクの文脈で高速な学習を可能にする数値的アルゴリズムを提案する。
論文 参考訳(メタデータ) (2020-03-06T19:09:42Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。