論文の概要: Enhancing Robot Navigation Policies with Task-Specific Uncertainty Management
- arxiv url: http://arxiv.org/abs/2410.15178v2
- Date: Fri, 08 Nov 2024 15:22:26 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-11-11 14:52:40.342487
- Title: Enhancing Robot Navigation Policies with Task-Specific Uncertainty Management
- Title(参考訳): タスク特定不確実性管理によるロボットナビゲーションポリシーの強化
- Authors: Gokul Puthumanaillam, Paulo Padrao, Jose Fuentes, Leonardo Bobadilla, Melkior Ornik,
- Abstract要約: 本稿では,タスク固有の不確実性要件を直接ナビゲーションポリシーに統合するためのフレームワークを提案する。
TSMの条件付けポリシは,タスク固有の不確実性要求を効果的に表現する方法を提供する。
本稿では,GUIDEを強化学習フレームワークに統合することにより,明示的な報酬工学を必要とせずにナビゲーションポリシーを学習できることを示す。
- 参考スコア(独自算出の注目度): 1.614803913005309
- License:
- Abstract: Robots performing navigation tasks in complex environments face significant challenges due to uncertainty in state estimation. Effectively managing this uncertainty is crucial, but the optimal approach varies depending on the specific details of the task: different tasks require varying levels of precision in different regions of the environment. For instance, a robot navigating a crowded space might need precise localization near obstacles but can operate effectively with less precise state estimates in open areas. This varying need for certainty in different parts of the environment, depending on the task, calls for policies that can adapt their uncertainty management strategies based on task-specific requirements. In this paper, we present a framework for integrating task-specific uncertainty requirements directly into navigation policies. We introduce Task-Specific Uncertainty Map (TSUM), which represents acceptable levels of state estimation uncertainty across different regions of the operating environment for a given task. Using TSUM, we propose Generalized Uncertainty Integration for Decision-Making and Execution (GUIDE), a policy conditioning framework that incorporates these uncertainty requirements into the robot's decision-making process. We find that conditioning policies on TSUMs provides an effective way to express task-specific uncertainty requirements and enables the robot to reason about the context-dependent value of certainty. We show how integrating GUIDE into reinforcement learning frameworks allows the agent to learn navigation policies without the need for explicit reward engineering to balance task completion and uncertainty management. We evaluate GUIDE on a variety of real-world navigation tasks and find that it demonstrates significant improvements in task completion rates compared to baselines. Evaluation videos can be found at https://guided-agents.github.io.
- Abstract(参考訳): 複雑な環境でナビゲーションタスクを実行するロボットは、状態推定の不確実性のために重大な課題に直面している。
この不確実性を効果的に管理することは重要であるが、最適なアプローチはタスクの特定の詳細によって異なる。
例えば、混雑した空間をナビゲートするロボットは障害物の近くで正確な位置決めを必要とするかもしれないが、オープンエリアでの精度の低い状態推定で効果的に動作することができる。
このような環境の様々な部分における確実性の必要性は、タスクによって異なり、タスク固有の要求に基づいて、不確実性管理戦略に適応できるポリシーが求められます。
本稿では,タスク固有の不確実性要件を直接ナビゲーションポリシーに統合するためのフレームワークを提案する。
本研究では,あるタスクに対する動作環境の異なる領域における状態推定の不確かさの許容レベルを表すタスク特定不確実性マップ(TSM)を紹介する。
本研究では,これらの不確実性要件をロボットの意思決定プロセスに組み込んだ政策条件付けフレームワークGUIDEを提案する。
TSMの条件付けポリシは,タスク固有の不確実性要件を効果的に表現し,ロボットが確実性の文脈依存的価値を推論できるようにする。
本稿では,GUIDEを強化学習フレームワークに統合することにより,タスク完了と不確実性管理のバランスを取るために,明示的な報酬工学を必要とせずにナビゲーションポリシーを学習することができることを示す。
実世界の各種ナビゲーションタスクにおけるGUIDEを評価し,ベースラインと比較してタスク完了率を大幅に改善したことを示す。
評価ビデオはhttps://guided-agents.github.io.comで見ることができる。
関連論文リスト
- Interactive Agents to Overcome Ambiguity in Software Engineering [61.40183840499932]
AIエージェントは、あいまいで不明確なユーザー指示に基づいて、タスクを自動化するためにますますデプロイされている。
不安定な仮定をし、明確な質問をしないことは、最適以下の結果につながる可能性がある。
対話型コード生成設定において,LLMエージェントが不明瞭な命令を処理する能力について,プロプライエタリモデルとオープンウェイトモデルを評価して検討する。
論文 参考訳(メタデータ) (2025-02-18T17:12:26Z) - Adaptive Bi-Level Multi-Robot Task Allocation and Learning under Uncertainty with Temporal Logic Constraints [5.329682333337303]
この研究は、未知のロボット遷移モデルの下でのマルチロボット協調の問題に対処する。
本稿では,ハイレベルなタスクアロケーションと低レベルな分散ポリシ学習と実行を統合した双方向フレームワークを提案する。
提案アルゴリズムを理論的に検証し,課題割り当てが所望の確率閾値を高い信頼性で満たすことを示す。
論文 参考訳(メタデータ) (2025-02-14T10:39:21Z) - TAB-Fields: A Maximum Entropy Framework for Mission-Aware Adversarial Planning [2.4903631775244213]
我々は、既知の制約に整合した最も偏りのない確率分布を計算することにより、時間とともに敵状態の分布をキャプチャする表現を開発する。
我々は,TAB条件付きPOMCPを導入することで,TAB-Fieldsを標準計画アルゴリズムと統合する。
提案手法は,特定の敵政策を前提としたベースラインや,ミッション制約を完全に無視するベースラインと比較して,優れた性能を達成できることを実証する。
論文 参考訳(メタデータ) (2024-12-03T16:55:27Z) - Adaptformer: Sequence models as adaptive iterative planners [0.0]
マルチタスクミッションにおける意思決定は、自律システムにとって難しい問題である。
本稿では、サンプル効率の高い探索と利用のためにシーケンスモデルを利用する適応型プランナであるAdaptformerを提案する。
マルチゴール迷路到達性タスクにおいて,Adaptformerは最先端の手法よりも25%高い性能を示した。
論文 参考訳(メタデータ) (2024-11-30T00:34:41Z) - Task-Aware Harmony Multi-Task Decision Transformer for Offline Reinforcement Learning [70.96345405979179]
オフラインマルチタスク強化学習(MTRL)の目的は、オンライン環境相互作用を必要とせず、多様なタスクに適用可能な統一されたポリシーを開発することである。
タスクの内容と複雑さの変化は、政策の定式化において重大な課題を引き起こします。
本稿では,各タスクに対するパラメータの最適な調和部分空間を特定するための新しいソリューションであるHarmoDT(Harmony Multi-Task Decision Transformer)を紹介する。
論文 参考訳(メタデータ) (2024-11-02T05:49:14Z) - No Regrets: Investigating and Improving Regret Approximations for Curriculum Discovery [53.08822154199948]
非教師なし環境設計(UED)手法は、エージェントがイン・オブ・アウト・ディストリビューションタスクに対して堅牢になることを約束する適応的カリキュラムとして近年注目を集めている。
本研究は,既存のUEDメソッドがいかにトレーニング環境を選択するかを検討する。
本研究では,学習性の高いシナリオを直接訓練する手法を開発した。
論文 参考訳(メタデータ) (2024-08-27T14:31:54Z) - AI planning in the imagination: High-level planning on learned abstract
search spaces [68.75684174531962]
我々は,エージェントが訓練中に学習する抽象的な検索空間において,エージェントが計画することを可能にする,PiZeroと呼ばれる新しい手法を提案する。
本研究では,旅行セールスマン問題,ソコバン問題,2048年,施設立地問題,パックマン問題など,複数の分野で評価を行った。
論文 参考訳(メタデータ) (2023-08-16T22:47:16Z) - Uncertainty-Aware Task Allocation for Distributed Autonomous Robots [3.8182527724852244]
本稿では,分散自律ロボット(DAR)の状況認識における不確実性を伴うタスク配置問題に対処する。
タスク割り当てプロセス上の不確実性伝搬は、Sigma-Pointサンプリング機構を用いたUnscented変換を用いて行われる。
汎用的なタスク割り当てスキームに採用される可能性は非常に高い。
論文 参考訳(メタデータ) (2021-07-21T20:43:05Z) - MPTP: Motion-Planning-aware Task Planning for Navigation in Belief Space [1.3535770763481902]
大規模環境におけるナビゲーションのための統合型タスク・モーション・プランニング・フレームワークを提案する。
このフレームワークは、動作中の運動計画と感覚の不確かさを意図している。
論文 参考訳(メタデータ) (2021-04-10T06:52:16Z) - Adaptive Procedural Task Generation for Hard-Exploration Problems [78.20918366839399]
ハード探索問題における強化学習を容易にするために,適応手続きタスク生成(APT-Gen)を導入する。
私たちのアプローチの中心は、ブラックボックスの手続き生成モジュールを通じてパラメータ化されたタスク空間からタスクを作成することを学習するタスクジェネレータです。
学習進捗の直接指標がない場合のカリキュラム学習を可能にするために,生成したタスクにおけるエージェントのパフォーマンスと,対象タスクとの類似性をバランスさせてタスクジェネレータを訓練することを提案する。
論文 参考訳(メタデータ) (2020-07-01T09:38:51Z) - Guided Uncertainty-Aware Policy Optimization: Combining Learning and
Model-Based Strategies for Sample-Efficient Policy Learning [75.56839075060819]
従来のロボットのアプローチは、環境の正確なモデル、タスクの実行方法の詳細な説明、現在の状態を追跡するための堅牢な認識システムに依存している。
強化学習アプローチは、タスクを記述するための報酬信号だけで、生の感覚入力から直接操作することができるが、非常にサンプル非効率で脆弱である。
本研究では,ロボットの知覚・運動パイプラインにおける不正確さを克服できる一般的な手法を得るために,モデルに基づく手法の強みと学習に基づく手法の柔軟性を組み合わせる。
論文 参考訳(メタデータ) (2020-05-21T19:47:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。