論文の概要: GUIDEd Agents: Enhancing Navigation Policies through Task-Specific Uncertainty Abstraction in Localization-Limited Environments
- arxiv url: http://arxiv.org/abs/2410.15178v3
- Date: Mon, 03 Feb 2025 04:57:52 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-02-04 16:05:45.108025
- Title: GUIDEd Agents: Enhancing Navigation Policies through Task-Specific Uncertainty Abstraction in Localization-Limited Environments
- Title(参考訳): GUIDEdエージェント:局部化制限環境におけるタスク特異的不確実性抽象化によるナビゲーションポリシーの強化
- Authors: Gokul Puthumanaillam, Paulo Padrao, Jose Fuentes, Leonardo Bobadilla, Melkior Ornik,
- Abstract要約: 本稿では,タスク固有の不確実性要件を直接ナビゲーションポリシーに統合する計画手法を提案する。
本稿では,これらの不確実性要件をロボットの意思決定に組み込んだ政策条件付けフレームワークGUIDEを提案する。
本稿では,GUIDEを強化学習フレームワークに組み込むことで,作業完了と不確実性管理を明確な報奨エンジニアリングなしで効果的にバランスするナビゲーションポリシーを学習することができることを示す。
- 参考スコア(独自算出の注目度): 1.614803913005309
- License:
- Abstract: Autonomous vehicles performing navigation tasks in complex environments face significant challenges due to uncertainty in state estimation. In many scenarios, such as stealth operations or resource-constrained settings, accessing high-precision localization comes at a significant cost, forcing robots to rely primarily on less precise state estimates. Our key observation is that different tasks require varying levels of precision in different regions: a robot navigating a crowded space might need precise localization near obstacles but can operate effectively with less precision elsewhere. In this paper, we present a planning method for integrating task-specific uncertainty requirements directly into navigation policies. We introduce Task-Specific Uncertainty Maps (TSUMs), which abstract the acceptable levels of state estimation uncertainty across different regions. TSUMs align task requirements and environmental features using a shared representation space, generated via a domain-adapted encoder. Using TSUMs, we propose Generalized Uncertainty Integration for Decision-Making and Execution (GUIDE), a policy conditioning framework that incorporates these uncertainty requirements into robot decision-making. We find that TSUMs provide an effective way to abstract task-specific uncertainty requirements, and conditioning policies on TSUMs enables the robot to reason about the context-dependent value of certainty and adapt its behavior accordingly. We show how integrating GUIDE into reinforcement learning frameworks allows the agent to learn navigation policies that effectively balance task completion and uncertainty management without explicit reward engineering. We evaluate GUIDE on various real-world robotic navigation tasks and find that it demonstrates significant improvement in task completion rates compared to baseline methods that do not explicitly consider task-specific uncertainty.
- Abstract(参考訳): 複雑な環境でナビゲーションタスクを実行する自律車両は、状態推定の不確実性のために重大な課題に直面している。
ステルス操作やリソース制約のある設定など、多くのシナリオでは、高精度なローカライゼーションへのアクセスにはかなりのコストがかかるため、ロボットは主に精度の低い状態推定に頼らざるを得ない。
混雑した空間をナビゲートするロボットは障害物の近くで正確な位置決めを必要とするかもしれないが、他の場所ではより少ない精度で効果的に動作することができる。
本稿では,タスク固有の不確実性要件を直接ナビゲーションポリシーに統合する計画手法を提案する。
本研究では,各領域で許容される状態推定の不確実性レベルを抽象化するタスク特化不確実性マップ(TSMs)を提案する。
TSMは、ドメイン適応エンコーダを介して生成された共有表現空間を使用して、タスク要求と環境特徴を調整します。
本稿では,これらの不確実性要件をロボットの意思決定に組み込んだ政策条件付けフレームワークである汎用不確実性統合(GUIDE)を提案する。
TSMはタスク固有の不確実性要件を抽象化する効果的な方法であり、TSMの条件付けポリシーにより、ロボットは確実性の文脈依存的な価値を推論し、その振る舞いを順応することができる。
本稿では,GUIDEを強化学習フレームワークに組み込むことで,作業完了と不確実性管理を明確な報奨エンジニアリングなしで効果的にバランスするナビゲーションポリシーを学習することができることを示す。
実世界のロボットナビゲーションタスクにおけるGUIDEを評価し,タスク固有の不確実性を明示的に考慮しないベースライン手法と比較して,タスク完了率を著しく向上させることを示した。
関連論文リスト
- Interactive Agents to Overcome Ambiguity in Software Engineering [61.40183840499932]
AIエージェントは、あいまいで不明確なユーザー指示に基づいて、タスクを自動化するためにますますデプロイされている。
不安定な仮定をし、明確な質問をしないことは、最適以下の結果につながる可能性がある。
対話型コード生成設定において,LLMエージェントが不明瞭な命令を処理する能力について,プロプライエタリモデルとオープンウェイトモデルを評価して検討する。
論文 参考訳(メタデータ) (2025-02-18T17:12:26Z) - Adaptive Bi-Level Multi-Robot Task Allocation and Learning under Uncertainty with Temporal Logic Constraints [5.329682333337303]
この研究は、未知のロボット遷移モデルの下でのマルチロボット協調の問題に対処する。
本稿では,ハイレベルなタスクアロケーションと低レベルな分散ポリシ学習と実行を統合した双方向フレームワークを提案する。
提案アルゴリズムを理論的に検証し,課題割り当てが所望の確率閾値を高い信頼性で満たすことを示す。
論文 参考訳(メタデータ) (2025-02-14T10:39:21Z) - TAB-Fields: A Maximum Entropy Framework for Mission-Aware Adversarial Planning [2.4903631775244213]
我々は、既知の制約に整合した最も偏りのない確率分布を計算することにより、時間とともに敵状態の分布をキャプチャする表現を開発する。
我々は,TAB条件付きPOMCPを導入することで,TAB-Fieldsを標準計画アルゴリズムと統合する。
提案手法は,特定の敵政策を前提としたベースラインや,ミッション制約を完全に無視するベースラインと比較して,優れた性能を達成できることを実証する。
論文 参考訳(メタデータ) (2024-12-03T16:55:27Z) - Adaptformer: Sequence models as adaptive iterative planners [0.0]
マルチタスクミッションにおける意思決定は、自律システムにとって難しい問題である。
本稿では、サンプル効率の高い探索と利用のためにシーケンスモデルを利用する適応型プランナであるAdaptformerを提案する。
マルチゴール迷路到達性タスクにおいて,Adaptformerは最先端の手法よりも25%高い性能を示した。
論文 参考訳(メタデータ) (2024-11-30T00:34:41Z) - Task-Aware Harmony Multi-Task Decision Transformer for Offline Reinforcement Learning [70.96345405979179]
オフラインマルチタスク強化学習(MTRL)の目的は、オンライン環境相互作用を必要とせず、多様なタスクに適用可能な統一されたポリシーを開発することである。
タスクの内容と複雑さの変化は、政策の定式化において重大な課題を引き起こします。
本稿では,各タスクに対するパラメータの最適な調和部分空間を特定するための新しいソリューションであるHarmoDT(Harmony Multi-Task Decision Transformer)を紹介する。
論文 参考訳(メタデータ) (2024-11-02T05:49:14Z) - No Regrets: Investigating and Improving Regret Approximations for Curriculum Discovery [53.08822154199948]
非教師なし環境設計(UED)手法は、エージェントがイン・オブ・アウト・ディストリビューションタスクに対して堅牢になることを約束する適応的カリキュラムとして近年注目を集めている。
本研究は,既存のUEDメソッドがいかにトレーニング環境を選択するかを検討する。
本研究では,学習性の高いシナリオを直接訓練する手法を開発した。
論文 参考訳(メタデータ) (2024-08-27T14:31:54Z) - AI planning in the imagination: High-level planning on learned abstract
search spaces [68.75684174531962]
我々は,エージェントが訓練中に学習する抽象的な検索空間において,エージェントが計画することを可能にする,PiZeroと呼ばれる新しい手法を提案する。
本研究では,旅行セールスマン問題,ソコバン問題,2048年,施設立地問題,パックマン問題など,複数の分野で評価を行った。
論文 参考訳(メタデータ) (2023-08-16T22:47:16Z) - Uncertainty-Aware Task Allocation for Distributed Autonomous Robots [3.8182527724852244]
本稿では,分散自律ロボット(DAR)の状況認識における不確実性を伴うタスク配置問題に対処する。
タスク割り当てプロセス上の不確実性伝搬は、Sigma-Pointサンプリング機構を用いたUnscented変換を用いて行われる。
汎用的なタスク割り当てスキームに採用される可能性は非常に高い。
論文 参考訳(メタデータ) (2021-07-21T20:43:05Z) - MPTP: Motion-Planning-aware Task Planning for Navigation in Belief Space [1.3535770763481902]
大規模環境におけるナビゲーションのための統合型タスク・モーション・プランニング・フレームワークを提案する。
このフレームワークは、動作中の運動計画と感覚の不確かさを意図している。
論文 参考訳(メタデータ) (2021-04-10T06:52:16Z) - Adaptive Procedural Task Generation for Hard-Exploration Problems [78.20918366839399]
ハード探索問題における強化学習を容易にするために,適応手続きタスク生成(APT-Gen)を導入する。
私たちのアプローチの中心は、ブラックボックスの手続き生成モジュールを通じてパラメータ化されたタスク空間からタスクを作成することを学習するタスクジェネレータです。
学習進捗の直接指標がない場合のカリキュラム学習を可能にするために,生成したタスクにおけるエージェントのパフォーマンスと,対象タスクとの類似性をバランスさせてタスクジェネレータを訓練することを提案する。
論文 参考訳(メタデータ) (2020-07-01T09:38:51Z) - Guided Uncertainty-Aware Policy Optimization: Combining Learning and
Model-Based Strategies for Sample-Efficient Policy Learning [75.56839075060819]
従来のロボットのアプローチは、環境の正確なモデル、タスクの実行方法の詳細な説明、現在の状態を追跡するための堅牢な認識システムに依存している。
強化学習アプローチは、タスクを記述するための報酬信号だけで、生の感覚入力から直接操作することができるが、非常にサンプル非効率で脆弱である。
本研究では,ロボットの知覚・運動パイプラインにおける不正確さを克服できる一般的な手法を得るために,モデルに基づく手法の強みと学習に基づく手法の柔軟性を組み合わせる。
論文 参考訳(メタデータ) (2020-05-21T19:47:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。