Fugu-MT 論文翻訳(概要): GUIDEd Agents: Enhancing Navigation Policies through Task-Specific Uncertainty Abstraction in Localization-Limited Environments

論文の概要: GUIDEd Agents: Enhancing Navigation Policies through Task-Specific Uncertainty Abstraction in Localization-Limited Environments

arxiv url: http://arxiv.org/abs/2410.15178v3
Date: Mon, 03 Feb 2025 04:57:52 GMT
ステータス: 翻訳完了
システム内更新日: 2025-02-04 15:57:53.288423
Title: GUIDEd Agents: Enhancing Navigation Policies through Task-Specific Uncertainty Abstraction in Localization-Limited Environments
Title（参考訳）: GUIDEdエージェント:局部化制限環境におけるタスク特異的不確実性抽象化によるナビゲーションポリシーの強化
Authors: Gokul Puthumanaillam, Paulo Padrao, Jose Fuentes, Leonardo Bobadilla, Melkior Ornik,
Abstract要約: 本稿では,タスク固有の不確実性要件を直接ナビゲーションポリシーに統合する計画手法を提案する。本稿では,これらの不確実性要件をロボットの意思決定に組み込んだ政策条件付けフレームワークGUIDEを提案する。本稿では,GUIDEを強化学習フレームワークに組み込むことで,作業完了と不確実性管理を明確な報奨エンジニアリングなしで効果的にバランスするナビゲーションポリシーを学習することができることを示す。
参考スコア（独自算出の注目度）: 1.614803913005309
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Autonomous vehicles performing navigation tasks in complex environments face significant challenges due to uncertainty in state estimation. In many scenarios, such as stealth operations or resource-constrained settings, accessing high-precision localization comes at a significant cost, forcing robots to rely primarily on less precise state estimates. Our key observation is that different tasks require varying levels of precision in different regions: a robot navigating a crowded space might need precise localization near obstacles but can operate effectively with less precision elsewhere. In this paper, we present a planning method for integrating task-specific uncertainty requirements directly into navigation policies. We introduce Task-Specific Uncertainty Maps (TSUMs), which abstract the acceptable levels of state estimation uncertainty across different regions. TSUMs align task requirements and environmental features using a shared representation space, generated via a domain-adapted encoder. Using TSUMs, we propose Generalized Uncertainty Integration for Decision-Making and Execution (GUIDE), a policy conditioning framework that incorporates these uncertainty requirements into robot decision-making. We find that TSUMs provide an effective way to abstract task-specific uncertainty requirements, and conditioning policies on TSUMs enables the robot to reason about the context-dependent value of certainty and adapt its behavior accordingly. We show how integrating GUIDE into reinforcement learning frameworks allows the agent to learn navigation policies that effectively balance task completion and uncertainty management without explicit reward engineering. We evaluate GUIDE on various real-world robotic navigation tasks and find that it demonstrates significant improvement in task completion rates compared to baseline methods that do not explicitly consider task-specific uncertainty.
Abstract（参考訳）: 複雑な環境でナビゲーションタスクを実行する自律車両は、状態推定の不確実性のために重大な課題に直面している。ステルス操作やリソース制約のある設定など、多くのシナリオでは、高精度なローカライゼーションへのアクセスにはかなりのコストがかかるため、ロボットは主に精度の低い状態推定に頼らざるを得ない。混雑した空間をナビゲートするロボットは障害物の近くで正確な位置決めを必要とするかもしれないが、他の場所ではより少ない精度で効果的に動作することができる。本稿では,タスク固有の不確実性要件を直接ナビゲーションポリシーに統合する計画手法を提案する。本研究では,各領域で許容される状態推定の不確実性レベルを抽象化するタスク特化不確実性マップ(TSMs)を提案する。 TSMは、ドメイン適応エンコーダを介して生成された共有表現空間を使用して、タスク要求と環境特徴を調整します。本稿では,これらの不確実性要件をロボットの意思決定に組み込んだ政策条件付けフレームワークである汎用不確実性統合(GUIDE)を提案する。 TSMはタスク固有の不確実性要件を抽象化する効果的な方法であり、TSMの条件付けポリシーにより、ロボットは確実性の文脈依存的な価値を推論し、その振る舞いを順応することができる。本稿では,GUIDEを強化学習フレームワークに組み込むことで,作業完了と不確実性管理を明確な報奨エンジニアリングなしで効果的にバランスするナビゲーションポリシーを学習することができることを示す。実世界のロボットナビゲーションタスクにおけるGUIDEを評価し,タスク固有の不確実性を明示的に考慮しないベースライン手法と比較して,タスク完了率を著しく向上させることを示した。

関連論文リスト

When to Act, Ask, or Learn: Uncertainty-Aware Policy Steering [10.01278648231868]
ポリシーステアリングは、デプロイ時にロボットの振る舞いを適用する新しい方法です。 VLM(Vision-Language Models)は、それらの推論能力のために、汎用的な検証を約束する。セマンティックタスクの不確実性と低レベルのアクション実現可能性について共同で理由づけるフレームワークである不確実性対応型ポリシーステアリング(UPS)を提案する。
論文参考訳（メタデータ） (2026-02-25T23:23:22Z)
What Do LLM Agents Know About Their World? Task2Quiz: A Paradigm for Studying Environment Understanding [50.35012849818872]
大規模言語モデル(LLM)エージェントは、複雑な意思決定やツール使用タスクにおいて顕著な能力を示した。本研究では,タスク実行と世界状態理解の分離を目的とした決定論的かつ自動評価パラダイムであるTask-to-Quiz(T2Q)を提案する。実験の結果,タスク成功は環境理解の指標として不十分な場合が多く,現在の記憶機構はエージェントが環境の基底モデルを取得するのに有効ではないことが明らかとなった。
論文参考訳（メタデータ） (2026-01-14T14:09:11Z)
Situationally-Aware Dynamics Learning [57.698553219660376]
隠れ状態表現のオンライン学習のための新しいフレームワークを提案する。提案手法は、非観測パラメータが遷移力学と報酬構造の両方に与える影響を明示的にモデル化する。シミュレーションと実世界の両方の実験は、データ効率、ポリシー性能、安全で適応的なナビゲーション戦略の出現を著しく改善した。
論文参考訳（メタデータ） (2025-05-26T06:40:11Z)
Enhancing Robot Navigation Policies with Task-Specific Uncertainty Managements [1.614803913005309]
タスク特化不確実性マップ(TSM)を用いたナビゲーションポリシーにタスク特化要求を統合するGUIDEを提案する。 TSMは、異なる場所に許容される不確実性レベルを割り当て、コンテキストに基づいた不確実性管理をロボットが適応できるようにする。実世界のテストは、タスク固有の不確実性認識が欠如しているメソッドよりも顕著なパフォーマンス向上を示している。
論文参考訳（メタデータ） (2025-05-20T02:23:15Z)
Fast and Robust: Task Sampling with Posterior and Diversity Synergies for Adaptive Decision-Makers in Randomized Environments [78.15330971155778]
Posterior and Diversity Synergized Task Smpling (PDTS) は、高速かつ堅牢なシーケンシャルな意思決定を実現するための、実装が容易な方法である。 PDTSは、堅牢なアクティブタスクサンプリングの可能性を解き、挑戦的なタスクにおけるゼロショットおよび少数ショット適応ロバスト性を大幅に改善し、特定のシナリオ下での学習プロセスを加速する。
論文参考訳（メタデータ） (2025-04-27T07:27:17Z)
Causally Aligned Curriculum Learning [69.11672390876763]
本稿では、因果レンズによるカリキュラムRLの問題について検討する。因果的に整合したソースタスクを特徴付ける十分なグラフィカルな条件を導出する。因果整合型カリキュラムを生成するための効率的なアルゴリズムを開発した。
論文参考訳（メタデータ） (2025-03-21T02:20:38Z)
Interactive Agents to Overcome Ambiguity in Software Engineering [61.40183840499932]
AIエージェントは、あいまいで不明確なユーザー指示に基づいて、タスクを自動化するためにますますデプロイされている。不安定な仮定をし、明確な質問をしないことは、最適以下の結果につながる可能性がある。対話型コード生成設定において,LLMエージェントが不明瞭な命令を処理する能力について,プロプライエタリモデルとオープンウェイトモデルを評価して検討する。
論文参考訳（メタデータ） (2025-02-18T17:12:26Z)
Adaptive Bi-Level Multi-Robot Task Allocation and Learning under Uncertainty with Temporal Logic Constraints [5.329682333337303]
この研究は、未知のロボット遷移モデルの下でのマルチロボット協調の問題に対処する。本稿では,ハイレベルなタスクアロケーションと低レベルな分散ポリシ学習と実行を統合した双方向フレームワークを提案する。提案アルゴリズムを理論的に検証し,課題割り当てが所望の確率閾値を高い信頼性で満たすことを示す。
論文参考訳（メタデータ） (2025-02-14T10:39:21Z)
TAB-Fields: A Maximum Entropy Framework for Mission-Aware Adversarial Planning [2.4903631775244213]
我々は、既知の制約に整合した最も偏りのない確率分布を計算することにより、時間とともに敵状態の分布をキャプチャする表現を開発する。我々は,TAB条件付きPOMCPを導入することで,TAB-Fieldsを標準計画アルゴリズムと統合する。提案手法は,特定の敵政策を前提としたベースラインや,ミッション制約を完全に無視するベースラインと比較して,優れた性能を達成できることを実証する。
論文参考訳（メタデータ） (2024-12-03T16:55:27Z)
Adaptformer: Sequence models as adaptive iterative planners [0.0]
マルチタスクミッションにおける意思決定は、自律システムにとって難しい問題である。本稿では、サンプル効率の高い探索と利用のためにシーケンスモデルを利用する適応型プランナであるAdaptformerを提案する。マルチゴール迷路到達性タスクにおいて,Adaptformerは最先端の手法よりも25%高い性能を示した。
論文参考訳（メタデータ） (2024-11-30T00:34:41Z)
Task-Aware Harmony Multi-Task Decision Transformer for Offline Reinforcement Learning [70.96345405979179]
オフラインマルチタスク強化学習(MTRL)の目的は、オンライン環境相互作用を必要とせず、多様なタスクに適用可能な統一されたポリシーを開発することである。タスクの内容と複雑さの変化は、政策の定式化において重大な課題を引き起こします。本稿では,各タスクに対するパラメータの最適な調和部分空間を特定するための新しいソリューションであるHarmoDT(Harmony Multi-Task Decision Transformer)を紹介する。
論文参考訳（メタデータ） (2024-11-02T05:49:14Z)
No Regrets: Investigating and Improving Regret Approximations for Curriculum Discovery [53.08822154199948]
非教師なし環境設計(UED)手法は、エージェントがイン・オブ・アウト・ディストリビューションタスクに対して堅牢になることを約束する適応的カリキュラムとして近年注目を集めている。本研究は,既存のUEDメソッドがいかにトレーニング環境を選択するかを検討する。本研究では,学習性の高いシナリオを直接訓練する手法を開発した。
論文参考訳（メタデータ） (2024-08-27T14:31:54Z)
Uncertainty-Aware Task Allocation for Distributed Autonomous Robots [3.8182527724852244]
本稿では,分散自律ロボット(DAR)の状況認識における不確実性を伴うタスク配置問題に対処する。タスク割り当てプロセス上の不確実性伝搬は、Sigma-Pointサンプリング機構を用いたUnscented変換を用いて行われる。汎用的なタスク割り当てスキームに採用される可能性は非常に高い。
論文参考訳（メタデータ） (2021-07-21T20:43:05Z)
Estimating Disentangled Belief about Hidden State and Hidden Task for Meta-RL [27.78147889149745]
メタ強化学習(メタRL)アルゴリズムにより、自律エージェントは少量の経験から新しいタスクを適応できます。 meta-rlでは、現在のタスクの仕様(報酬関数など)がエージェントから隠されている。タスクと状態に対する偏りのある信念を推定し、タスクと状態が各タスクのグローバルおよびローカルの特徴とみなすことができるという帰納バイアスを活用します。
論文参考訳（メタデータ） (2021-05-14T06:11:36Z)
MPTP: Motion-Planning-aware Task Planning for Navigation in Belief Space [1.3535770763481902]
大規模環境におけるナビゲーションのための統合型タスク・モーション・プランニング・フレームワークを提案する。このフレームワークは、動作中の運動計画と感覚の不確かさを意図している。
論文参考訳（メタデータ） (2021-04-10T06:52:16Z)
Policy Information Capacity: Information-Theoretic Measure for Task Complexity in Deep Reinforcement Learning [83.66080019570461]
課題の難易度について,環境にとらわれない,アルゴリズムにとらわれない2つの定量的指標を提案する。これらの指標は、様々な代替案よりも、正規化タスク可解性スコアとの相関が高いことを示す。これらのメトリクスは、鍵設計パラメータの高速かつ計算効率の良い最適化にも使用できる。
論文参考訳（メタデータ） (2021-03-23T17:49:50Z)
One Solution is Not All You Need: Few-Shot Extrapolation via Structured MaxEnt RL [142.36621929739707]
課題を達成するために多様な行動を学ぶことは、様々な環境に一般化する行動を引き起こす可能性があることを示す。トレーニング中の1つの環境でタスクの複数のソリューションを識別することにより、我々のアプローチは新たな状況に一般化できる。
論文参考訳（メタデータ） (2020-10-27T17:41:57Z)
Adaptive Procedural Task Generation for Hard-Exploration Problems [78.20918366839399]
ハード探索問題における強化学習を容易にするために,適応手続きタスク生成(APT-Gen)を導入する。私たちのアプローチの中心は、ブラックボックスの手続き生成モジュールを通じてパラメータ化されたタスク空間からタスクを作成することを学習するタスクジェネレータです。学習進捗の直接指標がない場合のカリキュラム学習を可能にするために,生成したタスクにおけるエージェントのパフォーマンスと,対象タスクとの類似性をバランスさせてタスクジェネレータを訓練することを提案する。
論文参考訳（メタデータ） (2020-07-01T09:38:51Z)
Guided Uncertainty-Aware Policy Optimization: Combining Learning and Model-Based Strategies for Sample-Efficient Policy Learning [75.56839075060819]
従来のロボットのアプローチは、環境の正確なモデル、タスクの実行方法の詳細な説明、現在の状態を追跡するための堅牢な認識システムに依存している。強化学習アプローチは、タスクを記述するための報酬信号だけで、生の感覚入力から直接操作することができるが、非常にサンプル非効率で脆弱である。本研究では,ロボットの知覚・運動パイプラインにおける不正確さを克服できる一般的な手法を得るために,モデルに基づく手法の強みと学習に基づく手法の柔軟性を組み合わせる。
論文参考訳（メタデータ） (2020-05-21T19:47:05Z)
Scalable Uncertainty for Computer Vision with Functional Variational Inference [18.492485304537134]
関数空間における変分推論の定式化を利用する。選択したCNNアーキテクチャを1つのフォワードパスのコストで予測不確実性を推定する。本研究では,高次元タスクの文脈で高速な学習を可能にする数値的アルゴリズムを提案する。
論文参考訳（メタデータ） (2020-03-06T19:09:42Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。