Fugu-MT 論文翻訳(概要): Enhancing Robot Navigation Policies with Task-Specific Uncertainty Management

論文の概要: Enhancing Robot Navigation Policies with Task-Specific Uncertainty Management

arxiv url: http://arxiv.org/abs/2410.15178v1
Date: Sat, 19 Oct 2024 18:46:17 GMT
ステータス: 翻訳完了
システム内更新日: 2024-11-28 17:07:37.949707
Title: Enhancing Robot Navigation Policies with Task-Specific Uncertainty Management
Title（参考訳）: タスク特定不確実性管理によるロボットナビゲーションポリシーの強化
Authors: Gokul Puthumanaillam, Paulo Padrao, Jose Fuentes, Leonardo Bobadilla, Melkior Ornik,
Abstract要約: 本稿では,タスク固有の不確実性要件を直接ナビゲーションポリシーに統合するためのフレームワークを提案する。 TSMの条件付けポリシは,タスク固有の不確実性要求を効果的に表現する方法を提供する。本稿では,GUIDEを強化学習フレームワークに統合することにより,明示的な報酬工学を必要とせずにナビゲーションポリシーを学習できることを示す。
参考スコア（独自算出の注目度）: 1.614803913005309
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Robots performing navigation tasks in complex environments face significant challenges due to uncertainty in state estimation. Effectively managing this uncertainty is crucial, but the optimal approach varies depending on the specific details of the task: different tasks require varying levels of precision in different regions of the environment. For instance, a robot navigating a crowded space might need precise localization near obstacles but can operate effectively with less precise state estimates in open areas. This varying need for certainty in different parts of the environment, depending on the task, calls for policies that can adapt their uncertainty management strategies based on task-specific requirements. In this paper, we present a framework for integrating task-specific uncertainty requirements directly into navigation policies. We introduce Task-Specific Uncertainty Map (TSUM), which represents acceptable levels of state estimation uncertainty across different regions of the operating environment for a given task. Using TSUM, we propose Generalized Uncertainty Integration for Decision-Making and Execution (GUIDE), a policy conditioning framework that incorporates these uncertainty requirements into the robot's decision-making process. We find that conditioning policies on TSUMs provides an effective way to express task-specific uncertainty requirements and enables the robot to reason about the context-dependent value of certainty. We show how integrating GUIDE into reinforcement learning frameworks allows the agent to learn navigation policies without the need for explicit reward engineering to balance task completion and uncertainty management. We evaluate GUIDE on a variety of real-world navigation tasks and find that it demonstrates significant improvements in task completion rates compared to baselines. Evaluation videos can be found at https://guided-agents.github.io.
Abstract（参考訳）: 複雑な環境でナビゲーションタスクを実行するロボットは、状態推定の不確実性のために重大な課題に直面している。この不確実性を効果的に管理することは重要であるが、最適なアプローチはタスクの特定の詳細によって異なる。例えば、混雑した空間をナビゲートするロボットは障害物の近くで正確な位置決めを必要とするかもしれないが、オープンエリアでの精度の低い状態推定で効果的に動作することができる。このような環境の様々な部分における確実性の必要性は、タスクによって異なり、タスク固有の要求に基づいて、不確実性管理戦略に適応できるポリシーが求められます。本稿では,タスク固有の不確実性要件を直接ナビゲーションポリシーに統合するためのフレームワークを提案する。本研究では,あるタスクに対する動作環境の異なる領域における状態推定の不確かさの許容レベルを表すタスク特定不確実性マップ(TSM)を紹介する。本研究では,これらの不確実性要件をロボットの意思決定プロセスに組み込んだ政策条件付けフレームワークGUIDEを提案する。 TSMの条件付けポリシは,タスク固有の不確実性要件を効果的に表現し,ロボットが確実性の文脈依存的価値を推論できるようにする。本稿では,GUIDEを強化学習フレームワークに統合することにより,タスク完了と不確実性管理のバランスを取るために,明示的な報酬工学を必要とせずにナビゲーションポリシーを学習することができることを示す。実世界の各種ナビゲーションタスクにおけるGUIDEを評価し,ベースラインと比較してタスク完了率を大幅に改善したことを示す。評価ビデオはhttps://guided-agents.github.io.comで見ることができる。

関連論文リスト

When to Act, Ask, or Learn: Uncertainty-Aware Policy Steering [10.01278648231868]
ポリシーステアリングは、デプロイ時にロボットの振る舞いを適用する新しい方法です。 VLM(Vision-Language Models)は、それらの推論能力のために、汎用的な検証を約束する。セマンティックタスクの不確実性と低レベルのアクション実現可能性について共同で理由づけるフレームワークである不確実性対応型ポリシーステアリング(UPS)を提案する。
論文参考訳（メタデータ） (2026-02-25T23:23:22Z)
What Do LLM Agents Know About Their World? Task2Quiz: A Paradigm for Studying Environment Understanding [50.35012849818872]
大規模言語モデル(LLM)エージェントは、複雑な意思決定やツール使用タスクにおいて顕著な能力を示した。本研究では,タスク実行と世界状態理解の分離を目的とした決定論的かつ自動評価パラダイムであるTask-to-Quiz(T2Q)を提案する。実験の結果,タスク成功は環境理解の指標として不十分な場合が多く,現在の記憶機構はエージェントが環境の基底モデルを取得するのに有効ではないことが明らかとなった。
論文参考訳（メタデータ） (2026-01-14T14:09:11Z)
Situationally-Aware Dynamics Learning [57.698553219660376]
隠れ状態表現のオンライン学習のための新しいフレームワークを提案する。提案手法は、非観測パラメータが遷移力学と報酬構造の両方に与える影響を明示的にモデル化する。シミュレーションと実世界の両方の実験は、データ効率、ポリシー性能、安全で適応的なナビゲーション戦略の出現を著しく改善した。
論文参考訳（メタデータ） (2025-05-26T06:40:11Z)
Enhancing Robot Navigation Policies with Task-Specific Uncertainty Managements [1.614803913005309]
タスク特化不確実性マップ(TSM)を用いたナビゲーションポリシーにタスク特化要求を統合するGUIDEを提案する。 TSMは、異なる場所に許容される不確実性レベルを割り当て、コンテキストに基づいた不確実性管理をロボットが適応できるようにする。実世界のテストは、タスク固有の不確実性認識が欠如しているメソッドよりも顕著なパフォーマンス向上を示している。
論文参考訳（メタデータ） (2025-05-20T02:23:15Z)
Fast and Robust: Task Sampling with Posterior and Diversity Synergies for Adaptive Decision-Makers in Randomized Environments [78.15330971155778]
Posterior and Diversity Synergized Task Smpling (PDTS) は、高速かつ堅牢なシーケンシャルな意思決定を実現するための、実装が容易な方法である。 PDTSは、堅牢なアクティブタスクサンプリングの可能性を解き、挑戦的なタスクにおけるゼロショットおよび少数ショット適応ロバスト性を大幅に改善し、特定のシナリオ下での学習プロセスを加速する。
論文参考訳（メタデータ） (2025-04-27T07:27:17Z)
Causally Aligned Curriculum Learning [69.11672390876763]
本稿では、因果レンズによるカリキュラムRLの問題について検討する。因果的に整合したソースタスクを特徴付ける十分なグラフィカルな条件を導出する。因果整合型カリキュラムを生成するための効率的なアルゴリズムを開発した。
論文参考訳（メタデータ） (2025-03-21T02:20:38Z)
Interactive Agents to Overcome Ambiguity in Software Engineering [61.40183840499932]
AIエージェントは、あいまいで不明確なユーザー指示に基づいて、タスクを自動化するためにますますデプロイされている。不安定な仮定をし、明確な質問をしないことは、最適以下の結果につながる可能性がある。対話型コード生成設定において,LLMエージェントが不明瞭な命令を処理する能力について,プロプライエタリモデルとオープンウェイトモデルを評価して検討する。
論文参考訳（メタデータ） (2025-02-18T17:12:26Z)
Adaptive Bi-Level Multi-Robot Task Allocation and Learning under Uncertainty with Temporal Logic Constraints [5.329682333337303]
この研究は、未知のロボット遷移モデルの下でのマルチロボット協調の問題に対処する。本稿では,ハイレベルなタスクアロケーションと低レベルな分散ポリシ学習と実行を統合した双方向フレームワークを提案する。提案アルゴリズムを理論的に検証し,課題割り当てが所望の確率閾値を高い信頼性で満たすことを示す。
論文参考訳（メタデータ） (2025-02-14T10:39:21Z)
TAB-Fields: A Maximum Entropy Framework for Mission-Aware Adversarial Planning [2.4903631775244213]
我々は、既知の制約に整合した最も偏りのない確率分布を計算することにより、時間とともに敵状態の分布をキャプチャする表現を開発する。我々は,TAB条件付きPOMCPを導入することで,TAB-Fieldsを標準計画アルゴリズムと統合する。提案手法は,特定の敵政策を前提としたベースラインや,ミッション制約を完全に無視するベースラインと比較して,優れた性能を達成できることを実証する。
論文参考訳（メタデータ） (2024-12-03T16:55:27Z)
Adaptformer: Sequence models as adaptive iterative planners [0.0]
マルチタスクミッションにおける意思決定は、自律システムにとって難しい問題である。本稿では、サンプル効率の高い探索と利用のためにシーケンスモデルを利用する適応型プランナであるAdaptformerを提案する。マルチゴール迷路到達性タスクにおいて,Adaptformerは最先端の手法よりも25%高い性能を示した。
論文参考訳（メタデータ） (2024-11-30T00:34:41Z)
Task-Aware Harmony Multi-Task Decision Transformer for Offline Reinforcement Learning [70.96345405979179]
オフラインマルチタスク強化学習(MTRL)の目的は、オンライン環境相互作用を必要とせず、多様なタスクに適用可能な統一されたポリシーを開発することである。タスクの内容と複雑さの変化は、政策の定式化において重大な課題を引き起こします。本稿では,各タスクに対するパラメータの最適な調和部分空間を特定するための新しいソリューションであるHarmoDT(Harmony Multi-Task Decision Transformer)を紹介する。
論文参考訳（メタデータ） (2024-11-02T05:49:14Z)
No Regrets: Investigating and Improving Regret Approximations for Curriculum Discovery [53.08822154199948]
非教師なし環境設計(UED)手法は、エージェントがイン・オブ・アウト・ディストリビューションタスクに対して堅牢になることを約束する適応的カリキュラムとして近年注目を集めている。本研究は,既存のUEDメソッドがいかにトレーニング環境を選択するかを検討する。本研究では,学習性の高いシナリオを直接訓練する手法を開発した。
論文参考訳（メタデータ） (2024-08-27T14:31:54Z)
Uncertainty-Aware Task Allocation for Distributed Autonomous Robots [3.8182527724852244]
本稿では,分散自律ロボット(DAR)の状況認識における不確実性を伴うタスク配置問題に対処する。タスク割り当てプロセス上の不確実性伝搬は、Sigma-Pointサンプリング機構を用いたUnscented変換を用いて行われる。汎用的なタスク割り当てスキームに採用される可能性は非常に高い。
論文参考訳（メタデータ） (2021-07-21T20:43:05Z)
Estimating Disentangled Belief about Hidden State and Hidden Task for Meta-RL [27.78147889149745]
メタ強化学習(メタRL)アルゴリズムにより、自律エージェントは少量の経験から新しいタスクを適応できます。 meta-rlでは、現在のタスクの仕様(報酬関数など)がエージェントから隠されている。タスクと状態に対する偏りのある信念を推定し、タスクと状態が各タスクのグローバルおよびローカルの特徴とみなすことができるという帰納バイアスを活用します。
論文参考訳（メタデータ） (2021-05-14T06:11:36Z)
MPTP: Motion-Planning-aware Task Planning for Navigation in Belief Space [1.3535770763481902]
大規模環境におけるナビゲーションのための統合型タスク・モーション・プランニング・フレームワークを提案する。このフレームワークは、動作中の運動計画と感覚の不確かさを意図している。
論文参考訳（メタデータ） (2021-04-10T06:52:16Z)
Policy Information Capacity: Information-Theoretic Measure for Task Complexity in Deep Reinforcement Learning [83.66080019570461]
課題の難易度について,環境にとらわれない,アルゴリズムにとらわれない2つの定量的指標を提案する。これらの指標は、様々な代替案よりも、正規化タスク可解性スコアとの相関が高いことを示す。これらのメトリクスは、鍵設計パラメータの高速かつ計算効率の良い最適化にも使用できる。
論文参考訳（メタデータ） (2021-03-23T17:49:50Z)
One Solution is Not All You Need: Few-Shot Extrapolation via Structured MaxEnt RL [142.36621929739707]
課題を達成するために多様な行動を学ぶことは、様々な環境に一般化する行動を引き起こす可能性があることを示す。トレーニング中の1つの環境でタスクの複数のソリューションを識別することにより、我々のアプローチは新たな状況に一般化できる。
論文参考訳（メタデータ） (2020-10-27T17:41:57Z)
Adaptive Procedural Task Generation for Hard-Exploration Problems [78.20918366839399]
ハード探索問題における強化学習を容易にするために,適応手続きタスク生成(APT-Gen)を導入する。私たちのアプローチの中心は、ブラックボックスの手続き生成モジュールを通じてパラメータ化されたタスク空間からタスクを作成することを学習するタスクジェネレータです。学習進捗の直接指標がない場合のカリキュラム学習を可能にするために,生成したタスクにおけるエージェントのパフォーマンスと,対象タスクとの類似性をバランスさせてタスクジェネレータを訓練することを提案する。
論文参考訳（メタデータ） (2020-07-01T09:38:51Z)
Guided Uncertainty-Aware Policy Optimization: Combining Learning and Model-Based Strategies for Sample-Efficient Policy Learning [75.56839075060819]
従来のロボットのアプローチは、環境の正確なモデル、タスクの実行方法の詳細な説明、現在の状態を追跡するための堅牢な認識システムに依存している。強化学習アプローチは、タスクを記述するための報酬信号だけで、生の感覚入力から直接操作することができるが、非常にサンプル非効率で脆弱である。本研究では,ロボットの知覚・運動パイプラインにおける不正確さを克服できる一般的な手法を得るために,モデルに基づく手法の強みと学習に基づく手法の柔軟性を組み合わせる。
論文参考訳（メタデータ） (2020-05-21T19:47:05Z)
Scalable Uncertainty for Computer Vision with Functional Variational Inference [18.492485304537134]
関数空間における変分推論の定式化を利用する。選択したCNNアーキテクチャを1つのフォワードパスのコストで予測不確実性を推定する。本研究では,高次元タスクの文脈で高速な学習を可能にする数値的アルゴリズムを提案する。
論文参考訳（メタデータ） (2020-03-06T19:09:42Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。