Fugu-MT 論文翻訳(概要): Generalising Planning Environment Redesign

論文の概要: Generalising Planning Environment Redesign

arxiv url: http://arxiv.org/abs/2402.07799v1
Date: Mon, 12 Feb 2024 17:03:58 GMT
ステータス: 翻訳完了
システム内更新日: 2024-02-13 13:32:16.584078
Title: Generalising Planning Environment Redesign
Title（参考訳）: 計画環境のリデザインの一般化
Authors: Alberto Pozanco, Ramon Fraga Pereira, Daniel Borrajo
Abstract要約: 利害関係者は、エージェントの目標や計画を認識することに必ずしも関係しない目的や指標を持つことができると我々は主張する。我々は、計量に依存しない一般的な環境再設計アプローチを開発し、近年の高品質プランニングの研究を活用している。
参考スコア（独自算出の注目度）: 7.56372030029358
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: In Environment Design, one interested party seeks to affect another agent's decisions by applying changes to the environment. Most research on planning environment (re)design assumes the interested party's objective is to facilitate the recognition of goals and plans, and search over the space of environment modifications to find the minimal set of changes that simplify those tasks and optimise a particular metric. This search space is usually intractable, so existing approaches devise metric-dependent pruning techniques for performing search more efficiently. This results in approaches that are not able to generalise across different objectives and/or metrics. In this paper, we argue that the interested party could have objectives and metrics that are not necessarily related to recognising agents' goals or plans. Thus, to generalise the task of Planning Environment Redesign, we develop a general environment redesign approach that is metric-agnostic and leverages recent research on top-quality planning to efficiently redesign planning environments according to any interested party's objective and metric. Experiments over a set of environment redesign benchmarks show that our general approach outperforms existing approaches when using well-known metrics, such as facilitating the recognition of goals, as well as its effectiveness when solving environment redesign tasks that optimise a novel set of different metrics.
Abstract（参考訳）: 環境設計において、ある関係者は環境に変化を適用することで他のエージェントの決定に影響を与えようとしている。計画環境(re)設計に関するほとんどの研究は、目標や計画の認識を促進し、環境変更の空間を探索し、それらのタスクを簡素化し、特定のメトリックを最適化する最小限の変更点を見つけることを目的としている。この探索空間は通常難解であり、既存の手法ではより効率的に探索を行うためのメトリック依存の刈り込み技術が考案されている。その結果、異なる目的やメトリクスをまたいで一般化できないアプローチが生まれる。本稿では,エージェントの目標や計画の認識に必ずしも関係しない目的や指標を利害関係者が持つ可能性があることを論じる。そこで, 計画環境再設計の課題を一般化するために, メトリクス非依存な汎用環境再設計手法を開発し, 最近のトップクオリティ計画研究を活用し, 利害関係者の目的や指標に応じて, 計画環境を効率的に再設計する。環境再設計ベンチマークによる実験では、目標認識の促進や、新しいメトリクスセットを最適化した環境再設計タスクの解決効果など、よく知られたメトリクスを使用する場合の既存のアプローチよりも、一般的なアプローチの方が優れています。

関連論文リスト

Learning to Plan with Personalized Preferences [27.972543891602033]
PbP(Preference-based Planning)ベンチマークは、原子のアクションから複雑なシーケンスにまたがる数百のさまざまな好みを具現化したベンチマークである。我々のSOTA手法の評価では, シンボルベースのアプローチはスケーラビリティを約束するが, パーソナライズされた好みを満たす計画の生成と実行には大きな課題が残っている。これらの知見は、適応計画のための貴重な抽象化レイヤとして、優先誘導計画の生成と実行に関する新たな研究の方向性を定めている。
論文参考訳（メタデータ） (2025-02-02T17:16:25Z)
Platform-Aware Mission Planning [50.56223680851687]
本稿では,PAMP(Platform-Aware Mission Planning)の問題を紹介する。第1のベースラインアプローチはミッションレベルとプラットフォームレベル、第2のベースラインアプローチは抽象リファインメントループに基づいている。提案手法の健全性と完全性を実証し,実験により検証する。
論文参考訳（メタデータ） (2025-01-16T16:20:37Z)
Task-Aware Harmony Multi-Task Decision Transformer for Offline Reinforcement Learning [70.96345405979179]
オフラインマルチタスク強化学習(MTRL)の目的は、オンライン環境相互作用を必要とせず、多様なタスクに適用可能な統一されたポリシーを開発することである。タスクの内容と複雑さの変化は、政策の定式化において重大な課題を引き起こします。本稿では,各タスクに対するパラメータの最適な調和部分空間を特定するための新しいソリューションであるHarmoDT(Harmony Multi-Task Decision Transformer)を紹介する。
論文参考訳（メタデータ） (2024-11-02T05:49:14Z)
A Meta-Engine Framework for Interleaved Task and Motion Planning using Topological Refinements [51.54559117314768]
タスク・アンド・モーション・プランニング(タスク・アンド・モーション・プランニング、TAMP)は、自動化された計画問題の解決策を見つけるための問題である。本稿では,TAMP問題のモデル化とベンチマークを行うための,汎用的でオープンソースのフレームワークを提案する。移動エージェントと複数のタスク状態依存障害を含むTAMP問題を解決する革新的なメタ技術を導入する。
論文参考訳（メタデータ） (2024-08-11T14:57:57Z)
AgentGen: Enhancing Planning Abilities for Large Language Model based Agent via Environment and Task Generation [89.68433168477227]
LLM(Large Language Model)ベースのエージェントは注目され、ますます人気が高まっている。本稿では,LLMの学習指導による計画能力の向上について検討する。この制限に対処するために,多様な環境の自動合成と段階的な計画課題について検討する。
論文参考訳（メタデータ） (2024-08-01T17:59:46Z)
Data-Driven Goal Recognition Design for General Behavioral Agents [14.750023724230774]
汎用行動モデルを持つエージェントを考慮に入れた,目標認識設計のためのデータ駆動型アプローチを提案する。本稿では,様々な制約を満たす勾配に基づく最適化フレームワークを提案し,意思決定環境を最適化する。
論文参考訳（メタデータ） (2024-04-03T20:38:22Z)
Co-Optimization of Environment and Policies for Decentralized Multi-Agent Navigation [14.533605727697775]
本研究は,マルチエージェントシステムとその周辺環境を,一方の行動が他方に影響を与える共進化システムとみなす。本研究では,環境中におけるエージェント動作と障害物構成の最適解を求めるために,サブオブジェクト間を置換するアルゴリズムを開発した。
論文参考訳（メタデータ） (2024-03-21T17:37:43Z)
MANER: Multi-Agent Neural Rearrangement Planning of Objects in Cluttered Environments [8.15681999722805]
本稿では,マルチエージェントオブジェクトアレンジメント計画のための学習ベースのフレームワークを提案する。複雑な環境におけるタスクシークエンシングとパス計画の課題に対処する。
論文参考訳（メタデータ） (2023-06-10T23:53:28Z)
Effective Baselines for Multiple Object Rearrangement Planning in Partially Observable Mapped Environments [5.32429768581469]
本研究の目的は, 自家用知的エージェントが部分観測可能性の下で効率的に再配置を計画できるようにすることである。本研究では, モノリシック・モジュール型深層強化学習(DRL)法について検討した。モノリシックDRL法は多目的再配置に必要な長期計画では成功しない。また、再配置が必要なオブジェクトが環境に均一に分散されている場合、我々の欲張りのあるモジュラーエージェントは経験的に最適であることを示す。
論文参考訳（メタデータ） (2023-01-24T08:03:34Z)
Discrete Factorial Representations as an Abstraction for Goal Conditioned Reinforcement Learning [99.38163119531745]
離散化ボトルネックを適用することにより,目標条件付きRLセットアップの性能が向上することを示す。分布外目標に対する期待した回帰を実験的に証明し、同時に表現的な構造で目標を指定できるようにします。
論文参考訳（メタデータ） (2022-11-01T03:31:43Z)
Environment Optimization for Multi-Agent Navigation [11.473177123332281]
本研究の目的は,システムレベルの最適化問題において,環境を決定変数として考えることである。完全性を確保しつつ環境が変化しうる条件を, 形式的証明を通じて示す。幅広い実装シナリオに対応するため、オンラインとオフラインの両方の最適化と、離散環境と連続環境の両方の表現を含む。
論文参考訳（メタデータ） (2022-09-22T19:22:16Z)
Object Goal Navigation using Goal-Oriented Semantic Exploration [98.14078233526476]
本研究は,未確認環境における対象カテゴリーのインスタンスにナビゲートするオブジェクトゴールナビゲーションの問題を研究する。本稿では,表層的なセマンティックマップを構築し,効率的に環境を探索する「ゴール指向セマンティック探索」というモジュールシステムを提案する。
論文参考訳（メタデータ） (2020-07-01T17:52:32Z)
Divide-and-Conquer Monte Carlo Tree Search For Goal-Directed Planning [78.65083326918351]
暗黙的な逐次計画の仮定に代わるものを検討する。本稿では,最適計画の近似を行うため,Divide-and-Conquer Monte Carlo Tree Search (DC-MCTS)を提案する。計画順序に対するこのアルゴリズム的柔軟性は,グリッドワールドにおけるナビゲーションタスクの改善に繋がることを示す。
論文参考訳（メタデータ） (2020-04-23T18:08:58Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。