論文の概要: Generalising Planning Environment Redesign
- arxiv url: http://arxiv.org/abs/2402.07799v1
- Date: Mon, 12 Feb 2024 17:03:58 GMT
- ステータス: 処理完了
- システム内更新日: 2024-02-13 13:32:16.584078
- Title: Generalising Planning Environment Redesign
- Title(参考訳): 計画環境のリデザインの一般化
- Authors: Alberto Pozanco, Ramon Fraga Pereira, Daniel Borrajo
- Abstract要約: 利害関係者は、エージェントの目標や計画を認識することに必ずしも関係しない目的や指標を持つことができると我々は主張する。
我々は、計量に依存しない一般的な環境再設計アプローチを開発し、近年の高品質プランニングの研究を活用している。
- 参考スコア(独自算出の注目度): 7.56372030029358
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In Environment Design, one interested party seeks to affect another agent's
decisions by applying changes to the environment. Most research on planning
environment (re)design assumes the interested party's objective is to
facilitate the recognition of goals and plans, and search over the space of
environment modifications to find the minimal set of changes that simplify
those tasks and optimise a particular metric. This search space is usually
intractable, so existing approaches devise metric-dependent pruning techniques
for performing search more efficiently. This results in approaches that are not
able to generalise across different objectives and/or metrics. In this paper,
we argue that the interested party could have objectives and metrics that are
not necessarily related to recognising agents' goals or plans. Thus, to
generalise the task of Planning Environment Redesign, we develop a general
environment redesign approach that is metric-agnostic and leverages recent
research on top-quality planning to efficiently redesign planning environments
according to any interested party's objective and metric. Experiments over a
set of environment redesign benchmarks show that our general approach
outperforms existing approaches when using well-known metrics, such as
facilitating the recognition of goals, as well as its effectiveness when
solving environment redesign tasks that optimise a novel set of different
metrics.
- Abstract(参考訳): 環境設計において、ある関係者は環境に変化を適用することで他のエージェントの決定に影響を与えようとしている。
計画環境(re)設計に関するほとんどの研究は、目標や計画の認識を促進し、環境変更の空間を探索し、それらのタスクを簡素化し、特定のメトリックを最適化する最小限の変更点を見つけることを目的としている。
この探索空間は通常難解であり、既存の手法ではより効率的に探索を行うためのメトリック依存の刈り込み技術が考案されている。
その結果、異なる目的やメトリクスをまたいで一般化できないアプローチが生まれる。
本稿では,エージェントの目標や計画の認識に必ずしも関係しない目的や指標を利害関係者が持つ可能性があることを論じる。
そこで, 計画環境再設計の課題を一般化するために, メトリクス非依存な汎用環境再設計手法を開発し, 最近のトップクオリティ計画研究を活用し, 利害関係者の目的や指標に応じて, 計画環境を効率的に再設計する。
環境再設計ベンチマークによる実験では、目標認識の促進や、新しいメトリクスセットを最適化した環境再設計タスクの解決効果など、よく知られたメトリクスを使用する場合の既存のアプローチよりも、一般的なアプローチの方が優れています。
関連論文リスト
- Data-Driven Goal Recognition Design for General Behavioral Agents [14.750023724230774]
汎用行動モデルを持つエージェントを考慮に入れた,目標認識設計のためのデータ駆動型アプローチを提案する。
私たちのアプローチは、与えられた環境とエージェントの振る舞いモデルに対して$textitwcd$を予測するために、機械学習モデルをトレーニングすることから始まります。
そこで我々は,様々な制約を満たす勾配に基づく最適化フレームワークを提案し,意思決定環境を最適化する。
論文 参考訳(メタデータ) (2024-04-03T20:38:22Z) - Co-Optimization of Environment and Policies for Decentralized Multi-Agent Navigation [14.533605727697775]
本研究は,マルチエージェントシステムとその周辺環境を,一方の行動が他方に影響を与える共進化システムとみなす。
本研究では,環境中におけるエージェント動作と障害物構成の最適解を求めるために,サブオブジェクト間を置換するアルゴリズムを開発した。
論文 参考訳(メタデータ) (2024-03-21T17:37:43Z) - Discovering General Reinforcement Learning Algorithms with Adversarial
Environment Design [54.39859618450935]
メタ学習型更新ルールは,広範囲のRLタスクで良好に機能するアルゴリズムの発見を期待して,実現可能であることを示す。
Learned Policy Gradient (LPG)のようなアルゴリズムによる印象的な初期結果にもかかわらず、これらのアルゴリズムが目に見えない環境に適用される場合、まだギャップが残っている。
本研究では,メタ教師付き学習分布の特性が,これらのアルゴリズムの性能に与える影響について検討する。
論文 参考訳(メタデータ) (2023-10-04T12:52:56Z) - MANER: Multi-Agent Neural Rearrangement Planning of Objects in Cluttered
Environments [8.15681999722805]
本稿では,マルチエージェントオブジェクトアレンジメント計画のための学習ベースのフレームワークを提案する。
複雑な環境におけるタスクシークエンシングとパス計画の課題に対処する。
論文 参考訳(メタデータ) (2023-06-10T23:53:28Z) - Effective Baselines for Multiple Object Rearrangement Planning in
Partially Observable Mapped Environments [5.32429768581469]
本研究の目的は, 自家用知的エージェントが部分観測可能性の下で効率的に再配置を計画できるようにすることである。
本研究では, モノリシック・モジュール型深層強化学習(DRL)法について検討した。
モノリシックDRL法は多目的再配置に必要な長期計画では成功しない。
また、再配置が必要なオブジェクトが環境に均一に分散されている場合、我々の欲張りのあるモジュラーエージェントは経験的に最適であることを示す。
論文 参考訳(メタデータ) (2023-01-24T08:03:34Z) - Discrete Factorial Representations as an Abstraction for Goal
Conditioned Reinforcement Learning [99.38163119531745]
離散化ボトルネックを適用することにより,目標条件付きRLセットアップの性能が向上することを示す。
分布外目標に対する期待した回帰を実験的に証明し、同時に表現的な構造で目標を指定できるようにします。
論文 参考訳(メタデータ) (2022-11-01T03:31:43Z) - Environment Optimization for Multi-Agent Navigation [11.473177123332281]
本研究の目的は,システムレベルの最適化問題において,環境を決定変数として考えることである。
完全性を確保しつつ環境が変化しうる条件を, 形式的証明を通じて示す。
幅広い実装シナリオに対応するため、オンラインとオフラインの両方の最適化と、離散環境と連続環境の両方の表現を含む。
論文 参考訳(メタデータ) (2022-09-22T19:22:16Z) - Rearrangement: A Challenge for Embodied AI [229.8891614821016]
Embodied AIの研究と評価のためのフレームワークについて述べる。
我々の提案は正統的な課題である再配置に基づいている。
4つの異なるシミュレーション環境における再配置シナリオの実験的なテストベッドについて述べる。
論文 参考訳(メタデータ) (2020-11-03T19:42:32Z) - Object Goal Navigation using Goal-Oriented Semantic Exploration [98.14078233526476]
本研究は,未確認環境における対象カテゴリーのインスタンスにナビゲートするオブジェクトゴールナビゲーションの問題を研究する。
本稿では,表層的なセマンティックマップを構築し,効率的に環境を探索する「ゴール指向セマンティック探索」というモジュールシステムを提案する。
論文 参考訳(メタデータ) (2020-07-01T17:52:32Z) - ObjectNav Revisited: On Evaluation of Embodied Agents Navigating to
Objects [119.46959413000594]
この文書は、ObjectNavのワーキンググループのコンセンサスレコメンデーションを要約します。
評価基準の微妙だが重要な詳細について推奨する。
CVPR 2020のEmbodied AIワークショップで実施された課題において、これらの推奨事項のインスタンス化について、詳細な説明を行う。
論文 参考訳(メタデータ) (2020-06-23T17:18:54Z) - Divide-and-Conquer Monte Carlo Tree Search For Goal-Directed Planning [78.65083326918351]
暗黙的な逐次計画の仮定に代わるものを検討する。
本稿では,最適計画の近似を行うため,Divide-and-Conquer Monte Carlo Tree Search (DC-MCTS)を提案する。
計画順序に対するこのアルゴリズム的柔軟性は,グリッドワールドにおけるナビゲーションタスクの改善に繋がることを示す。
論文 参考訳(メタデータ) (2020-04-23T18:08:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。