Fugu-MT 論文翻訳(概要): POGEMA: Partially Observable Grid Environment for Multiple Agents

論文の概要: POGEMA: Partially Observable Grid Environment for Multiple Agents

arxiv url: http://arxiv.org/abs/2206.10944v1
Date: Wed, 22 Jun 2022 09:39:50 GMT
ステータス: 翻訳完了
システム内更新日: 2022-06-23 14:48:11.833440
Title: POGEMA: Partially Observable Grid Environment for Multiple Agents
Title（参考訳）: POGEMA: 複数のエージェントに対する部分観測可能なグリッド環境
Authors: Alexey Skrynnik, Anton Andreychuk, Konstantin Yakovlev, Aleksandr I. Panov
Abstract要約: POGEMAは、部分的に観測可能なマルチエージェントパスフィンディング(PO-MAPF)問題に挑戦するためのサンドボックスである。様々なPO-MAPFに合わせることができ、プランニングと学習のための優れた試験場として機能する。
参考スコア（独自算出の注目度）: 64.88759709443819
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: We introduce POGEMA (https://github.com/AIRI-Institute/pogema) a sandbox for challenging partially observable multi-agent pathfinding (PO-MAPF) problems . This is a grid-based environment that was specifically designed to be a flexible, tunable and scalable benchmark. It can be tailored to a variety of PO-MAPF, which can serve as an excellent testing ground for planning and learning methods, and their combination, which will allow us to move towards filling the gap between AI planning and learning.
Abstract（参考訳）: POGEMA (https://github.com/AIRI-Institute/pogema) は、部分的に観察可能なマルチエージェントパスフィンディング(PO-MAPF)問題に挑戦するためのサンドボックスである。これは、柔軟でチューニング可能でスケーラブルなベンチマークとして特別に設計されたグリッドベースの環境です。さまざまなPO-MAPFに合わせることができ、プランニングと学習方法の優れたテスト基盤として機能し、それらの組み合わせによって、AI計画と学習のギャップを埋めることができます。

関連論文リスト

A General Framework for Dynamic MAPF using Multi-Shot ASP and Tunnels [1.1816942730023883]
MAPF問題は、エージェントが互いに衝突したり障害物を発生させたりしないように、所定の時間内に複数のエージェントの計画を見つけることを目的としている。本研究では,動的MAPF(D-MAPF)問題について検討し,環境に侵入・退避するエージェントや除去・移動する障害物などの変更を可能にする。 1)D-MAPFの一般的な定義,2)D-MAPFを解くための新しいフレームワーク,3)D-MAPFを解くためのASPベースの新しい手法を紹介する。
論文参考訳（メタデータ） (2025-07-28T10:55:31Z)
RAILGUN: A Unified Convolutional Policy for Multi-Agent Path Finding Across Different Environments and Tasks [17.17370365888357]
Multi-Agent Path Finding (MAPF) は、空中スワムから倉庫の自動化まで、様々な用途に欠かせない。我々はRAILGUNと呼ばれるMAPF問題に対する最初の集中型学習ベースのポリシーを開発した。 CNNベースのアーキテクチャを活用することで、RAILGUNはさまざまなマップをまたいで一般化し、任意の数のエージェントを処理することができる。
論文参考訳（メタデータ） (2025-03-04T20:35:20Z)
MAPF-GPT: Imitation Learning for Multi-Agent Pathfinding at Scale [46.35418789518417]
マルチエージェントパスフィンディング(Multi-agent pathfinding)は、共有環境における複数のエージェントの衝突のないパスを見つけることを必要とする、難しい計算問題である。我々はMAPF-GPTと呼ばれるMAPF問題の基盤モデルを構築した。擬似学習を用いて、部分観測可能性の条件下での行動を生成するための準最適専門家軌道のセットに関する政策を訓練した。 MAPF-GPTは、様々な問題インスタンスにおいて、現在最も優れた学習可能なMAPF解法よりも優れていることを示す。
論文参考訳（メタデータ） (2024-08-29T12:55:10Z)
POGEMA: A Benchmark Platform for Cooperative Multi-Agent Navigation [76.67608003501479]
主評価指標の基礎に基づいて計算された領域関連メトリクスの範囲を定義する評価プロトコルを導入・指定する。このような比較の結果は、様々な最先端のMARL、検索ベース、ハイブリッド手法を含むものである。
論文参考訳（メタデータ） (2024-07-20T16:37:21Z)
Efficient Adaptation in Mixed-Motive Environments via Hierarchical Opponent Modeling and Planning [51.52387511006586]
本稿では,HOP(Hierarchical Opponent Modeling and Planning)を提案する。 HOPは階層的に2つのモジュールから構成される: 相手の目標を推論し、対応する目標条件のポリシーを学ぶ、反対モデリングモジュール。 HOPは、さまざまな未確認エージェントと相互作用する際、優れた少数ショット適応能力を示し、セルフプレイのシナリオで優れている。
論文参考訳（メタデータ） (2024-06-12T08:48:06Z)
Scalable Mechanism Design for Multi-Agent Path Finding [87.40027406028425]
MAPF (Multi-Agent Path Finding) は、複数のエージェントが同時に移動し、与えられた目標地点に向かって共有領域を通って衝突しない経路を決定する。最適解を見つけることは、しばしば計算不可能であり、近似的な準最適アルゴリズムを用いることが不可欠である。本稿では、MAPFのスケーラブルな機構設計の問題を紹介し、MAPFアルゴリズムを近似した3つの戦略防御機構を提案する。
論文参考訳（メタデータ） (2024-01-30T14:26:04Z)
Decentralized Monte Carlo Tree Search for Partially Observable Multi-agent Pathfinding [49.730902939565986]
マルチエージェントパスフィンディング問題は、グラフに閉じ込められたエージェントのグループに対するコンフリクトフリーパスのセットを見つけることである。本研究では、エージェントが他のエージェントをローカルにのみ観察できる分散MAPF設定に焦点を当てた。 MAPFタスクのための分散マルチエージェントモンテカルロ木探索法を提案する。
論文参考訳（メタデータ） (2023-12-26T06:57:22Z)
Learning Coverage Paths in Unknown Environments with Deep Reinforcement Learning [17.69984142788365]
被覆経路計画 (CPP) は、制限された領域の自由空間全体をカバーする経路を見つける問題である。この課題に対する強化学習の適性について検討する。本稿では,フロンティアに基づく計算可能なエゴセントリックマップ表現と,全変動に基づく新たな報酬項を提案する。
論文参考訳（メタデータ） (2023-06-29T14:32:06Z)
Learning Logic Specifications for Soft Policy Guidance in POMCP [71.69251176275638]
部分観測可能なモンテカルロ計画(POMCP)は部分観測可能なマルコフ決定過程(POMDP)の効率的な解法である POMCPはスパース報酬機能、すなわち最終ゴールに達するときのみ得られる報酬に悩まされる。本稿では,POMCP実行のトレースから論理仕様を学習するために帰納的論理プログラミングを用いる。
論文参考訳（メタデータ） (2023-03-16T09:37:10Z)
Multi-Agent Terraforming: Efficient Multi-Agent Path Finding via Environment Manipulation [12.401344261399613]
マルチエージェントパスフィニング(Multi-agent pathfinding)は、障害が散らばった環境において、開始時から目標地点まで、エージェントのチームが衝突のない経路を計画することに関心がある。我々はMAPFの新たな拡張を導入し、Terraforming MAPF (tMAPF) と呼び、いくつかのエージェントが障害を移動して他のエージェントへの道をクリアする役割を担っている。我々は、tMAPFに取り組むために、CBSとPBSという2つの最先端アルゴリズムを拡張し、静的な障害物設定で可能な限り優れた解を常に上回ることを示す。
論文参考訳（メタデータ） (2022-03-20T12:18:35Z)
Explanation Generation for Multi-Modal Multi-Agent Path Finding with Optimal Resource Utilization using Answer Set Programming [1.7132914341329848]
mMAPFの実際の応用には柔軟性と説明性が必要である。本稿では,ソリューションの実現可能性と最適性に関する質問に対する説明を生成する手法を提案する。
論文参考訳（メタデータ） (2020-08-08T18:34:34Z)
Adaptive Informative Path Planning with Multimodal Sensing [36.16721115973077]
AIPPMS(マルチモーダルセンシング用MS) AIPPMSを部分的に観測可能なマルコフ決定プロセス(POMDP)として、オンラインプランニングで解決する。シミュレーションされた検索・救助シナリオと,従来のRockSample問題への挑戦的拡張の2つの領域について,本手法の評価を行った。
論文参考訳（メタデータ） (2020-03-21T20:28:57Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。