論文の概要: Scaling Multi-Agent Epistemic Planning through GNN-Derived Heuristics
- arxiv url: http://arxiv.org/abs/2508.12840v1
- Date: Mon, 18 Aug 2025 11:26:20 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-19 14:49:11.265333
- Title: Scaling Multi-Agent Epistemic Planning through GNN-Derived Heuristics
- Title(参考訳): GNN-Derived Heuristicsによるマルチエージェントてんかん計画のスケーリング
- Authors: Giovanni Briglia, Francesco Fabiano, Stefano Mariani,
- Abstract要約: マルチエージェント・エピステミック・プランニング(Multi-agent Epistemic Planning、MEP)は、物理的世界とエージェントの信念の両方を推論するための自律的な計画フレームワークである。
MEPでは、状態はKripke構造、すなわち有向ラベル付きグラフとして表現する必要がある。
我々は、グラフニューラルネットワーク(GNN)を用いて、てんかん状態内のパターンや関係構造を学習し、計画プロセスの導出を行う。
- 参考スコア(独自算出の注目度): 1.2103159258004725
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Multi-agent Epistemic Planning (MEP) is an autonomous planning framework for reasoning about both the physical world and the beliefs of agents, with applications in domains where information flow and awareness among agents are critical. The richness of MEP requires states to be represented as Kripke structures, i.e., directed labeled graphs. This representation limits the applicability of existing heuristics, hindering the scalability of epistemic solvers, which must explore an exponential search space without guidance, resulting often in intractability. To address this, we exploit Graph Neural Networks (GNNs) to learn patterns and relational structures within epistemic states, to guide the planning process. GNNs, which naturally capture the graph-like nature of Kripke models, allow us to derive meaningful estimates of state quality -- e.g., the distance from the nearest goal -- by generalizing knowledge obtained from previously solved planning instances. We integrate these predictive heuristics into an epistemic planning pipeline and evaluate them against standard baselines, showing significant improvements in the scalability of multi-agent epistemic planning.
- Abstract(参考訳): マルチエージェント・エピステミック・プランニング(Multi-agent Epistemic Planning、MEP)は、エージェントの物理的世界と信念の両方を推論するための自律的な計画フレームワークである。
MEPの豊かさは、状態をクリプケ構造、すなわち有向グラフとして表す必要がある。
この表現は、既存のヒューリスティックスの適用性を制限し、エピステミック・ソルバのスケーラビリティを阻害し、ガイダンスなしで指数探索空間を探索する必要がある。
これを解決するために、グラフニューラルネットワーク(GNN)を用いて、てんかん状態内のパターンや関係構造を学習し、計画プロセスの導出を行う。
GNNは、Kripkeモデルのグラフのような性質を自然に捉えており、以前に解決されたプランニングインスタンスから得られた知識を一般化することで、状態品質(例えば、最も近い目標からの距離)の有意義な推定を導出することができる。
我々はこれらの予測ヒューリスティックスをエピステミック計画パイプラインに統合し、標準的なベースラインに対して評価し、マルチエージェントのエピステミック計画のスケーラビリティを大幅に改善したことを示す。
関連論文リスト
- A Pre-training Framework for Relational Data with Information-theoretic Principles [57.93973948947743]
本稿では,リレーショナルグラフ上の集合に基づくアグリゲーションを通じて,監視信号を構成する新しい事前学習フレームワークであるTask Vector Estimation (TVE)を紹介する。
TVEは従来のトレーニング前のベースラインを一貫して上回っている。
本研究は,関係データベース上での予測モデルの設計原則として,タスクの不均一性と時間構造を符号化する事前学習目的を提唱する。
論文 参考訳(メタデータ) (2025-07-14T00:17:21Z) - Dynamic Graph Structure Estimation for Learning Multivariate Point Process using Spiking Neural Networks [14.77536193242342]
Spiking Dynamic Graph Networkは、スパイキングニューラルネットワーク(SNN)とスパイク依存塑性(STD-P)の時間的処理能力を活用する新しいフレームワークである。
イベントデータから直接動的時間的依存関係を学習し、一般化性とモデリングを強化することで、任意のデータセットに適応する。
NYC Taxi、911 Reddit、Stack Overflowなどの合成および実世界のデータセットで行った評価は、計算効率を維持しながら、優れた精度を示している。
論文 参考訳(メタデータ) (2025-04-01T23:23:10Z) - Learning Logic Specifications for Policy Guidance in POMDPs: an
Inductive Logic Programming Approach [57.788675205519986]
我々は任意の解法によって生成されるPOMDP実行から高品質なトレースを学習する。
我々は、データと時間効率のIndu Logic Programming(ILP)を利用して、解釈可能な信念に基づくポリシー仕様を生成する。
ASP(Answer Set Programming)で表現された学習は、ニューラルネットワークよりも優れた性能を示し、より少ない計算時間で最適な手作りタスクに類似していることを示す。
論文 参考訳(メタデータ) (2024-02-29T15:36:01Z) - A Planning Ontology to Represent and Exploit Planning Knowledge for Performance Efficiency [6.87593454486392]
我々は,エージェントを世界の初期状態から望ましい目標状態へ移動させる一連の行動を見つけることを目的として,自動計画の問題を考える。
利用可能なプランナと多様なプランナドメインが多数用意されていると仮定し、適切なプランナを特定し、ドメインのパフォーマンスを向上させるために活用できる不可欠な情報を持っている。
論文 参考訳(メタデータ) (2023-07-25T14:51:07Z) - A Consciousness-Inspired Planning Agent for Model-Based Reinforcement
Learning [104.3643447579578]
本稿では、その状態の関連部分に動的に対応できるエンドツーエンドのモデルベース深層強化学習エージェントを提案する。
この設計により、エージェントは関連するオブジェクトに参画することで効果的に計画を学ぶことができ、配布外一般化がより良くなる。
論文 参考訳(メタデータ) (2021-06-03T19:35:19Z) - Cloth Manipulation Planning on Basis of Mesh Representations with
Incomplete Domain Knowledge and Voxel-to-Mesh Estimation [0.0]
ロボット布操作におけるオープンゴール計画の問題点を考察する。
私たちのシステムのコアは、操作中の布の挙動のフォワードモデルとして訓練されたニューラルネットワークです。
本稿では,voxel入力からメッシュ表現を推定するニューラルネットワークベースのルーチンを導入し,メッシュ形式の計画を行う。
論文 参考訳(メタデータ) (2021-03-15T04:59:14Z) - Forethought and Hindsight in Credit Assignment [62.05690959741223]
我々は、前向きモデルや後向きモデルによる後向き操作による予測として使われる計画の利益と特異性を理解するために活動する。
本稿では,予測を(再)評価すべき状態の選択に主眼を置いて,計画におけるモデルの利用について検討する。
論文 参考訳(メタデータ) (2020-10-26T16:00:47Z) - The efficacy of Neural Planning Metrics: A meta-analysis of PKL on
nuScenes [77.83263286776938]
自律運転(AD)における高性能物体検出システムの役割
通常、平均的精度で評価されるパフォーマンスは、シーン内のアクターの向きや距離を考慮していない。
近年、フィリオンらは、プランナーの軌道と基底経路のKL分散に基づく神経計画測度(PKL)を提案した。
論文 参考訳(メタデータ) (2020-10-19T09:32:48Z) - Long-Horizon Visual Planning with Goal-Conditioned Hierarchical
Predictors [124.30562402952319]
未来に予測し、計画する能力は、世界で行動するエージェントにとって基本である。
視覚的予測と計画のための現在の学習手法は、長期的タスクでは失敗する。
本稿では,これらの制約を克服可能な視覚的予測と計画のためのフレームワークを提案する。
論文 参考訳(メタデータ) (2020-06-23T17:58:56Z) - Goal-Directed Planning for Habituated Agents by Active Inference Using a
Variational Recurrent Neural Network [5.000272778136268]
本研究では, 予測符号化(PC)とアクティブ推論(AIF)フレームワークが, 低次元潜在状態空間における事前分布を学習することにより, より優れた一般化を実現できることを示す。
提案モデルでは, 最適潜伏変数を推定し, 実験結果の最小化のためのシナプス重みを推定することにより学習を行う。
提案手法は,シミュレーションにおけるロボットタスクと複雑なロボットタスクの両方を用いて評価し,限られた学習データを用いた学習における十分な一般化を実証した。
論文 参考訳(メタデータ) (2020-05-27T06:43:59Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。