論文の概要: Efficient Lookahead Encoding and Abstracted Width for Learning General Policies in Classical Planning
- arxiv url: http://arxiv.org/abs/2605.18674v1
- Date: Mon, 18 May 2026 17:15:23 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-19 17:57:50.189488
- Title: Efficient Lookahead Encoding and Abstracted Width for Learning General Policies in Classical Planning
- Title(参考訳): 古典的計画における一般政策学習のための効率的なLookaheadエンコーディングと抽象化幅
- Authors: Michael Aichmüller, Simon Ståhlberg, Martin Funkquist, Hector Geffner,
- Abstract要約: 一般的な計画は、古典的な計画領域内のインスタンスの集合をまたいで一般化するポリシーを学ぶことを目的としている。
最近のグラフニューラルネットワーク(GNN)アプローチは、いくつかのドメインでほぼ完璧なポリシーを学びました。
この作業は、最近公開されたIterated Width(IW)ポリシーの考え方を改善している。
- 参考スコア(独自算出の注目度): 7.31472912229643
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Generalized planning aims to learn policies that generalize across collections of instances within a classical planning domain. Recent Graph Neural Network (GNN) approaches have learned nearly perfect policies for several domains. This work improves on the recently published idea of Iterated Width (IW) policies. Therein, the policy broadens its successor scope through an IW-lookahead search that can "jump" over multiple transitions, simplifying the problem structure. Yet, each transition is evaluated individually, leading to unscalable compute costs and expressivity limitations. Furthermore, although IW(1) is attractive because it scales linearly with the number of atoms, it becomes inefficient once thousands of objects are considered, as in the International Planning Competition (IPC) 2023 benchmark. We address both limitations. First, we introduce a vastly more efficient holistic encoding of the entire search tree. It jointly represents IW(1)-reachable states only by their relational differences to the current state, enabling Relational GNNs (R-GNNs) to score all transitions in a single forward pass. Second, we define Abstracted IW(1) to improve scaling through relational abstraction during novelty checks. Rather than testing fully instantiated atoms, it abstracts each atom by replacing all but one argument with its type. The original atom is novel if any of its abstracted forms is novel. This structural compression shifts novelty search scaling from atoms to objects, while preserving meaningful subgoal structure. We evaluate our contributions on the hyperscaling IPC 2023 benchmark and across diverse domains, including domains requiring features beyond the $C_2$ logic fragment. Our policies achieve new state-of-the-art performance, significantly surpassing prior work, including the classical planner LAMA.
- Abstract(参考訳): 一般的な計画は、古典的な計画領域内のインスタンスの集合をまたいで一般化するポリシーを学ぶことを目的としている。
最近のグラフニューラルネットワーク(GNN)アプローチは、いくつかのドメインでほぼ完璧なポリシーを学びました。
この作業は、最近公開されたIterated Width(IW)ポリシーの考え方を改善している。
このポリシーは、IW-lookaheadサーチを通じて、複数の遷移を"ジャンプ"し、問題構造を単純化することで、後続のスコープを広げる。
しかし、各遷移は個別に評価され、計算コストと表現力の限界が増大する。
さらに、IW(1)は原子数と線形にスケールするため魅力的であるが、国際計画コンペティション(IPC)2023のベンチマークのように、何千もの天体が検討されると非効率になる。
どちらの制限にも対処します。
まず、探索木全体のより効率的な包括的エンコーディングを導入する。
IW(1)到達可能な状態は、現在の状態とのリレーショナルな差異によってのみ表現され、リレーショナルGNN(R-GNN)は1回のフォワードパスですべての遷移をスコアできる。
第2に、新規チェック中の関係抽象化によるスケーリングを改善するために、抽象IW(1)を定義する。
完全にインスタンス化された原子をテストするのではなく、1つの引数を除く全ての原子をその型に置き換えることで、各原子を抽象化する。
元の原子は、その抽象形のいずれかが新規である場合、新規である。
この構造圧縮は、意味のある部分構造を保持しながら、新規な探索スケーリングを原子から物体にシフトさせる。
我々は、ハイパースケーリングIPC 2023ベンチマークと、C_2$ロジックフラグメント以上の機能を必要とするドメインを含む様々なドメインに対するコントリビューションを評価した。
我々の政策は、古典的プランナーのLAMAなど、過去の成果を大きく上回って、新しい最先端のパフォーマンスを実現します。
関連論文リスト
- Analysis of Optimality of Large Language Models on Planning Problems [12.31072556856411]
共振強化型Large Language Model (LLM) プランナーは理論的最適性限界をほぼ完全精度で追跡する。
また、意味論的先行から真の位相的推論を分離するために、公式な等価タスクである一般化されたパススター(P*$)グラフについても検討する。
論文 参考訳(メタデータ) (2026-04-03T09:27:16Z) - HGNet: Scalable Foundation Model for Automated Knowledge Graph Generation from Scientific Literature [6.001574550157585]
本稿では,スケーラブルでゼロショットの科学知識グラフ構築のための2段階フレームワークを提案する。
階層的関係抽出のためのベンチマークSPHEREをリリースする。
ゼロショット設定では、NERが10.76%、REが26.2%に達する。
論文 参考訳(メタデータ) (2026-03-24T12:35:10Z) - Bearing Syntactic Fruit with Stack-Augmented Neural Networks [59.49467149799849]
スタック拡張ニューラルネットワークは、標準的なアーキテクチャよりも、人間の言語習得の正確なモデルであることを示す。
また、階層的一般化を改善するスタックRNNアーキテクチャの修正も提案する。
論文 参考訳(メタデータ) (2025-11-05T15:30:58Z) - RefAtomNet++: Advancing Referring Atomic Video Action Recognition using Semantic Retrieval based Multi-Trajectory Mamba [86.47790050206306]
RefAVA++は290万フレームと75.1kの注釈付き人で構成される。
RefAtomNet++は、多階層的なセマンティックアラインなクロスアテンションメカニズムを通じて、クロスモーダルトークンアグリゲーションを前進させる。
実験によると、RefAtomNet++は新しい最先端の結果を確立している。
論文 参考訳(メタデータ) (2025-10-18T10:41:19Z) - Learning to Ground Existentially Quantified Goals [10.343546104340962]
自律的なAIエージェントのためのゴール命令は、オブジェクトがユニークな名前を持っていると仮定することはできない。
これは古典的な計画と一般化された計画の両方において問題を引き起こす。
本研究では,新しい教師付き学習手法を用いて,目標設定問題に対処する。
論文 参考訳(メタデータ) (2024-09-30T12:49:27Z) - Generalized Few-Shot Continual Learning with Contrastive Mixture of
Adapters [59.82088750033897]
我々は,クラスおよびドメインインクリメンタルな状況を含む汎用FSCL (GFSCL) プロトコルを構築した。
一般的な連続学習手法は、目に見えない領域に一般化能力が乏しいことが判明した。
このようにして、視覚変換器(ViT)に基づくリハーサルフリーフレームワークであるContrastive Mixture of Adapters(CMoA)を提案する。
論文 参考訳(メタデータ) (2023-02-12T15:18:14Z) - Vision Transformers: From Semantic Segmentation to Dense Prediction [139.15562023284187]
視覚的予測のための視覚変換器(ViT)のグローバルな文脈学習の可能性について検討する。
我々のモチベーションは、グローバルコンテキストを全受容界層で学習することで、ViTがより強力な長距離依存性情報を取得することである。
階層型ローカル・グローバル・トランスフォーマー (HLG) のファミリを定式化し, 窓内部の局所的な注意と, ピラミッド建築における窓全体のグローバルアテンションを特徴とする。
論文 参考訳(メタデータ) (2022-07-19T15:49:35Z) - Learning Generalized Policies Without Supervision Using GNNs [20.322992960599255]
グラフニューラルネットワークを用いた古典的計画領域の一般政策学習の問題点を考察する。
我々は,単純で汎用的なGNNアーキテクチャを用いて,鮮明な実験結果を得ることを目的としている。
我々は、GNNの表現力と一階述語論理の$C_2$フラグメントの間に確立された関係を利用する。
論文 参考訳(メタデータ) (2022-05-12T10:28:46Z) - Planning and Learning with Adaptive Lookahead [74.39132848733847]
ポリシーイテレーション(PI)アルゴリズムは、欲求の一段階の改善と政策評価を交互に行う。
近年の文献では、複数段階のルックアヘッドポリシーの改善が、イテレーション毎の複雑さの増加を犠牲にして、よりコンバージェンス率の向上につながることが示されている。
本研究では,多段階の地平線を状態と推定値の関数として動的に適応する手法を初めて提案する。
論文 参考訳(メタデータ) (2022-01-28T20:26:55Z) - Hierarchical Prototype Networks for Continual Graph Representation
Learning [90.78466005753505]
本稿では,連続的に拡張されたグラフを表現するために,プロトタイプの形式で抽象的な知識のレベルを抽出する階層型プロトタイプネットワーク(HPN)を提案する。
我々はHPNが最先端のベースライン技術を上回るだけでなく、メモリ消費も比較的少ないことを示した。
論文 参考訳(メタデータ) (2021-11-30T14:15:14Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。