論文の概要: LLM-Evolved Pattern Generators for Optimal Classical Planning
- arxiv url: http://arxiv.org/abs/2606.02438v1
- Date: Mon, 01 Jun 2026 16:10:20 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-02 21:34:32.489668
- Title: LLM-Evolved Pattern Generators for Optimal Classical Planning
- Title(参考訳): 最適古典計画のためのLLM型パターン生成装置
- Authors: Windy Phung, Dominik Drexler, Arnaud Lequen, Jendrik Seipp,
- Abstract要約: 本稿では,A*探索の最適性を保証するために,設計によって許容されるドメイン依存ミスを学習するための最初の手法を提案する。
進化的プログラム合成フレームワークを用いて、各ドメインに対して、そのドメイン内の任意のタスクに対してパターンコレクションを生成するプログラムを取得し、その結果のパターンを飽和コストによって許容的に組み合わせる。
- 参考スコア(独自算出の注目度): 2.432409923443071
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Learned heuristics have recently become a competitive alternative to traditional domain-independent heuristics for satisficing planning. Existing approaches, however, focus on improving search guidance rather than guaranteeing admissibility, which makes them unsuitable for optimal classical planning. We present the first method for learning domain-dependent heuristics that are admissible by design and thus preserve the optimality guarantees of A* search. Instead of learning a direct mapping from states to heuristic values, we learn to construct abstractions that induce admissible heuristics. We use an LLM-driven evolutionary program-synthesis framework to obtain, for each domain, a program that produces a pattern collection for any task in that domain, and we combine the resulting patterns admissibly via saturated cost partitioning. Empirically, the learned programs encode interpretable domain-specific insights, run with negligible overhead at test time and yield heuristics that match the coverage of state-of-the-art domain-independent baselines on several domains while evaluating each state substantially faster.
- Abstract(参考訳): 学習されたヒューリスティックスは、最近、満足な計画のために伝統的なドメインに依存しないヒューリスティックの代替となる。
しかし、既存のアプローチでは、許容性を保証するのではなく、検索指導の改善に重点を置いているため、最適な古典的計画には適さない。
本稿では,設計によって許容されるドメイン依存ヒューリスティックを学習し,A*探索の最適性を保証するための最初の手法を提案する。
状態からヒューリスティックな値への直接マッピングを学ぶ代わりに、許容可能なヒューリスティックを誘導する抽象化を構築することを学ぶ。
我々はLLM駆動の進化的プログラム合成フレームワークを用いて、各ドメインに対して、そのドメイン内の任意のタスクに対してパターンコレクションを生成するプログラムを取得し、その結果のパターンを飽和コスト分割によって許容的に組み合わせる。
経験的に、学習プログラムは解釈可能なドメイン固有の洞察を符号化し、テスト時に無視可能なオーバーヘッドで実行し、複数のドメインにおける最先端のドメインに依存しないベースラインのカバレッジに匹敵するヒューリスティックをもたらす。
関連論文リスト
- Generating Robust Portfolios of Optimization Models using Large Language Models [27.600634702684733]
我々は最適化モデルの生成と評価を行う新しい方法を開発した。
ポートフォリオが人間の好みによく適合していることを示す理論的保証を提供する。
範囲最適化モデリングタスクにおける高い性能を示す。
論文 参考訳(メタデータ) (2026-05-26T13:30:43Z) - Hierarchical Task Network Planning with LLM-Generated Heuristics [45.222898125439286]
大規模言語モデル(LLM)がHTN計画に有効な探索アルゴリズムを生成できるかどうかを検討する。
LLMは最高のHTNプランナのカバレッジとほぼ一致し、共有問題の83%で検索の労力を大幅に削減した。
論文 参考訳(メタデータ) (2026-05-08T13:14:31Z) - LLM-Generated Heuristics for AI Planning: Do We Even Need Domain-Independence Anymore? [87.71321254733384]
大規模言語モデル(LLM)は、特定の計画問題に適した計画手法を生成することができる。
LLMは、いくつかの標準IPCドメインで最先端のパフォーマンスを達成することができる。
これらの結果がパラダイムシフトを意味するのか、既存の計画手法をどのように補完するかについて議論する。
論文 参考訳(メタデータ) (2025-01-30T22:21:12Z) - Realistic Unsupervised CLIP Fine-tuning with Universal Entropy Optimization [101.08992036691673]
本稿では,未知のクラスにおける配布外サンプルの存在を考慮し,教師なしの微調整シナリオについて考察する。
特に,分布外検出と既知のクラスに関連するインスタンスの認識を同時に強化することに注力する。
我々はUniversal Entropy Optimization(UEO)と呼ばれるシンプルで効率的で効果的なアプローチを提案する。
論文 参考訳(メタデータ) (2023-08-24T16:47:17Z) - Efficient Model-Free Exploration in Low-Rank MDPs [76.87340323826945]
低ランクマルコフ決定プロセスは、関数近似を持つRLに対して単純だが表現力のあるフレームワークを提供する。
既存のアルゴリズムは、(1)計算的に抽出可能であるか、または(2)制限的な統計的仮定に依存している。
提案手法は,低ランクMPPの探索のための最初の実証可能なサンプル効率アルゴリズムである。
論文 参考訳(メタデータ) (2023-07-08T15:41:48Z) - Randomized Adversarial Style Perturbations for Domain Generalization [49.888364462991234]
本稿では,RASP(Randomized Adversarial Style Perturbation)と呼ばれる新しい領域一般化手法を提案する。
提案アルゴリズムは, ランダムに選択されたクラスに対して, 対角方向の特徴のスタイルを乱し, 予期せぬ対象領域で観測される予期せぬスタイルに誤解されないよう, モデルを学習させる。
提案アルゴリズムは,様々なベンチマークによる広範な実験により評価され,特に大規模ベンチマークにおいて,領域一般化性能が向上することを示す。
論文 参考訳(メタデータ) (2023-04-04T17:07:06Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。