論文の概要: Learning Interpretable Classifiers for PDDL Planning
- arxiv url: http://arxiv.org/abs/2410.10011v1
- Date: Sun, 13 Oct 2024 21:12:45 GMT
- ステータス: 処理完了
- システム内更新日: 2024-10-30 03:43:37.175026
- Title: Learning Interpretable Classifiers for PDDL Planning
- Title(参考訳): PDDL計画のための解釈可能な分類器の学習
- Authors: Arnaud Lequen,
- Abstract要約: PDDLで表される同様の計画課題のセットにおいて,エージェントの振る舞いを他のエージェントと比較して認識する解釈可能なモデルの問題を考える。
我々のアプローチは、エージェントが小さなプランニングインスタンスをどのように解決したかを示す小さな例から、論理式を学習することで構成される。
このような公式の学習はNPハード問題であるため、計算的に難解であることが示される。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: We consider the problem of synthesizing interpretable models that recognize the behaviour of an agent compared to other agents, on a whole set of similar planning tasks expressed in PDDL. Our approach consists in learning logical formulas, from a small set of examples that show how an agent solved small planning instances. These formulas are expressed in a version of First-Order Temporal Logic (FTL) tailored to our planning formalism. Such formulas are human-readable, serve as (partial) descriptions of an agent's policy, and generalize to unseen instances. We show that learning such formulas is computationally intractable, as it is an NP-hard problem. As such, we propose to learn these behaviour classifiers through a topology-guided compilation to MaxSAT, which allows us to generate a wide range of different formulas. Experiments show that interesting and accurate formulas can be learned in reasonable time.
- Abstract(参考訳): 我々は,PDDLで表される同様の計画課題の集合において,エージェントの動作を認識する解釈可能なモデルを他のエージェントと比較する問題を考える。
我々のアプローチは、エージェントが小さなプランニングインスタンスをどのように解決したかを示す小さな例から、論理式を学習することで構成される。
これらの式は、我々の計画形式に合わせた一階テンポラル論理(FTL)のバージョンで表現される。
このような公式は可読性があり、エージェントのポリシーの(部分的な)記述として機能し、目に見えないインスタンスに一般化する。
このような公式の学習はNPハード問題であるため、計算的に難解であることが示される。
そこで我々は,これらの振る舞い分類器をMaxSATへのトポロジ誘導コンパイルにより学習し,多種多様な式を生成することを提案する。
実験により、興味深い正確な公式が妥当な時間で学習できることが示されている。
関連論文リスト
- Unveiling the Statistical Foundations of Chain-of-Thought Prompting Methods [59.779795063072655]
CoT(Chain-of-Thought)の促進とその変種は、多段階推論問題を解決する効果的な方法として人気を集めている。
統計的推定の観点からCoTのプロンプトを解析し,その複雑さを包括的に評価する。
論文 参考訳(メタデータ) (2024-08-25T04:07:18Z) - Shape Arithmetic Expressions: Advancing Scientific Discovery Beyond Closed-Form Equations [56.78271181959529]
GAM(Generalized Additive Models)は、変数とターゲットの間の非線形関係をキャプチャできるが、複雑な特徴相互作用をキャプチャすることはできない。
本稿では,GAMのフレキシブルな形状関数と,数学的表現に見られる複雑な特徴相互作用を融合させる形状表現算術(SHARE)を提案する。
また、標準制約を超えた表現の透明性を保証するSHAREを構築するための一連のルールを設計する。
論文 参考訳(メタデータ) (2024-04-15T13:44:01Z) - TRIGO: Benchmarking Formal Mathematical Proof Reduction for Generative
Language Models [68.65075559137608]
本稿では, ATP ベンチマーク TRIGO を提案する。このベンチマークでは, ステップバイステップの証明で三角法式を縮小するだけでなく, 論理式上で生成する LM の推論能力を評価する。
我々は、Webから三角法式とその縮小フォームを収集し、手作業で単純化プロセスに注釈を付け、それをリーン形式言語システムに翻訳する。
我々はLean-Gymに基づく自動生成装置を開発し、モデルの一般化能力を徹底的に分析するために、様々な困難と分布のデータセット分割を作成する。
論文 参考訳(メタデータ) (2023-10-16T08:42:39Z) - Multi-Valued Partial Order Plans in Numeric Planning [14.290119665435121]
まずは、検索問題として制限タスクとして知られる数値計画問題を再構築することから始める。
次に、ブールアンを用いてNP完全計画の断片をいかに見つけられるかを示す。
これを実現するために、我々は、多値部分順序計画の考え方を発展させる。
論文 参考訳(メタデータ) (2023-07-27T07:24:30Z) - Factorization of Multi-Agent Sampling-Based Motion Planning [72.42734061131569]
現代のロボティクスは、共有環境内で複数のエンボディエージェントを動作させることが多い。
標準的なサンプリングベースのアルゴリズムは、ロボットの関節空間における解の探索に使用できる。
我々は、因子化の概念をサンプリングベースアルゴリズムに統合し、既存の手法への最小限の変更しか必要としない。
本稿では, PRM* のサンプル複雑性の観点から解析的ゲインを導出し, RRG の実証結果を示す。
論文 参考訳(メタデータ) (2023-04-01T15:50:18Z) - Linear Temporal Logic Modulo Theories over Finite Traces (Extended
Version) [72.38188258853155]
有限トレース(LTLf)上の線形時間論理について検討する。
命題の文字は任意の理論で解釈された一階述語式に置き換えられる。
Satisfiability Modulo Theories (LTLfMT) と呼ばれる結果の論理は半決定可能である。
論文 参考訳(メタデータ) (2022-04-28T17:57:33Z) - Compositionality as Lexical Symmetry [42.37422271002712]
意味解析、命令追従、質問応答といったタスクでは、標準的なディープネットワークは小さなデータセットから合成的に一般化できない。
本稿では、モデルよりもデータ分布の対称性の制約として、構成性のドメイン一般およびモデル非依存の定式化を提案する。
LEXSYMと呼ばれる手法は,これらの変換を自動的に検出し,通常のニューラルシーケンスモデルのトレーニングデータに適用する。
論文 参考訳(メタデータ) (2022-01-30T21:44:46Z) - Validation and Inference of Agent Based Models [0.0]
Agent Based Modelling (ABM) は自律エージェントの動作と相互作用をシミュレーションするための計算フレームワークである。
ABCの最近の研究は、近似確率を計算するためのアルゴリズムをますます効率的にしている。
これらをハミルトンCBDの歩行者モデルを用いて検討・比較した。
論文 参考訳(メタデータ) (2021-07-08T05:53:37Z) - On Exploiting Hitting Sets for Model Reconciliation [53.81101846598925]
ヒューマン・アウェア・プランニングにおいて、プランニング・エージェントは、その計画がなぜ最適なのかを人間に説明する必要があるかもしれない。
この手法はモデル和解と呼ばれ、エージェントはモデルと人間のモデルの違いを調和させようとする。
我々は,計画の領域を超えて拡張されたモデル和解のための論理ベースのフレームワークを提案する。
論文 参考訳(メタデータ) (2020-12-16T21:25:53Z) - Encoding formulas as deep networks: Reinforcement learning for zero-shot
execution of LTL formulas [21.481360281719006]
入力式を入力とし,満足度を判定する強化学習エージェントを実証する。
入力公式はこれまで見たことがないが、ネットワークはそれらを満足させるためにゼロショットの一般化を実行する。
これはRLエージェントのための新しいマルチタスク学習の形式であり、エージェントは1つの多様なタスクから学習し、新しい多様なタスクセットに一般化する。
論文 参考訳(メタデータ) (2020-06-01T17:50:20Z) - Learning Interpretable Models in the Property Specification Language [6.875312133832079]
IEEE標準時相論理PSLにおける公式の学習アルゴリズムを開発した。
私たちの研究は、n番目の点ごとに起こる事象のような多くの自然の性質が、言葉で表現できないという事実に動機づけられている。
論文 参考訳(メタデータ) (2020-02-10T11:42:50Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。