論文の概要: Planning Domain Model Acquisition from State Traces without Action Parameters
- arxiv url: http://arxiv.org/abs/2402.10726v4
- Date: Fri, 07 Mar 2025 10:45:07 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-03-10 15:56:25.923845
- Title: Planning Domain Model Acquisition from State Traces without Action Parameters
- Title(参考訳): 動作パラメータのない状態トレースからのドメインモデル獲得計画
- Authors: Tomáš Balyo, Martin Suda, Lukáš Chrpa, Dominik Šafránek, Stephan Gocht, Filip Dvořák, Roman Barták, G. Michael Youngblood,
- Abstract要約: 本研究では,観測可能な状態変化のある状態トレースからアクションスキーマを学習する手法を提案する。
このタスクは、少なくともグラフ同型と同様に困難であることを示す。
最先端の学習ツールSAMとExtended SAMと比較して、新しいアルゴリズムは複数のドメインでより良い結果を提供することができる。
- 参考スコア(独自算出の注目度): 6.841866610276552
- License:
- Abstract: Existing planning action domain model acquisition approaches consider different types of state traces from which they learn. The differences in state traces refer to the level of observability of state changes (from full to none) and whether the observations have some noise (the state changes might be inaccurately logged). However, to the best of our knowledge, all the existing approaches consider state traces in which each state change corresponds to an action specified by its name and all its parameters (all objects that are relevant to the action). Furthermore, the names and types of all the parameters of the actions to be learned are given. These assumptions are too strong. In this paper, we propose a method that learns action schema from state traces with fully observable state changes but without the parameters of actions responsible for the state changes (only action names are part of the state traces). Although we can easily deduce the number (and names) of the actions that will be in the learned domain model, we still need to deduce the number and types of the parameters of each action alongside its precondition and effects. We show that this task is at least as hard as graph isomorphism. However, our experimental evaluation on a large collection of IPC benchmarks shows that our approach is still practical as the number of required parameters is usually small. Compared to the state-of-the-art learning tools SAM and Extended SAM our new algorithm is able to provide better results in multiple domains in terms of learning action models more similar to reference models, even though it uses less information and has fewer restrictions on the input traces.
- Abstract(参考訳): 既存のプランニングアクションドメインモデル取得アプローチでは、学習する状態トレースのタイプが異なる。
状態トレースの違いは、状態変化の観測可能性のレベル(満点から無点まで)と、観測結果にノイズがあるかどうか(状態変化が不正確なログ化される可能性がある)を指す。
しかしながら、私たちの知る限りでは、既存のすべてのアプローチは、それぞれの状態が名前とそのパラメータ(アクションに関連するすべてのオブジェクト)によって指定されたアクションに対応する状態トレースを考慮に入れています。
さらに、学習すべきアクションのすべてのパラメータの名前と型が与えられる。
これらの仮定は強すぎる。
本稿では,状態変化に責任を持つ動作パラメータを使わずに,状態変化を観測可能な状態トレースからアクションスキーマを学習する手法を提案する。
学習したドメインモデルにあるアクションの数(と名前)を簡単に推論できるが、各アクションのパラメータの数と型を、その前提条件と効果とともに推論する必要がある。
このタスクは、少なくともグラフ同型と同様に困難であることを示す。
しかし, IPC ベンチマークを大量に収集した実験結果から,要求パラメータの数が少ないため,本手法は依然として有効であることが示唆された。
SAMやExtended SAMといった最先端の学習ツールと比較して、私たちの新しいアルゴリズムは、少ない情報を使用し、入力トレースの制限が少ないにもかかわらず、参照モデルに類似した学習アクションモデルによって、複数のドメインでより良い結果を提供することができます。
関連論文リスト
- Integrating Reinforcement Learning, Action Model Learning, and Numeric Planning for Tackling Complex Tasks [12.281688043929996]
自動計画アルゴリズムは、各アクションの前提条件と効果を指定するドメインのモデルを必要とする。
数値的なドメインモデルと計画の学習が、数値的な計画環境にとって効果的なアプローチであるかどうかは不明だ。
本研究では、数値的なドメインモデルを学習し、それを代替のモデルフリーソリューションと比較する利点について検討する。
論文 参考訳(メタデータ) (2025-02-18T16:26:21Z) - Improved Localized Machine Unlearning Through the Lens of Memorization [23.30800397324838]
我々は局所的アンラーニングについて研究し、未学習アルゴリズムはパラメータの小さなサブセットで動作する。
そこで我々は,既存の未学習アルゴリズムと組み合わせた場合,強力な結果が得られるローカライゼーション戦略を提案する。
また、最も重要とされるパラメータをリセットする新しい未学習アルゴリズムDeletion by Example Localization (DEL)を提案する。
論文 参考訳(メタデータ) (2024-12-03T12:57:08Z) - Bidirectional Decoding: Improving Action Chunking via Closed-Loop Resampling [51.38330727868982]
双方向デコーディング(BID)は、クローズドループ操作で動作チャンキングをブリッジするテスト時間推論アルゴリズムである。
BIDは、7つのシミュレーションベンチマークと2つの実世界のタスクにまたがって、最先端の2つの生成ポリシーの性能を向上させることを示す。
論文 参考訳(メタデータ) (2024-08-30T15:39:34Z) - Recent Advances in Named Entity Recognition: A Comprehensive Survey and Comparative Study [8.91661466156389]
NERに対する最近のポピュラーなアプローチの概要を紹介する。
我々は、強化学習とグラフベースのアプローチについて論じ、NERの性能向上におけるそれらの役割を強調した。
我々は,異なる特徴を持つ各種データセット上での主NER実装の性能を評価する。
論文 参考訳(メタデータ) (2024-01-19T17:21:05Z) - An Efficient Active Learning Pipeline for Legal Text Classification [2.462514989381979]
法律分野における事前学習言語モデルを用いて,能動的学習を効果的に活用するためのパイプラインを提案する。
我々は、知識蒸留を用いてモデルの埋め込みを意味論的意味のある空間に導く。
分類タスクに適応したContract-NLIとLEDGARベンチマークの実験により,本手法が標準AL戦略より優れていることが示された。
論文 参考訳(メタデータ) (2022-11-15T13:07:02Z) - Discover, Explanation, Improvement: An Automatic Slice Detection
Framework for Natural Language Processing [72.14557106085284]
スライス検出モデル(SDM)は、データポイントの低パフォーマンスなグループを自動的に識別する。
本稿では,NLPタスクの分類のための "Discover, Explain, improve (DEIM)" というベンチマークを提案する。
評価の結果,Edisaは情報的セマンティックな特徴を持つ誤り発生データポイントを正確に選択できることがわかった。
論文 参考訳(メタデータ) (2022-11-08T19:00:00Z) - Value-Consistent Representation Learning for Data-Efficient
Reinforcement Learning [105.70602423944148]
本稿では,意思決定に直接関連のある表現を学習するための,VCR(Value-Consistent Expression Learning)という新しい手法を提案する。
この想像された状態と環境によって返される実状態とを一致させる代わりに、VCRは両方の状態に$Q$-valueヘッドを適用し、2つのアクション値の分布を得る。
検索不要なRLアルゴリズムに対して,提案手法が新たな最先端性能を実現することが実証された。
論文 参考訳(メタデータ) (2022-06-25T03:02:25Z) - Continual Learning via Bit-Level Information Preserving [88.32450740325005]
我々は情報理論のレンズを通して連続学習過程を研究する。
モデルパラメータの情報利得を維持するビットレベル情報保存(BLIP)を提案する。
BLIPは、連続的な学習を通してメモリオーバーヘッドを一定に保ちながら、ほとんど忘れることができない。
論文 参考訳(メタデータ) (2021-05-10T15:09:01Z) - Meta-learning for Few-shot Natural Language Processing: A Survey [10.396506243272158]
Few-shot Natural Language Processing (NLP) は、ラベル付き例のごく一部に付随するNLPタスクを指す。
本稿では,NLP領域,特に少数ショットアプリケーションに焦点をあてる。
メタラーニングを数ショットNLPに適用する際の、より明確な定義、進捗の概要、一般的なデータセットを提供しようとしている。
論文 参考訳(メタデータ) (2020-07-19T06:36:41Z) - Retrieval-Augmented Generation for Knowledge-Intensive NLP Tasks [133.93803565077337]
検索強化生成モデルは、事前訓練されたパラメトリックメモリと非パラメトリックメモリを組み合わせて言語生成を行う。
我々は、RAGモデルが、最先端パラメトリックのみのセク2セックベースラインよりも、より具体的で、多様で、現実的な言語を生成することを示す。
論文 参考訳(メタデータ) (2020-05-22T21:34:34Z) - STRIPS Action Discovery [67.73368413278631]
近年のアプローチでは、すべての中間状態が欠如している場合でも、アクションモデルを合成する古典的な計画が成功している。
アクションシグネチャが不明な場合に,従来のプランナーを用いてSTRIPSアクションモデルを教師なしで合成するアルゴリズムを提案する。
論文 参考訳(メタデータ) (2020-01-30T17:08:39Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。