論文の概要: Learning Planning Action Models from State Traces
- arxiv url: http://arxiv.org/abs/2402.10726v1
- Date: Fri, 16 Feb 2024 14:36:58 GMT
- ステータス: 処理完了
- システム内更新日: 2024-02-19 15:51:47.139210
- Title: Learning Planning Action Models from State Traces
- Title(参考訳): 状態トレースから計画行動モデルを学ぶ
- Authors: Tom\'a\v{s} Balyo, Martin Suda, Luk\'a\v{s} Chrpa, Dominik
\v{S}afr\'anek, Filip Dvo\v{r}\'ak, Roman Bart\'ak, G. Michael Youngblood
- Abstract要約: 学習行動のパラメータが提供されない状況における学習について検討する。
本稿では,どの情報を提供するかに基づいて,トレース品質のレベルを2つ提示し,それぞれにアルゴリズムを提案する。
提案アルゴリズムを実験により評価し,最先端の学習ツールFAMAと比較した。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Previous STRIPS domain model acquisition approaches that learn from state
traces start with the names and parameters of the actions to be learned.
Therefore their only task is to deduce the preconditions and effects of the
given actions. In this work, we explore learning in situations when the
parameters of learned actions are not provided. We define two levels of trace
quality based on which information is provided and present an algorithm for
each. In one level (L1), the states in the traces are labeled with action
names, so we can deduce the number and names of the actions, but we still need
to work out the number and types of parameters. In the other level (L2), the
states are additionally labeled with objects that constitute the parameters of
the corresponding grounded actions. Here we still need to deduce the types of
the parameters in the learned actions. We experimentally evaluate the proposed
algorithms and compare them with the state-of-the-art learning tool FAMA on a
large collection of IPC benchmarks. The evaluation shows that our new
algorithms are faster, can handle larger inputs and provide better results in
terms of learning action models more similar to reference models.
- Abstract(参考訳): 状態トレースから学習する以前のSTRIPSドメインモデル取得アプローチは、学習すべきアクションの名前とパラメータから始まる。
したがって、彼らの唯一の仕事は、与えられたアクションの前提条件と効果を推測することである。
本研究では,学習行動のパラメータが提供されない状況における学習について検討する。
我々は,情報の提供状況に基づいてトレース品質のレベルを2つ定義し,それぞれにアルゴリズムを提案する。
あるレベル(L1)では、トレース中の状態はアクション名でラベル付けされているので、アクションの数と名前は推論できますが、パラメータの数とタイプを調査する必要があります。
他のレベル (l2) では、状態は対応する接地アクションのパラメータを構成するオブジェクトでラベル付けされる。
ここでは、学習したアクションのパラメータの型を推論する必要があります。
提案アルゴリズムを実験的に評価し,多数のiccベンチマークを用いた最先端学習ツールfamaと比較した。
評価の結果、新しいアルゴリズムはより高速で、より大きな入力を処理でき、より参照モデルに近い学習アクションモデルの観点でより良い結果が得られることがわかった。
関連論文リスト
- MoBYv2AL: Self-supervised Active Learning for Image Classification [57.4372176671293]
画像分類のための自己教師型アクティブラーニングフレームワークであるMoBYv2ALを提案する。
私たちの貢献は、最も成功した自己教師付き学習アルゴリズムであるMoBYをALパイプラインに持ち上げることです。
近年のAL法と比較すると,最先端の結果が得られている。
論文 参考訳(メタデータ) (2023-01-04T10:52:02Z) - An Efficient Active Learning Pipeline for Legal Text Classification [2.462514989381979]
法律分野における事前学習言語モデルを用いて,能動的学習を効果的に活用するためのパイプラインを提案する。
我々は、知識蒸留を用いてモデルの埋め込みを意味論的意味のある空間に導く。
分類タスクに適応したContract-NLIとLEDGARベンチマークの実験により,本手法が標準AL戦略より優れていることが示された。
論文 参考訳(メタデータ) (2022-11-15T13:07:02Z) - Discover, Explanation, Improvement: An Automatic Slice Detection
Framework for Natural Language Processing [72.14557106085284]
スライス検出モデル(SDM)は、データポイントの低パフォーマンスなグループを自動的に識別する。
本稿では,NLPタスクの分類のための "Discover, Explain, improve (DEIM)" というベンチマークを提案する。
評価の結果,Edisaは情報的セマンティックな特徴を持つ誤り発生データポイントを正確に選択できることがわかった。
論文 参考訳(メタデータ) (2022-11-08T19:00:00Z) - Active Learning with Effective Scoring Functions for Semi-Supervised
Temporal Action Localization [15.031156121516211]
本稿では,半教師型talという,滅多に研究されていない実践的な課題に焦点を当てる。
本稿では,AL-STALという効果的な能動学習手法を提案する。
実験の結果,AL-STALは既存の競争相手よりも優れ,完全教師付き学習と比較して満足度が高いことがわかった。
論文 参考訳(メタデータ) (2022-08-31T13:39:38Z) - Value-Consistent Representation Learning for Data-Efficient
Reinforcement Learning [105.70602423944148]
本稿では,意思決定に直接関連のある表現を学習するための,VCR(Value-Consistent Expression Learning)という新しい手法を提案する。
この想像された状態と環境によって返される実状態とを一致させる代わりに、VCRは両方の状態に$Q$-valueヘッドを適用し、2つのアクション値の分布を得る。
検索不要なRLアルゴリズムに対して,提案手法が新たな最先端性能を実現することが実証された。
論文 参考訳(メタデータ) (2022-06-25T03:02:25Z) - Optimizing Active Learning for Low Annotation Budgets [6.753808772846254]
ディープラーニングでは、アクティブな学習は通常、微調整によって連続した深層モデルを更新する反復的なプロセスとして実装される。
移行学習にインスパイアされたアプローチを用いてこの問題に対処する。
本稿では,ALプロセスの反復性を利用してより堅牢なサンプルを抽出する新しい取得関数を提案する。
論文 参考訳(メタデータ) (2022-01-18T18:53:10Z) - Continual Learning via Bit-Level Information Preserving [88.32450740325005]
我々は情報理論のレンズを通して連続学習過程を研究する。
モデルパラメータの情報利得を維持するビットレベル情報保存(BLIP)を提案する。
BLIPは、連続的な学習を通してメモリオーバーヘッドを一定に保ちながら、ほとんど忘れることができない。
論文 参考訳(メタデータ) (2021-05-10T15:09:01Z) - Few-shot Sequence Learning with Transformers [79.87875859408955]
少数のトレーニング例で提供される新しいタスクの学習を目的とした少数のショットアルゴリズム。
本研究では,データポイントがトークンのシーケンスである設定において,少数ショット学習を行う。
トランスフォーマーに基づく効率的な学習アルゴリズムを提案する。
論文 参考訳(メタデータ) (2020-12-17T12:30:38Z) - Meta-learning for Few-shot Natural Language Processing: A Survey [10.396506243272158]
Few-shot Natural Language Processing (NLP) は、ラベル付き例のごく一部に付随するNLPタスクを指す。
本稿では,NLP領域,特に少数ショットアプリケーションに焦点をあてる。
メタラーニングを数ショットNLPに適用する際の、より明確な定義、進捗の概要、一般的なデータセットを提供しようとしている。
論文 参考訳(メタデータ) (2020-07-19T06:36:41Z) - Fase-AL -- Adaptation of Fast Adaptive Stacking of Ensembles for
Supporting Active Learning [0.0]
本研究は,Active Learning を用いて非ラベルのインスタンスで分類モデルを誘導する FASE-AL アルゴリズムを提案する。
このアルゴリズムは、正しく分類されたインスタンスの割合で有望な結果を得る。
論文 参考訳(メタデータ) (2020-01-30T17:25:47Z) - STRIPS Action Discovery [67.73368413278631]
近年のアプローチでは、すべての中間状態が欠如している場合でも、アクションモデルを合成する古典的な計画が成功している。
アクションシグネチャが不明な場合に,従来のプランナーを用いてSTRIPSアクションモデルを教師なしで合成するアルゴリズムを提案する。
論文 参考訳(メタデータ) (2020-01-30T17:08:39Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。