Fugu-MT 論文翻訳(概要): Planning Domain Model Acquisition from State Traces without Action Parameters

論文の概要: Planning Domain Model Acquisition from State Traces without Action Parameters

arxiv url: http://arxiv.org/abs/2402.10726v2
Date: Tue, 20 Aug 2024 12:24:00 GMT
ステータス: 翻訳完了
システム内更新日: 2024-08-21 20:19:21.641452
Title: Planning Domain Model Acquisition from State Traces without Action Parameters
Title（参考訳）: 動作パラメータのない状態トレースからのドメインモデル獲得計画
Authors: Tomáš Balyo, Martin Suda, Lukáš Chrpa, Dominik Šafránek, Stephan Gocht, Filip Dvořák, Roman Barták, G. Michael Youngblood,
Abstract要約: 学習行動のパラメータが提供されない状況における学習について検討する。本稿では,どの情報を提供するかに基づいて,トレース品質のレベルを2つ提示し,それぞれにアルゴリズムを提案する。提案アルゴリズムを実験により評価し,最先端の学習ツールFAMAと比較した。
参考スコア（独自算出の注目度）: 6.841866610276552
License: http://creativecommons.org/licenses/by-nc-nd/4.0/
Abstract: Previous STRIPS domain model acquisition approaches that learn from state traces start with the names and parameters of the actions to be learned. Therefore their only task is to deduce the preconditions and effects of the given actions. In this work, we explore learning in situations when the parameters of learned actions are not provided. We define two levels of trace quality based on which information is provided and present an algorithm for each. In one level (L1), the states in the traces are labeled with action names, so we can deduce the number and names of the actions, but we still need to work out the number and types of parameters. In the other level (L2), the states are additionally labeled with objects that constitute the parameters of the corresponding grounded actions. Here we still need to deduce the types of the parameters in the learned actions. We experimentally evaluate the proposed algorithms and compare them with the state-of-the-art learning tool FAMA on a large collection of IPC benchmarks. The evaluation shows that our new algorithms are faster, can handle larger inputs and provide better results in terms of learning action models more similar to reference models.
Abstract（参考訳）: 状態トレースから学習する以前のSTRIPSドメインモデル取得アプローチは、学習すべきアクションの名前とパラメータから始まる。したがって、彼らの唯一の仕事は、与えられた行動の前提条件と効果を推論することである。本研究では,学習行動のパラメータが提供されない状況下での学習について検討する。我々は,どの情報を提供するかに基づいて,トレース品質のレベルを定義し,それぞれにアルゴリズムを提示する。あるレベル(L1)では、トレース中の状態はアクション名でラベル付けされているので、アクションの数と名前は推論できますが、パラメータの数とタイプを調査する必要があります。他のレベル(L2)では、状態に対応する接地行動のパラメータを構成するオブジェクトを付加ラベル付けする。ここでは、学習したアクションのパラメータの型を推論する必要があります。提案アルゴリズムを実験により評価し,ICCベンチマークにおける最先端学習ツールFAMAと比較した。評価の結果、我々の新しいアルゴリズムはより高速で、より大きな入力を処理でき、参照モデルに類似した学習行動モデルにおいてより良い結果が得られることがわかった。

関連論文リスト

Learning Lifted Action Models From Traces of Incomplete Actions and States [6.30853901017231]
ランダムな状態-動作トレースからスライディングタイルパズルの昇降STRIPSモデルを学習する問題を考察する。我々はSTRIPS+と呼ばれるSTRIPSの変種を紹介し、そこでは特定のSTRIPSアクション引数を事前条件で暗黙的に残すことができる。提案した学習アルゴリズムはSynTHと呼ばれ、各アクションに対して事前条件式やクエリ'の階層化されたシーケンス(接続)を構築する。
論文参考訳（メタデータ） (2025-08-29T09:27:53Z)
What Changed and What Could Have Changed? State-Change Counterfactuals for Procedure-Aware Video Representation Learning [22.00652926645987]
状態変化記述を取り入れたプロシージャ対応ビデオ表現学習について検討する。我々は、仮説化された失敗の結果をシミュレートする状態変化反事実を生成する。本研究は,提案した状態変化記述の有効性と,その有効性を実証するものである。
論文参考訳（メタデータ） (2025-03-27T00:03:55Z)
Exploring Large Language Models for Product Attribute Value Identification [25.890927969633196]
製品属性値識別(PAVI)は、製品情報から属性とその値を自動的に識別する。既存の手法は、BARTやT5のような微調整済みの言語モデルに依存している。本稿では, LLaMA や Mistral などの大規模言語モデル (LLM) をデータ効率・ロバストなPAVI 代替品として検討する。
論文参考訳（メタデータ） (2024-09-19T12:09:33Z)
Bidirectional Decoding: Improving Action Chunking via Closed-Loop Resampling [51.38330727868982]
双方向デコーディング(BID)は、クローズドループ操作で動作チャンキングをブリッジするテスト時間推論アルゴリズムである。 BIDは、7つのシミュレーションベンチマークと2つの実世界のタスクにまたがって、最先端の2つの生成ポリシーの性能を向上させることを示す。
論文参考訳（メタデータ） (2024-08-30T15:39:34Z)
Learning Multiple Object States from Actions via Large Language Models [15.053419817253145]
オブジェクトの状態認識を複数の状態を明示的に扱うマルチラベル分類タスクとして定式化する。書き起こされたナレーションから擬似ラベルを生成し,過去の状態の影響を捉えた。 LLM生成した擬似ラベルをトレーニングしたモデルは、強い視覚言語モデルよりも優れていた。
論文参考訳（メタデータ） (2024-05-02T08:43:16Z)
SCHEMA: State CHangEs MAtter for Procedure Planning in Instructional Videos [54.01116513202433]
本研究では,視覚状態の部分的な観察を目標とする行動手順を目標とする指導ビデオにおけるプロシージャ計画の課題について検討する。最近の研究は、訓練中にアクセス可能なシーケンスレベルのアノテーションのみを持つステップのシーケンスモデリングに成功し、手順における状態の役割を見落としている。我々は,手順におけるステップと状態の因果関係を調べることによって,より構造化された状態空間を確立することを目指している。
論文参考訳（メタデータ） (2024-03-03T19:53:06Z)
Recent Advances in Named Entity Recognition: A Comprehensive Survey and Comparative Study [8.91661466156389]
NERに対する最近のポピュラーなアプローチの概要を紹介する。我々は、強化学習とグラフベースのアプローチについて論じ、NERの性能向上におけるそれらの役割を強調した。我々は,異なる特徴を持つ各種データセット上での主NER実装の性能を評価する。
論文参考訳（メタデータ） (2024-01-19T17:21:05Z)
OpenPI-C: A Better Benchmark and Stronger Baseline for Open-Vocabulary State Tracking [55.62705574507595]
OpenPIは、オープン語彙状態トラッキング用に注釈付けされた唯一のデータセットである。手順レベル,ステップレベル,状態変化レベルの3つの問題を分類する。評価指標として,クラスタベースの計量法を提案する。
論文参考訳（メタデータ） (2023-06-01T16:48:20Z)
An Efficient Active Learning Pipeline for Legal Text Classification [2.462514989381979]
法律分野における事前学習言語モデルを用いて,能動的学習を効果的に活用するためのパイプラインを提案する。我々は、知識蒸留を用いてモデルの埋め込みを意味論的意味のある空間に導く。分類タスクに適応したContract-NLIとLEDGARベンチマークの実験により,本手法が標準AL戦略より優れていることが示された。
論文参考訳（メタデータ） (2022-11-15T13:07:02Z)
Discover, Explanation, Improvement: An Automatic Slice Detection Framework for Natural Language Processing [72.14557106085284]
スライス検出モデル(SDM)は、データポイントの低パフォーマンスなグループを自動的に識別する。本稿では,NLPタスクの分類のための "Discover, Explain, improve (DEIM)" というベンチマークを提案する。評価の結果,Edisaは情報的セマンティックな特徴を持つ誤り発生データポイントを正確に選択できることがわかった。
論文参考訳（メタデータ） (2022-11-08T19:00:00Z)
Active Learning with Effective Scoring Functions for Semi-Supervised Temporal Action Localization [15.031156121516211]
本稿では,半教師型talという,滅多に研究されていない実践的な課題に焦点を当てる。本稿では,AL-STALという効果的な能動学習手法を提案する。実験の結果,AL-STALは既存の競争相手よりも優れ,完全教師付き学習と比較して満足度が高いことがわかった。
論文参考訳（メタデータ） (2022-08-31T13:39:38Z)
Relational Action Bases: Formalization, Effective Safety Verification, and Invariants (Extended Version) [67.99023219822564]
我々はリレーショナルアクションベース(RAB)の一般的な枠組みを紹介する。 RABは両方の制限を解除することで既存のモデルを一般化する。データ対応ビジネスプロセスのベンチマークにおいて、このアプローチの有効性を実証する。
論文参考訳（メタデータ） (2022-08-12T17:03:50Z)
Value-Consistent Representation Learning for Data-Efficient Reinforcement Learning [105.70602423944148]
本稿では,意思決定に直接関連のある表現を学習するための,VCR(Value-Consistent Expression Learning)という新しい手法を提案する。この想像された状態と環境によって返される実状態とを一致させる代わりに、VCRは両方の状態に$Q$-valueヘッドを適用し、2つのアクション値の分布を得る。検索不要なRLアルゴリズムに対して,提案手法が新たな最先端性能を実現することが実証された。
論文参考訳（メタデータ） (2022-06-25T03:02:25Z)
Continual Learning via Bit-Level Information Preserving [88.32450740325005]
我々は情報理論のレンズを通して連続学習過程を研究する。モデルパラメータの情報利得を維持するビットレベル情報保存(BLIP)を提案する。 BLIPは、連続的な学習を通してメモリオーバーヘッドを一定に保ちながら、ほとんど忘れることができない。
論文参考訳（メタデータ） (2021-05-10T15:09:01Z)
Model-Invariant State Abstractions for Model-Based Reinforcement Learning [54.616645151708994]
textitmodel-invarianceという新しいタイプの状態抽象化を紹介します。これにより、状態変数の見当たらない値の新しい組み合わせへの一般化が可能になる。このモデル不変状態抽象化を通じて最適なポリシーを学習できることを実証する。
論文参考訳（メタデータ） (2021-02-19T10:37:54Z)
Meta-learning for Few-shot Natural Language Processing: A Survey [10.396506243272158]
Few-shot Natural Language Processing (NLP) は、ラベル付き例のごく一部に付随するNLPタスクを指す。本稿では,NLP領域,特に少数ショットアプリケーションに焦点をあてる。メタラーニングを数ショットNLPに適用する際の、より明確な定義、進捗の概要、一般的なデータセットを提供しようとしている。
論文参考訳（メタデータ） (2020-07-19T06:36:41Z)
Retrieval-Augmented Generation for Knowledge-Intensive NLP Tasks [133.93803565077337]
検索強化生成モデルは、事前訓練されたパラメトリックメモリと非パラメトリックメモリを組み合わせて言語生成を行う。我々は、RAGモデルが、最先端パラメトリックのみのセク2セックベースラインよりも、より具体的で、多様で、現実的な言語を生成することを示す。
論文参考訳（メタデータ） (2020-05-22T21:34:34Z)
STRIPS Action Discovery [67.73368413278631]
近年のアプローチでは、すべての中間状態が欠如している場合でも、アクションモデルを合成する古典的な計画が成功している。アクションシグネチャが不明な場合に,従来のプランナーを用いてSTRIPSアクションモデルを教師なしで合成するアルゴリズムを提案する。
論文参考訳（メタデータ） (2020-01-30T17:08:39Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。