論文の概要: AMLSI: A Novel Accurate Action Model Learning Algorithm
- arxiv url: http://arxiv.org/abs/2011.13277v1
- Date: Thu, 26 Nov 2020 13:25:08 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-20 08:57:15.528564
- Title: AMLSI: A Novel Accurate Action Model Learning Algorithm
- Title(参考訳): AMLSI:新しい高精度行動モデル学習アルゴリズム
- Authors: Maxence Grand, Humbert Fiorino, Damien Pellier
- Abstract要約: AMLSIのアプローチでは、計画トレースのトレーニングデータセットは必要ない。
AMLSIは試行錯誤によって進行し、ランダムに生成されたアクションシーケンスで学習するようにシステムに問い合わせる。
他のアルゴリズムとは異なり、AMLSIは部分的および雑音的な観測から領域を学習することで、このロックを解除できることを示す。
- 参考スコア(独自算出の注目度): 1.1797787239802762
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: This paper presents new approach based on grammar induction called AMLSI
Action Model Learning with State machine Interactions. The AMLSI approach does
not require a training dataset of plan traces to work. AMLSI proceeds by trial
and error: it queries the system to learn with randomly generated action
sequences, and it observes the state transitions of the system, then AMLSI
returns a PDDL domain corresponding to the system. A key issue for domain
learning is the ability to plan with the learned domains. It often happens that
a small learning error leads to a domain that is unusable for planning. Unlike
other algorithms, we show that AMLSI is able to lift this lock by learning
domains from partial and noisy observations with sufficient accuracy to allow
planners to solve new problems.
- Abstract(参考訳): 本稿では,AMLSI行動モデル学習とステートマシンインタラクションを用いた文法誘導に基づく新しい手法を提案する。
AMLSIのアプローチでは、計画トレースのトレーニングデータセットは必要ない。
amlsiは試行錯誤によって進行し、ランダムに生成されたアクションシーケンスで学習するためにシステムをクエリし、システムの状態遷移を観察し、それからシステムに対応するpddlドメインを返す。
ドメイン学習の重要な問題は、学習したドメインで計画する能力である。
小さな学習エラーが、計画に使用できないドメインに繋がることが多いのです。
他のアルゴリズムとは異なり、AMLSIはこのロックを、プランナーが新しい問題を解決するのに十分な精度で、部分的およびノイズの多い観測から学習することで持ち上げることができることを示す。
関連論文リスト
- Deep Learning for Generalised Planning with Background Knowledge [0.0]
計画上の問題は簡単に解決できるが、最適化は難しい。
ユーザがバックグラウンド知識を指定できる新しい機械学習アプローチを提案する。
BKを導入することで、私たちのアプローチは、スクラッチから問題を解決する方法を学ぶ必要性を回避し、代わりに計画品質の最適化を学ぶことに集中します。
論文 参考訳(メタデータ) (2024-10-10T13:49:05Z) - Mind the Interference: Retaining Pre-trained Knowledge in Parameter Efficient Continual Learning of Vision-Language Models [79.28821338925947]
ドメインクラスのインクリメンタル学習は現実的だが、継続的な学習シナリオである。
これらの多様なタスクに対処するために、事前訓練されたビジョンランゲージモデル(VLM)を導入し、その強力な一般化性を実現する。
事前訓練されたVLMにエンコードされた知識は、新しいタスクに適応する際に妨げられ、固有のゼロショット能力を損なう。
既存の手法では、膨大なオーバーヘッドを必要とする余分なデータセットに知識蒸留でVLMをチューニングすることで、この問題に対処している。
我々は、事前学習した知識を保持できるDIKI(Distributed-Aware Interference-free Knowledge Integration)フレームワークを提案する。
論文 参考訳(メタデータ) (2024-07-07T12:19:37Z) - A New View on Planning in Online Reinforcement Learning [19.35031543927374]
本稿では,背景計画を用いたモデルに基づく強化学習への新たなアプローチについて検討する。
GSPアルゴリズムは抽象空間から様々な基礎学習者が異なる領域でより高速に学習できるような方法で価値を伝播することができることを示す。
論文 参考訳(メタデータ) (2024-06-03T17:45:19Z) - Learning the Finer Things: Bayesian Structure Learning at the
Instantiation Level [0.0]
成功した機械学習手法は記憶と一般化の間のトレードオフを必要とする。
本稿では,探索的領域で学習し,一般化し,説明できる新しい確率的グラフィカルモデル構造学習手法を提案する。
論文 参考訳(メタデータ) (2023-03-08T02:31:49Z) - On Generalizing Beyond Domains in Cross-Domain Continual Learning [91.56748415975683]
ディープニューラルネットワークは、新しいタスクを学んだ後、これまで学んだ知識の破滅的な忘れ込みに悩まされることが多い。
提案手法は、ドメインシフト中の新しいタスクを精度良く学習することで、DomainNetやOfficeHomeといった挑戦的なデータセットで最大10%向上する。
論文 参考訳(メタデータ) (2022-03-08T09:57:48Z) - Domain Adaptation Broad Learning System Based on Locally Linear
Embedding [3.274290296343038]
提案アルゴリズムは,対象領域からのラベル付きデータのごく一部とソース領域からのラベル付きデータのすべてを用いて,ロバストな分類モデルを学習することができる。
その結果,既存の移動学習手法よりも実行時間が少なく,分類精度が向上することが示唆された。
論文 参考訳(メタデータ) (2021-06-28T01:55:57Z) - How Fine-Tuning Allows for Effective Meta-Learning [50.17896588738377]
MAMLライクなアルゴリズムから派生した表現を解析するための理論的フレームワークを提案する。
我々は,勾配降下による微調整により得られる最良予測器のリスク境界を提示し,アルゴリズムが共有構造を有効活用できることを実証する。
この分離の結果、マイニングベースのメソッド、例えばmamlは、少数ショット学習における"frozen representation"目標を持つメソッドよりも優れている。
論文 参考訳(メタデータ) (2021-05-05T17:56:00Z) - Transfer Learning without Knowing: Reprogramming Black-box Machine
Learning Models with Scarce Data and Limited Resources [78.72922528736011]
そこで我々は,ブラックボックス・アタベラル・リプログラミング (BAR) という新しい手法を提案する。
ゼロオーダー最適化とマルチラベルマッピング技術を用いて、BARは入力出力応答のみに基づいてブラックボックスMLモデルをプログラムする。
BARは最先端の手法より優れ、バニラ対逆プログラミング法に匹敵する性能を得る。
論文 参考訳(メタデータ) (2020-07-17T01:52:34Z) - STRIPS Action Discovery [67.73368413278631]
近年のアプローチでは、すべての中間状態が欠如している場合でも、アクションモデルを合成する古典的な計画が成功している。
アクションシグネチャが不明な場合に,従来のプランナーを用いてSTRIPSアクションモデルを教師なしで合成するアルゴリズムを提案する。
論文 参考訳(メタデータ) (2020-01-30T17:08:39Z) - Hierarchical Variational Imitation Learning of Control Programs [131.7671843857375]
パラメータ化された階層的手順(PHP)で表される制御ポリシーの模倣学習のための変分推論手法を提案する。
本手法は, 教師による実演の観察・行動トレースのデータセットにおける階層構造を, 手続き呼び出しや用語の待ち行列に近似した後続分布を学習することによって発見する。
階層的模倣学習(hierarchical mimicion learning)の文脈における変分推論の新たな利点を実証する。
論文 参考訳(メタデータ) (2019-12-29T08:57:02Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。