論文の概要: Automatically Learning HTN Methods from Landmarks
- arxiv url: http://arxiv.org/abs/2404.06325v1
- Date: Tue, 9 Apr 2024 14:03:38 GMT
- ステータス: 処理完了
- システム内更新日: 2024-04-10 14:30:51.133004
- Title: Automatically Learning HTN Methods from Landmarks
- Title(参考訳): ランドマークからのHTN自動学習
- Authors: Ruoxi Li, Dana Nau, Mark Roberts, Morgan Fine-Morris,
- Abstract要約: CURRICULAMAは、学習プロセスを完全に自動化するHTNメソッド学習アルゴリズムである。
ランドマーク分析を使用して注釈付きタスクを構成し、カリキュラム学習を活用して、メソッドの学習をよりシンプルからより複雑なものに順序付けする。
我々はCURRICULAMAの音質を証明し、HTN-MAKERに対する完全な手法の学習において、ほぼ同様の収束率を持つことを実験的に示す。
- 参考スコア(独自算出の注目度): 0.16874375111244325
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Hierarchical Task Network (HTN) planning usually requires a domain engineer to provide manual input about how to decompose a planning problem. Even HTN-MAKER, a well-known method-learning algorithm, requires a domain engineer to annotate the tasks with information about what to learn. We introduce CURRICULAMA, an HTN method learning algorithm that completely automates the learning process. It uses landmark analysis to compose annotated tasks and leverages curriculum learning to order the learning of methods from simpler to more complex. This eliminates the need for manual input, resolving a core issue with HTN-MAKER. We prove CURRICULAMA's soundness, and show experimentally that it has a substantially similar convergence rate in learning a complete set of methods to HTN-MAKER.
- Abstract(参考訳): 階層的タスクネットワーク(HTN)計画は通常、ドメインエンジニアに計画上の問題を分解する方法に関する手作業によるインプットを提供する必要がある。
有名なメソッド学習アルゴリズムであるHTN-MAKERでさえ、ドメインエンジニアは、何を学習すべきかに関する情報でタスクをアノテートする必要がある。
本稿では,学習プロセスを完全に自動化するHTN法学習アルゴリズムであるCURRICULAMAを紹介する。
ランドマーク分析を使用して注釈付きタスクを構成し、カリキュラム学習を活用して、メソッドの学習をよりシンプルからより複雑なものに順序付けする。
これにより手動入力が不要になり、HTN-MAKERでコア問題が解決される。
我々はCURRICULAMAの音質を証明し、HTN-MAKERに対する完全な手法の学習において、ほぼ同様の収束率を持つことを実験的に示す。
関連論文リスト
- Learning Algorithms Made Simple [0.0]
人工知能(AI)、機械学習(ML)、ディープラーニング(DL)、ハイブリッドモデルの主な概念についてレビューする。
本稿では,学習アルゴリズムの概要と現状,応用,今後の方向性について概説する。
論文 参考訳(メタデータ) (2024-10-11T18:39:25Z) - Data-CUBE: Data Curriculum for Instruction-based Sentence Representation
Learning [85.66907881270785]
本稿では,学習用マルチタスクデータの順序を列挙するデータカリキュラム,すなわちData-CUBEを提案する。
タスクレベルでは、タスク間の干渉リスクを最小化するために最適なタスクオーダーを見つけることを目的としている。
インスタンスレベルでは、タスク毎のすべてのインスタンスの難易度を測定し、トレーニングのためにそれらを簡単に微分できるミニバッチに分割します。
論文 参考訳(メタデータ) (2024-01-07T18:12:20Z) - Learning Open Domain Multi-hop Search Using Reinforcement Learning [20.078330789576256]
我々は、オープンドメイン内のエンティティ間の関係のマルチホップパスの探索方法を学ぶために、自動エージェントを教える。
本手法をアクター・クリティカルな強化学習アルゴリズムに実装し,英語ウィキペディアのサブセットから抽出した探索問題のデータセット上で評価する。
論文 参考訳(メタデータ) (2022-05-30T17:44:19Z) - Learning to Find Proofs and Theorems by Learning to Refine Search
Strategies [0.9137554315375919]
AlphaZeroスタイルのエージェントは、非決定論的プログラムとして表される高度な専門家戦略を洗練するために自己学習を行っている。
類似教師エージェントは、学習者にとって適切な関連性と難易度のあるタスクを生成するための自己学習を行う。
論文 参考訳(メタデータ) (2022-05-27T20:48:40Z) - Divide & Conquer Imitation Learning [75.31752559017978]
模倣学習は学習プロセスをブートストラップするための強力なアプローチである。
本稿では,専門的軌道の状態から複雑なロボットタスクを模倣する新しいアルゴリズムを提案する。
提案手法は,非ホロノミックナビゲーションタスクを模倣し,非常に高いサンプル効率で複雑なロボット操作タスクにスケールすることを示す。
論文 参考訳(メタデータ) (2022-04-15T09:56:50Z) - MURAL: Meta-Learning Uncertainty-Aware Rewards for Outcome-Driven
Reinforcement Learning [65.52675802289775]
本研究では,不確かさを意識した分類器が,強化学習の難しさを解消できることを示す。
正規化最大度(NML)分布の計算法を提案する。
得られたアルゴリズムは、カウントベースの探索法と、報酬関数を学習するための先行アルゴリズムの両方に多くの興味深い関係を持つことを示す。
論文 参考訳(メタデータ) (2021-07-15T08:19:57Z) - Curriculum Learning: A Survey [65.31516318260759]
カリキュラム学習戦略は、機械学習のあらゆる分野で成功している。
我々は,様々な分類基準を考慮して,カリキュラム学習アプローチの分類を手作業で構築する。
集約型クラスタリングアルゴリズムを用いて,カリキュラム学習手法の階層木を構築する。
論文 参考訳(メタデータ) (2021-01-25T20:08:32Z) - Variable-Shot Adaptation for Online Meta-Learning [123.47725004094472]
従来のタスクから静的データにまたがるメタラーニングによって,少数の固定された例から新しいタスクを学習する問題について検討する。
メタラーニングは,従来の教師付き手法に比べて,ラベルの総数が少なく,累積性能も高いタスクセットを解く。
これらの結果から,メタラーニングは,一連の問題を継続的に学習し,改善する学習システムを構築する上で重要な要素であることが示唆された。
論文 参考訳(メタデータ) (2020-12-14T18:05:24Z) - Retrieve, Program, Repeat: Complex Knowledge Base Question Answering via
Alternate Meta-learning [56.771557756836906]
本稿では,弱い監督からプログラマと交互に検索モデルを自動的に学習する手法を提案する。
本システムでは,知識ベースに対する複雑な質問応答を行う大規模タスクにおいて,最先端のパフォーマンスを実現する。
論文 参考訳(メタデータ) (2020-10-29T18:28:16Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。