論文の概要: Scaling up ML-based Black-box Planning with Partial STRIPS Models
- arxiv url: http://arxiv.org/abs/2207.04479v1
- Date: Sun, 10 Jul 2022 14:55:16 GMT
- ステータス: 処理完了
- システム内更新日: 2022-07-12 13:07:14.332864
- Title: Scaling up ML-based Black-box Planning with Partial STRIPS Models
- Title(参考訳): 部分STRIPSモデルによるMLベースのブラックボックスプランニングのスケールアップ
- Authors: Matias Greco, \'Alvaro Torralba, Jorge A. Baier, Hector Palacios
- Abstract要約: 完全なシンボリックモデルが利用できない設定において、実践者がMLベースのブラックボックスプランニングを改善する方法について検討する。
問題の一部のみを記述した不完全なSTRIPSモデルを指定することで緩和を実現できることを示す。
- 参考スコア(独自算出の注目度): 3.770376172053632
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: A popular approach for sequential decision-making is to perform
simulator-based search guided with Machine Learning (ML) methods like policy
learning. On the other hand, model-relaxation heuristics can guide the search
effectively if a full declarative model is available. In this work, we consider
how a practitioner can improve ML-based black-box planning on settings where a
complete symbolic model is not available. We show that specifying an incomplete
STRIPS model that describes only part of the problem enables the use of
relaxation heuristics. Our findings on several planning domains suggest that
this is an effective way to improve ML-based black-box planning beyond
collecting more data or tuning ML architectures.
- Abstract(参考訳): シーケンシャルな意思決定のための一般的なアプローチは、ポリシー学習のような機械学習(ML)メソッドで指導されたシミュレータベースの検索を実行することである。
一方、モデル関係ヒューリスティックスは、完全な宣言モデルが利用可能であれば、検索を効果的に導くことができる。
本研究では,完全なシンボルモデルが利用できない設定において,MLベースのブラックボックス計画を改善する方法について検討する。
問題の一部のみを記述する不完全なSTRIPSモデルを指定することで、緩和ヒューリスティックスの利用が可能であることを示す。
いくつかの計画領域における我々の調査結果は、より多くのデータ収集やmlアーキテクチャのチューニングを超えて、mlベースのブラックボックス計画を改善する効果的な方法であることを示唆している。
関連論文リスト
- Exploring and Benchmarking the Planning Capabilities of Large Language Models [57.23454975238014]
この研究は、大規模言語モデル(LLM)の計画能力を改善するための基礎を築いた。
我々は、古典的な計画ベンチマークと自然言語シナリオの両方を含む包括的なベンチマークスイートを構築した。
本研究は,LLM計画の強化を目的としたマルチショットインコンテキスト学習について検討し,文脈長の増大と計画性能の向上の関係について検討する。
論文 参考訳(メタデータ) (2024-06-18T22:57:06Z) - Black-Box Tuning of Vision-Language Models with Effective Gradient
Approximation [71.21346469382821]
ブラックボックスモデルに対するテキストプロンプト最適化と出力特徴適応のための協調ブラックボックスチューニング(CBBT)を導入する。
CBBTは11のダウンストリームベンチマークで広範囲に評価され、既存のブラックボックスVL適応法と比較して顕著に改善されている。
論文 参考訳(メタデータ) (2023-12-26T06:31:28Z) - Interpretable Medical Diagnostics with Structured Data Extraction by
Large Language Models [59.89454513692417]
タブラルデータはしばしばテキストに隠され、特に医学的診断報告に使用される。
本稿では,TEMED-LLM と呼ばれるテキスト医療報告から構造化表状データを抽出する手法を提案する。
本手法は,医学診断における最先端のテキスト分類モデルよりも優れていることを示す。
論文 参考訳(メタデータ) (2023-06-08T09:12:28Z) - Model-based Reinforcement Learning with Multi-step Plan Value Estimation [4.158979444110977]
モデルベースRLのマルチステップ動作を置き換えるためのマルチステップ計画を導入する。
新しいモデルベース強化学習アルゴリズムMPPVEは、学習モデルのより良い利用方法を示し、最先端のモデルベースRLアプローチよりも優れたサンプル効率を実現する。
論文 参考訳(メタデータ) (2022-09-12T18:22:11Z) - Model-Agnostic Multitask Fine-tuning for Few-shot Vision-Language
Transfer Learning [59.38343286807997]
未知タスクの視覚言語モデルのためのモデル非依存型マルチタスクファインチューニング(MAMF)を提案する。
モデルに依存しないメタラーニング(MAML)と比較して、MAMFは二段階最適化を捨て、一階勾配のみを使用する。
MAMFは5つのベンチマークデータセット上で、数ショットの転送学習において古典的な微調整法よりも一貫して優れていることを示す。
論文 参考訳(メタデータ) (2022-03-09T17:26:53Z) - Evaluating model-based planning and planner amortization for continuous
control [79.49319308600228]
我々は、モデル予測制御(MPC)と学習モデルとモデルフリーポリシー学習を組み合わせたハイブリッドアプローチを採っている。
モデルフリーエージェントは高いDoF制御問題においても強いベースラインであることがわかった。
モデルに基づくプランナを,パフォーマンスを損なうことなく,計画が損なわれるようなポリシーに置き換えることが可能であることを示す。
論文 参考訳(メタデータ) (2021-10-07T12:00:40Z) - MeLIME: Meaningful Local Explanation for Machine Learning Models [2.819725769698229]
我々のアプローチであるMeLIMEは、異なるMLモデル上での他の手法と比較して、より意味のある説明を生成する。
MeLIMEはLIME法を一般化し、より柔軟な摂動サンプリングと異なる局所解釈可能なモデルの使用を可能にした。
論文 参考訳(メタデータ) (2020-09-12T16:06:58Z) - Transfer Learning without Knowing: Reprogramming Black-box Machine
Learning Models with Scarce Data and Limited Resources [78.72922528736011]
そこで我々は,ブラックボックス・アタベラル・リプログラミング (BAR) という新しい手法を提案する。
ゼロオーダー最適化とマルチラベルマッピング技術を用いて、BARは入力出力応答のみに基づいてブラックボックスMLモデルをプログラムする。
BARは最先端の手法より優れ、バニラ対逆プログラミング法に匹敵する性能を得る。
論文 参考訳(メタデータ) (2020-07-17T01:52:34Z) - Policy-Aware Model Learning for Policy Gradient Methods [29.129883702165774]
本稿では,モデルベース強化学習(MBRL)におけるモデル学習の問題について考察する。
モデル学習モジュールは、プランナーがモデルを使う方法を取り入れるべきである。
このアプローチをPAML(Policy-Aware Model Learning)と呼ぶ。
論文 参考訳(メタデータ) (2020-02-28T19:18:18Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。