論文の概要: NeSIG: A Neuro-Symbolic Method for Learning to Generate Planning
Problems
- arxiv url: http://arxiv.org/abs/2301.10280v1
- Date: Tue, 24 Jan 2023 19:37:59 GMT
- ステータス: 処理完了
- システム内更新日: 2023-01-26 16:33:12.383246
- Title: NeSIG: A Neuro-Symbolic Method for Learning to Generate Planning
Problems
- Title(参考訳): NeSIG: 計画問題生成のためのニューロシンボリックな学習方法
- Authors: Carlos N\'u\~nez-Molina, Pablo Mesejo, Juan Fern\'andez-Olivares
- Abstract要約: 我々はNe SIGを提案し、我々の知る限り、有効で多様性があり解決が難しい計画問題を自動的に生成するドメインに依存しない最初の手法を提案する。
マルコフ決定プロセスとして問題生成を定式化し、Deep Reinforcement Learning を用いて2つの生成ポリシーを訓練し、所望の特性の問題を発生させる。
その結果、Ne SIGは、優れた多様性を維持しながら、競合するアプローチよりも困難である有効な問題を自動生成できることを示した。
- 参考スコア(独自算出の注目度): 4.69635681868383
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In the field of Automated Planning there is often the need for a set of
planning problems from a particular domain, e.g., to be used as training data
for Machine Learning or as benchmarks in planning competitions. In most cases,
these problems are created either by hand or by a domain-specific generator,
putting a burden on the human designers. In this paper we propose NeSIG, to the
best of our knowledge the first domain-independent method for automatically
generating planning problems that are valid, diverse and difficult to solve. We
formulate problem generation as a Markov Decision Process and train two
generative policies with Deep Reinforcement Learning to generate problems with
the desired properties. We conduct experiments on several classical domains,
comparing our method with handcrafted domain-specific generators that generate
valid and diverse problems but do not optimize difficulty. The results show
NeSIG is able to automatically generate valid problems of greater difficulty
than the competitor approaches, while maintaining good diversity.
- Abstract(参考訳): 自動計画の分野においては、例えば、機械学習のトレーニングデータや、計画競争のベンチマークとして使用するために、特定のドメインからの一連の計画問題が必要となることが多い。
ほとんどの場合、これらの問題は手動かドメイン固有のジェネレータによって作成され、人間のデザイナーに負担をかける。
本稿では,nesigを最善の知識として,有効で多様で解決が難しい計画問題を自動的に生成する,第1のドメインに依存しない手法を提案する。
我々は,問題生成をマルコフ決定プロセスとして定式化し,深い強化学習を用いて2つの生成方針を訓練し,望ましい特性を持つ問題を生成する。
我々は,いくつかの古典的領域で実験を行い,有効かつ多様な問題を生成するが難易度を最適化しない手作りのドメイン固有生成器と比較した。
その結果、NeSIGは、優れた多様性を維持しつつ、競合するアプローチよりも困難である有効な問題を自動生成できることを示した。
関連論文リスト
- Learning Logic Specifications for Policy Guidance in POMDPs: an
Inductive Logic Programming Approach [57.788675205519986]
我々は任意の解法によって生成されるPOMDP実行から高品質なトレースを学習する。
我々は、データと時間効率のIndu Logic Programming(ILP)を利用して、解釈可能な信念に基づくポリシー仕様を生成する。
ASP(Answer Set Programming)で表現された学習は、ニューラルネットワークよりも優れた性能を示し、より少ない計算時間で最適な手作りタスクに類似していることを示す。
論文 参考訳(メタデータ) (2024-02-29T15:36:01Z) - PPM: Automated Generation of Diverse Programming Problems for
Benchmarking Code Generation Models [10.491051578439722]
本稿では,PPM(Programling problem merging)の概念を提案し,この概念の2つの実装を提供し,このツールを広く利用されている2つのデータセット上で活用する。
その結果、より困難で多様な、そして自然なプログラミング問題を生み出す上で、我々のツールの有効性が示された。
論文 参考訳(メタデータ) (2024-01-28T02:27:38Z) - Automated Process Planning Based on a Semantic Capability Model and SMT [50.76251195257306]
製造システムと自律ロボットの研究において、機械で解釈可能なシステム機能の仕様に「能力」という用語が用いられる。
セマンティック能力モデルから始めて、AI計画問題を自動的に生成するアプローチを提案する。
論文 参考訳(メタデータ) (2023-12-14T10:37:34Z) - MacGyver: Are Large Language Models Creative Problem Solvers? [90.62345519188655]
本稿では,現代大言語モデル(LLM)の創造的問題解決能力について,制約のある環境で検討する。
私たちは1,600の現実世界の問題からなる自動生成されたデータセットであるMacGyverを作成します。
MacGyverはどちらのグループでも難しいが、ユニークで相補的な方法では難しい。
論文 参考訳(メタデータ) (2023-11-16T08:52:27Z) - Problem-Solving Guide: Predicting the Algorithm Tags and Difficulty for
Competitive Programming Problems [10.692589986082922]
ほとんどのテック企業は、Google、Meta、Amazonなど、アルゴリズムの問題を解決する能力を必要としている。
本研究は,アルゴリズムタグをエンジニアや開発者の有用なツールとして予測する作業に対処する。
また,この問題の解決に要する時間を計算するための有用なガイダンスとして,アルゴリズム問題の難易度を予測することを検討する。
論文 参考訳(メタデータ) (2023-10-09T15:26:07Z) - Large Language Models as Analogical Reasoners [155.9617224350088]
CoT(Chain-of- Thought)は、言語モデルのプロンプトとして、推論タスク全体で素晴らしいパフォーマンスを示す。
そこで本稿では,大規模言語モデルの推論プロセスを自動的にガイドする,新たなプロンプト手法であるアナログプロンプトを導入する。
論文 参考訳(メタデータ) (2023-10-03T00:57:26Z) - Smoothed Online Learning for Prediction in Piecewise Affine Systems [54.98643421343919]
本稿では,最近開発されたスムーズなオンライン学習フレームワークに基づく。
これは、断片的なアフィン系における予測とシミュレーションのための最初のアルゴリズムを提供する。
論文 参考訳(メタデータ) (2023-01-26T15:54:14Z) - An actor-critic algorithm with policy gradients to solve the job shop
scheduling problem using deep double recurrent agents [1.3812010983144802]
ジョブショップスケジューリング問題(JSSP)に対する深層強化学習手法を提案する。
目的は、ジョブやマシンの数によって異なるJSSPインスタンスのディストリビューションについて学べるgreedyのようなものを構築することである。
予想通り、モデルはある程度は、トレーニングで使用されるものと異なる分布から生じるより大きな問題やインスタンスに一般化することができる。
論文 参考訳(メタデータ) (2021-10-18T07:55:39Z) - On the Difficulty of Generalizing Reinforcement Learning Framework for
Combinatorial Optimization [6.935838847004389]
現実の応用とグラフ上の組合せ最適化問題(COP)は、コンピュータサイエンスにおける標準的な課題である。
このアプローチの基本原理は、ノードのローカル情報とグラフ構造化データの両方を符号化するグラフニューラルネットワーク(GNN)をデプロイすることである。
我々は,クラウド上のセキュリティ対応電話機のクローン割り当てを古典的二次代入問題 (QAP) として,深層RLモデルが他の難題の解法に一般的に適用可能であるか否かを調査する。
論文 参考訳(メタデータ) (2021-08-08T19:12:04Z) - Offline Model-Based Optimization via Normalized Maximum Likelihood
Estimation [101.22379613810881]
データ駆動最適化の問題を検討し、一定の点セットでクエリのみを与えられた関数を最大化する必要がある。
この問題は、関数評価が複雑で高価なプロセスである多くの領域に現れる。
我々は,提案手法を高容量ニューラルネットワークモデルに拡張可能なトラクタブル近似を提案する。
論文 参考訳(メタデータ) (2021-02-16T06:04:27Z) - Exploring Instance Generation for Automated Planning [1.6735240552964108]
制約プログラミングと自動計画はこれらの分野の例である。
各解法の効率は、問題間だけでなく、同じ問題のインスタンス間でも異なる。
本稿では,Essenceを用いて計画上の問題記述全体をモデル化する手法を提案する。
論文 参考訳(メタデータ) (2020-09-21T19:58:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。