論文の概要: Model Space Reasoning as Search in Feedback Space for Planning Domain Generation
- arxiv url: http://arxiv.org/abs/2604.08712v1
- Date: Thu, 09 Apr 2026 19:05:23 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-13 17:57:53.549101
- Title: Model Space Reasoning as Search in Feedback Space for Planning Domain Generation
- Title(参考訳): ドメイン生成計画のためのフィードバック空間の探索としてのモデル空間推論
- Authors: James Oswald, Daniel Oblinsky, Volodymyr Varha, Vasilije Dragovic, Harsha Kokel, Kavitha Srinivas, Michael Katz, Shirin Sohrabi,
- Abstract要約: 自然言語記述から計画領域を生成するためのエージェント言語モデルフィードバックフレームワークについて検討する。
ランドマークを含む記号的フィードバックの様々な形態で生成されたドメインの品質を評価する。
- 参考スコア(独自算出の注目度): 20.741373167126866
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The generation of planning domains from natural language descriptions remains an open problem even with the advent of large language models and reasoning models. Recent work suggests that while LLMs have the ability to assist with domain generation, they are still far from producing high quality domains that can be deployed in practice. To this end, we investigate the ability of an agentic language model feedback framework to generate planning domains from natural language descriptions that have been augmented with a minimal amount of symbolic information. In particular, we evaluate the quality of the generated domains under various forms of symbolic feedback, including landmarks, and output from the VAL plan validator. Using these feedback mechanisms, we experiment using heuristic search over model space to optimize domain quality.
- Abstract(参考訳): 自然言語記述から計画領域を生成することは、大きな言語モデルや推論モデルが出現しても未解決の問題である。
最近の研究によると、LLMはドメイン生成を支援する能力を持っているが、実際にデプロイできる高品質なドメインを作るには程遠い。
そこで本研究では,最小限の情報量で拡張された自然言語記述から計画領域を生成するためのエージェント言語モデルフィードバックフレームワークについて検討する。
特に、ランドマークやVAL計画検証器からの出力など、さまざまなシンボルフィードバックの形で生成されたドメインの品質を評価する。
これらのフィードバック機構を用いて,モデル空間上のヒューリスティック探索を用いてドメイン品質を最適化する実験を行った。
関連論文リスト
- LLM-Generated Heuristics for AI Planning: Do We Even Need Domain-Independence Anymore? [87.71321254733384]
大規模言語モデル(LLM)は、特定の計画問題に適した計画手法を生成することができる。
LLMは、いくつかの標準IPCドメインで最先端のパフォーマンスを達成することができる。
これらの結果がパラダイムシフトを意味するのか、既存の計画手法をどのように補完するかについて議論する。
論文 参考訳(メタデータ) (2025-01-30T22:21:12Z) - Learning to Generalize Unseen Domains via Multi-Source Meta Learning for Text Classification [71.08024880298613]
テキスト分類の多元的領域一般化について検討する。
本稿では、複数の参照ドメインを使用して、未知のドメインで高い精度を達成可能なモデルをトレーニングするフレームワークを提案する。
論文 参考訳(メタデータ) (2024-09-20T07:46:21Z) - Boosting Large Language Models with Continual Learning for Aspect-based Sentiment Analysis [33.86086075084374]
アスペクトベース感情分析(ABSA)は感情分析の重要なサブタスクである。
ABSAのための大規模言語モデルに基づく連続学習(textttLLM-CL)モデルを提案する。
論文 参考訳(メタデータ) (2024-05-09T02:00:07Z) - Large Language Models as Planning Domain Generators [21.61328475841776]
大規模言語モデル(LLM)は、単純なテキスト記述から計画的なドメインモデルを生成するために使用できる。
LLMは、自然言語記述から正しい計画領域を生成するのに適度な習熟度を示す。
論文 参考訳(メタデータ) (2024-04-02T19:39:23Z) - L2CEval: Evaluating Language-to-Code Generation Capabilities of Large
Language Models [102.00201523306986]
大規模言語モデル(LLM)の言語間コード生成能力を体系的に評価するL2CEvalを提案する。
モデルのサイズ、事前学習データ、命令チューニング、異なるプロンプトメソッドなど、それらのパフォーマンスに影響を与える可能性のある要因を分析する。
モデル性能の評価に加えて、モデルに対する信頼性校正を計測し、出力プログラムの人間による評価を行う。
論文 参考訳(メタデータ) (2023-09-29T17:57:00Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。