論文の概要: ASP-Bench: From Natural Language to Logic Programs
- arxiv url: http://arxiv.org/abs/2602.01171v1
- Date: Sun, 01 Feb 2026 11:48:36 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-03 19:28:33.642617
- Title: ASP-Bench: From Natural Language to Logic Programs
- Title(参考訳): ASP-Bench: 自然言語から論理プログラムへ
- Authors: Stefan Szeider,
- Abstract要約: 本稿では,128の自然言語問題,64の基本問題,容易かつ難解な変種からなるベンチマークを提案する。
自然言語の問題をAnswer Set Programs (ASPs)に翻訳するシステムを評価する。
- 参考スコア(独自算出の注目度): 27.126691338850254
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Automating the translation of natural-language specifications into logic programs is a challenging task that affects neurosymbolic engineering. We present ASP-Bench, a benchmark comprising 128 natural language problem instances, 64 base problems with easy and hard variants. It evaluates systems that translate natural-language problems into Answer Set Programs (ASPs), a prominent form of logic programming. It provides systematic coverage of ASP features, including choice rules, aggregates, and optimization. Each problem includes reference validators that check whether solutions satisfy the problem specification. We characterize problems along seven largely independent reasoning aspects (optimization, temporal reasoning, default logic, resource allocation, recursion, spatial reasoning, and quantitative complexity), providing a multidimensional view of modeling difficulty. We test the benchmark using an agentic approach based on the ReAct (Reason and Act) framework, which achieves full saturation, demonstrating that feedback-driven iterative refinement with solver feedback provides a reliable and robust approach for modeling natural language in ASP. Our analysis across multiple agent runs enables us to gain insights into what determines a problem's modeling hardness.
- Abstract(参考訳): 自然言語仕様の論理プログラムへの翻訳を自動化することは、ニューロシンボリックエンジニアリングに影響を与える難しいタスクである。
ASP-Benchは128の自然言語問題インスタンスと64のベース問題からなるベンチマークである。
自然言語の問題をAnswer Set Programs (ASPs)に翻訳するシステムを評価する。
選択ルール、集約、最適化など、ASP機能の体系的なカバレッジを提供する。
それぞれの問題には、ソリューションが問題仕様を満たすかどうかをチェックする参照バリデータが含まれる。
我々は、主に独立した7つの推論側面(最適化、時間的推論、デフォルト論理、リソース割り当て、再帰、空間的推論、量的複雑さ)に沿って問題を特徴付け、モデリングの難易度を多次元的に把握する。
我々はReAct(Reason and Act)フレームワークに基づくエージェント的アプローチを用いてベンチマークをテストし、完全な飽和を実現し、フィードバック駆動型反復改良とソルバフィードバックがASP.NETで自然言語をモデリングするための信頼性と堅牢なアプローチを提供することを示した。
複数のエージェントをまたいだ分析により、問題のモデリング困難度を決定するものについての洞察を得ることができる。
関連論文リスト
- Bridging Natural Language and ASP: A Hybrid Approach Using LLMs and AMR Parsing [0.14658400971135646]
本稿では,制約のない英語を論理パズルのASPプログラムに翻訳する新しい手法を提案する。
ASPのルール、事実、制約などはすべて生成され、望まれる問題を完全に表現し解決します。
論文 参考訳(メタデータ) (2025-11-11T19:25:44Z) - Language Matters: How Do Multilingual Input and Reasoning Paths Affect Large Reasoning Models? [59.970391602080205]
多言語トレーニングにも拘わらず、LRMはテスト時に高リソース言語での推論をデフォルトとする傾向にある。
文化的推論は、推論タスクのパフォーマンスを低下させるが、文化的なタスクに恩恵を与える一方、安全性評価は言語固有の振る舞いを示す。
論文 参考訳(メタデータ) (2025-05-23T02:46:18Z) - Logic-of-Thought: Empowering Large Language Models with Logic Programs for Solving Puzzles in Natural Language [67.51318974970985]
自然言語でパズルを解くことは、AIにおける長年の課題である。
本稿では,大規模言語モデルを論理プログラミングでブリッジするフレームワークであるLogic-of-Thoughtを提案する。
動作を含む様々なグリッドパズルや動的パズルについて評価し、全てのタスクにおいてほぼ完璧な精度を示す。
論文 参考訳(メタデータ) (2025-05-22T01:37:40Z) - Quantifying over Optimum Answer Sets [6.390468088226495]
ASP(Q)はエレガントでコンパクトな方法でモデリングを符号化する方法を欠いている。
本稿では、コンポーネントプログラムが弱い制約を含むことができるASP(Q)の拡張を提案する。
様々なアプリケーションシナリオを通して、新しいフォーマリズムのモデリング機能を紹介します。
論文 参考訳(メタデータ) (2024-08-14T17:53:13Z) - Language Models can be Logical Solvers [99.40649402395725]
論理解法の推論過程を直接エミュレートする新しい言語モデルであるLoGiPTを導入する。
LoGiPTは、導出的ソルバの見えない推論過程を明らかにして精錬することから導かれる、新しく構築された命令チューニングデータセットに基づいて微調整される。
論文 参考訳(メタデータ) (2023-11-10T16:23:50Z) - Large Language Models as Analogical Reasoners [155.9617224350088]
CoT(Chain-of- Thought)は、言語モデルのプロンプトとして、推論タスク全体で素晴らしいパフォーマンスを示す。
そこで本稿では,大規模言語モデルの推論プロセスを自動的にガイドする,新たなプロンプト手法であるアナログプロンプトを導入する。
論文 参考訳(メタデータ) (2023-10-03T00:57:26Z) - Leveraging Large Language Models to Generate Answer Set Programs [5.532477732693001]
大規模言語モデル(LLM)は、様々な自然言語処理タスクにおいて例外的な性能を示した。
本稿では,大規模言語モデルの強みと解集合プログラミングを組み合わせたニューロシンボリック手法を提案する。
論文 参考訳(メタデータ) (2023-07-15T03:40:55Z) - Coupling Large Language Models with Logic Programming for Robust and
General Reasoning from Text [5.532477732693001]
大規模言語モデルは, 意味論的に非常に効果的な数ショットとして機能することを示す。
自然言語文を論理形式に変換し、応答集合プログラムの入力として機能する。
本手法は,bAbI, StepGame, CLUTRR, gSCAN など,いくつかのベンチマークにおいて最先端性能を実現する。
論文 参考訳(メタデータ) (2023-07-15T03:29:59Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。