論文の概要: LLMs as ASP Programmers: Self-Correction Enables Task-Agnostic Nonmonotonic Reasoning
- arxiv url: http://arxiv.org/abs/2604.27960v1
- Date: Thu, 30 Apr 2026 14:55:48 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-01 16:31:54.150386
- Title: LLMs as ASP Programmers: Self-Correction Enables Task-Agnostic Nonmonotonic Reasoning
- Title(参考訳): LLMs as ASP Programmers: Self-Correctionはタスク非依存の非単調推論を可能にする
- Authors: Adam Ishay, Joohyung Lee,
- Abstract要約: 自然言語をAnswer Set Programming(ASP)に変換するフレームワークである"LLM+ASP"を紹介します。
我々のフレームワークはタスクごとのエンジニアリングなしで動作し、様々な推論タスクに一様に適用します。
- 参考スコア(独自算出の注目度): 6.77760769532626
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Recent large language models (LLMs) have achieved impressive reasoning milestones but continue to struggle with high computational costs, logical inconsistencies, and sharp performance degradation on high-complexity problems. While neuro-symbolic methods attempt to mitigate these issues by coupling LLMs with symbolic reasoners, existing approaches typically rely on monotonic logics (e.g., SMT) that cannot represent defeasible reasoning -- essential components of human cognition. We present "LLM+ASP," a framework that translates natural language into Answer Set Programming (ASP), a nonmonotonic formalism based on stable model semantics. Unlike prior "LLM+ASP" approaches that require manually authored knowledge modules, domain-specific prompts, or evaluation restricted to single problem classes, our framework operates without any per-task engineering and applies uniformly across diverse reasoning tasks. Our system utilizes an automated self-correction loop where structured feedback from the ASP solver enables iterative refinement. Evaluating across six diverse benchmarks, we demonstrate that: (1) stable model semantics allow LLMs to naturally express default rules and exceptions, outperforming SMT-based alternatives by significant margins on nonmonotonic tasks; (2) iterative self-correction is the primary driver of performance, effectively replacing the need for handcrafted domain knowledge; (3) compact in-context reference guides substantially outperform verbose documentation, revealing a "context rot" phenomenon where excessive context hinders constraint adherence.
- Abstract(参考訳): 最近の大規模言語モデル (LLM) は、目覚ましい推理的なマイルストーンを達成したが、高い計算コスト、論理的不整合、高複雑性問題における急激な性能劣化に苦慮し続けている。
ニューロシンボリック法は、LLMとシンボリック推論を結合することでこれらの問題を緩和しようとするが、既存のアプローチは通常、人間の認知の本質的な構成要素であるデファシブル推論を表現できない単調論理(例えば、SMT)に依存している。
我々は、自然言語をAnswer Set Programming (ASP)に変換するフレームワークである"LLM+ASP"を紹介した。
手作業による知識モジュールやドメイン固有のプロンプト,あるいは単一問題クラスに限定された評価を必要とする従来の"LLM+ASP"アプローチとは異なり,我々のフレームワークはタスク単位のエンジニアリングなしで動作し,多様な推論タスクに一様に適用する。
本システムは,ASPソルバからの構造化されたフィードバックが反復的改善を可能にする自動自己補正ループを利用する。
安定なモデルセマンティクスにより, LLMがデフォルトのルールや例外を自然に表現し, SMTベースの代替品を非単調なタスクのかなりのマージンで上回り, 反復的自己補正がパフォーマンスの原動力となり, 手作りのドメイン知識の必要性を効果的に置き換えること, コンパクトなコンテキスト内参照ガイドが冗長なドキュメントを著しく上回り, 過度なコンテキストが制約の遵守を妨げる"コンテキスト回転"現象を明らかにすること, を実証した。
関連論文リスト
- METER: Evaluating Multi-Level Contextual Causal Reasoning in Large Language Models [61.33372454250959]
コンテキスト因果推論は、大規模言語モデルにとって重要なが難しい能力である。
既存のベンチマークでは、コンテキスト整合性を保証するか、完全な因果階層をカバーすることができない。
私たちはMETERの先駆者であり、因果はしごの3つのレベルすべてにわたってLSMを体系的にベンチマークしました。
論文 参考訳(メタデータ) (2026-04-13T14:07:11Z) - ORACLE: Optimizing Reasoning Abilities of Large Language Models via Constraint-Led Synthetic Data Elicitation [12.1004696670585]
我々は、シロジック推論にインスパイアされた構造化データ生成フレームワークORACLEを紹介する。
これは、大きな言語モデルの生成的強みと象徴的な監督を統合する。
ORACLEは、きめ細かいステップレベルの検証を可能にし、高品質なマルチステップ推論データの構築を容易にする。
論文 参考訳(メタデータ) (2026-03-22T09:30:43Z) - Matrix as Plan: Structured Logical Reasoning with Feedback-Driven Replanning [9.431480849387595]
Chain-of-Thoughtプロンプトは、Large Language Models(LLMs)の推論能力を高めることが示されている。
ニューロシンボリック法は、外部の解法を通して形式的正しさを強制することによって、このギャップに対処する。
行列ベースの計画を持つ構造化CoTフレームワークであるMatrixCoTを提案する。
論文 参考訳(メタデータ) (2026-01-15T06:12:00Z) - KBQA-R1: Reinforcing Large Language Models for Knowledge Base Question Answering [64.62317305868264]
テキスト模倣から強化学習によるインタラクション最適化へパラダイムをシフトするフレームワークである textbfKBQA-R1 を提案する。
KBQAを多ターン決定プロセスとして扱うことで,行動のリストを用いて知識ベースをナビゲートすることを学ぶ。
WebQSP、GrailQA、GraphQuestionsの実験では、KBQA-R1が最先端のパフォーマンスを実現している。
論文 参考訳(メタデータ) (2025-12-10T17:45:42Z) - Last Layer Logits to Logic: Empowering LLMs with Logic-Consistent Structured Knowledge Reasoning [55.55968342644846]
大規模言語モデル(LLM)は、膨大な非構造化テキストの事前学習を通じて、自然言語推論タスクにおいて優れた性能を達成する。
LLM出力の論理的欠陥を修正するために,ロジット強化とロジットフィルタリングをコアモジュールとして組み込んだ textitLogits-to-Logic フレームワークを提案する。
論文 参考訳(メタデータ) (2025-11-11T07:08:27Z) - Proof of Thought : Neurosymbolic Program Synthesis allows Robust and Interpretable Reasoning [1.3003982724617653]
大規模言語モデル(LLM)は自然言語処理に革命をもたらしたが、一貫性のない推論に苦戦している。
本研究では,LLM出力の信頼性と透明性を高めるフレームワークであるProof of Thoughtを紹介する。
主な貢献は、論理的整合性を高めるためのソート管理を備えた堅牢な型システム、事実的知識と推論的知識を明確に区別するための規則の明示である。
論文 参考訳(メタデータ) (2024-09-25T18:35:45Z) - CLOMO: Counterfactual Logical Modification with Large Language Models [109.60793869938534]
本稿では,新しいタスク,CLOMO(Counterfactual Logical Modification)と高品質な人間アノテーションベンチマークを紹介する。
このタスクでは、LLMは所定の論理的関係を維持するために、与えられた議論的テキストを順応的に変更しなければなりません。
LLMの自然言語出力を直接評価する革新的な評価指標である自己評価スコア(SES)を提案する。
論文 参考訳(メタデータ) (2023-11-29T08:29:54Z) - Coupling Large Language Models with Logic Programming for Robust and
General Reasoning from Text [5.532477732693001]
大規模言語モデルは, 意味論的に非常に効果的な数ショットとして機能することを示す。
自然言語文を論理形式に変換し、応答集合プログラムの入力として機能する。
本手法は,bAbI, StepGame, CLUTRR, gSCAN など,いくつかのベンチマークにおいて最先端性能を実現する。
論文 参考訳(メタデータ) (2023-07-15T03:29:59Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。