論文の概要: Distilling Answer-Set Programming Rules from LLMs for Neurosymbolic Visual Question Answering
- arxiv url: http://arxiv.org/abs/2606.03269v1
- Date: Tue, 02 Jun 2026 07:35:31 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-03 22:00:04.839915
- Title: Distilling Answer-Set Programming Rules from LLMs for Neurosymbolic Visual Question Answering
- Title(参考訳): ニューロシンボリック視覚質問応答のためのLCMからの解答・解答規則の蒸留
- Authors: Thomas Eiter, Nelson Higuera Ruiz, Johannes Oetsch,
- Abstract要約: 大規模言語モデル(LLM)からルールを抽出する手法を提案する。
VQAデータセットの例では、LLMをガイドし、結果を検証し、ASPソルバからのフィードバックを活用することで誤ったルールの修正を支援する。
従来のデータ駆動型ルール学習手法の代替として, LLMからのルール蒸留が有望であることを示す。
- 参考スコア(独自算出の注目度): 11.871523410051525
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Visual Question Answering (VQA) is the task of answering questions about images, requiring the integration of multimodal input and reasoning. Modular approaches that incorporate logic-based representations into the reasoning component offer clear advantages over end-to-end trained systems, particularly in terms of interpretability. However, adapting or extending these representations when task requirements change can place a significant burden on developers. To address this challenge, we present an approach for distilling rules from Large Language Models (LLMs). Our method prompts an LLM to extend an initial VQA reasoning theory, expressed as an answer-set program, to meet new requirements of the task. Examples from VQA datasets guide the LLM, validate the results, and help correct erroneous rules by leveraging feedback from the ASP solver. We demonstrate that our approach is effective across diverse VQA datasets. Notably, only a few examples are needed to elicit correct rules from LLMs. Our experiments suggest that rule distillation from LLMs is a promising alternative to traditional data-driven rule learning approaches. Under consideration in Theory and Practice of Logic Programming (TPLP).
- Abstract(参考訳): VQA(Visual Question Answering)は、画像に関する疑問に答え、マルチモーダル入力と推論の統合を必要とするタスクである。
論理ベースの表現を推論コンポーネントに組み込むモジュールアプローチは、特に解釈可能性の観点から、エンドツーエンドのトレーニングシステムに対して明確な優位性を提供する。
しかしながら、タスク要求が変更された場合、これらの表現を適応または拡張することは、開発者に重大な負担を与える可能性がある。
この課題に対処するため,我々はLarge Language Models (LLMs) からルールを抽出する手法を提案する。
提案手法は,タスクの新たな要件を満たすために,初期VQA推論理論の拡張を LLM に促す。
VQAデータセットの例では、LLMをガイドし、結果を検証し、ASPソルバからのフィードバックを活用することで誤ったルールの修正を支援する。
我々のアプローチは多様なVQAデータセットにまたがって効果的であることを示す。
特に、LSMから正しいルールを引き出すために、いくつかの例が必要とされる。
従来のデータ駆動型ルール学習手法の代替として, LLMからのルール蒸留が有望であることを示す。
論理プログラミングの理論と実践(TPLP)
関連論文リスト
- Learn to Think: Bootstrapping LLM Reasoning Capability Through Graph Representation Learning [19.75678229122211]
大規模言語モデル(LLM)は、様々な領域で大きな成功を収めています。
それらは、訓練のための高い計算コストや複雑な推論問題の解決における制限など、依然として重大な課題に直面している。
より柔軟で適応的な推論機能を実現するために,グラフ学習を活用する新しいフレームワークを提案する。
論文 参考訳(メタデータ) (2025-05-09T02:51:22Z) - Right Answer, Wrong Score: Uncovering the Inconsistencies of LLM Evaluation in Multiple-Choice Question Answering [78.89231943329885]
大規模言語モデル(LLM)の評価には,MCQA(Multiple-Choice Question Answering)が広く用いられている。
報告されたLCMの性能には,複数の要因が大きな影響を及ぼす可能性が示唆された。
既存の回答抽出手法が人間の判断と一致しているかどうかを解析する。
論文 参考訳(メタデータ) (2025-03-19T08:45:03Z) - Declarative Knowledge Distillation from Large Language Models for Visual Question Answering Datasets [9.67464173044675]
VQA(Visual Question Answering)は、画像に関する質問に答えるタスクである。
本稿では,Large Language Models (LLMs) からの宣言的知識蒸留手法を提案する。
以上の結果から,LSMから知識を抽出することは,データ駆動型ルール学習のアプローチ以外には有望な方向であることが確認された。
論文 参考訳(メタデータ) (2024-10-12T08:17:03Z) - Seek and Solve Reasoning for Table Question Answering [49.006950918895306]
本稿では,タスク単純化時の推論プロセスが,タスク自体の単純化よりも有用であることを示す。
本稿では,LLMにまず関連情報を求め,質問に答えるように指示するSeek-and-solving Pipelineを提案する。
本稿では, SS-CoT経路を用いた実演を用いて, 複雑なTQA課題の解決にLLMを誘導する単一ステップTQA解決プロンプトをこのパイプラインから蒸留する。
論文 参考訳(メタデータ) (2024-09-09T02:41:00Z) - LaGR-SEQ: Language-Guided Reinforcement Learning with Sample-Efficient
Querying [71.86163159193327]
大規模言語モデル(LLM)は、最近、テキストを介してコンテキスト対応の応答を提供するという、印象的な能力を実証した。
この能力は、パターン補完に関連するシーケンシャルな意思決定タスクにおいて、妥当なソリューションを予測するために使われる可能性がある。
第一強化学習(RL)エージェントによって部分的に完了したタスクに対する解を提案するために,LLMのこの予測能力を利用するLaGRを紹介した。
論文 参考訳(メタデータ) (2023-08-21T02:07:35Z) - SatLM: Satisfiability-Aided Language Models Using Declarative Prompting [68.40726892904286]
本研究では,大規模言語モデル (LLM) の推論能力を向上させるために,新しい満足度支援言語モデリング (SatLM) 手法を提案する。
我々はLLMを用いて命令型プログラムではなく宣言型タスク仕様を生成し、既製の自動定理証明器を利用して最終解を導出する。
我々はSATLMを8つの異なるデータセット上で評価し、命令パラダイムにおいてプログラム支援されたLMよりも一貫して優れていることを示す。
論文 参考訳(メタデータ) (2023-05-16T17:55:51Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。