論文の概要: Neurosymbolic Learning for Inference-Time Argumentation
- arxiv url: http://arxiv.org/abs/2605.20098v1
- Date: Tue, 19 May 2026 16:49:29 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-20 15:03:09.536575
- Title: Neurosymbolic Learning for Inference-Time Argumentation
- Title(参考訳): 時間的推論のためのニューロシンボリックラーニング
- Authors: Gabriel Freedman, Adam Dejl, Adam Gould, Mansi, Lihu Chen, Jianqi Jiang, Francesca Toni,
- Abstract要約: クレーム検証は、健康やファイナンスなど、ハイテイクな環境において重要な問題である。
第三次クレーム検証のためのトレーニング可能なニューロシンボリックフレームワークである推論時間議論(ITA)を導入する。
- 参考スコア(独自算出の注目度): 18.461907013598424
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Claim verification is an important problem in high-stakes settings, including health and finance. When information underpinning claims is incomplete or conflicting, uncertain answers may be more appropriate than binary true or false classifications. In all cases, faithful explanations of the considerations determining the final verdict are crucial. We introduce inference-time argumentation (ITA), a trainable neurosymbolic framework for ternary claim verification in which a formal argumentation semantics giving the strength of claims is used both (i) to guide LLM training as models learn to generate arguments and assign them base scores (representing intrinsic strengths) and (ii) to compute ternary (true/false/uncertain) predictions from generated, scored arguments. As a result, at training time, argument generation and scoring can be optimised according to the quality of the induced argumentative predictions. Moreover, at inference time, the final prediction is faithful, by construction, to the arguments and scores determining the verdict, rather than being justified by a potentially unfaithful post-hoc reasoning trace as in conventional reasoning models. We finally show that, on two datasets for ternary claim verification, ITA improves upon argumentative baselines and can perform competitively against non-argumentative direct-prediction baselines, while providing verdicts that are computed deterministically from explicit, inspectable argumentative structures.
- Abstract(参考訳): クレーム検証は、健康やファイナンスなど、ハイテイクな環境において重要な問題である。
主張を裏付ける情報が不完全または矛盾する場合、不確実な答えは二項真または偽の分類よりも適切である。
いずれの場合も、最終判決を決定する考慮事項の忠実な説明が不可欠である。
第三次クレーム検証のためのトレーニング可能なニューロシンボリックフレームワークである推論時議論(ITA)を導入する。
一 モデルが議論を発生させ、基本スコア(本質的な強みを表わす)を割り当てることを学ぶときの LLM トレーニングを指導すること。
(ii) 生成された引数から第三次(真/偽/不確かさ)の予測を計算する。
その結果、学習時には、誘導された議論的予測の品質に応じて、引数生成とスコアリングを最適化することができる。
さらに、推論時において、最終的な予測は、従来の推論モデルのように、潜在的に不誠実なポストホック推論トレースによって正当化されるのではなく、決定を決定する議論とスコアに忠実である。
3次クレーム検証のための2つのデータセットにおいて、ITAは議論的ベースラインを改善し、非議論的直接予測ベースラインに対して競合的に機能し、明示的で検査可能な議論的構造から決定的に計算される検証を提供する。
関連論文リスト
- LLM-based Argument Mining meets Argumentation and Description Logics: a Unified Framework for Reasoning about Debates [18.314315278861073]
大規模言語モデル(LLM)は、テキストの分析と生成において高いパフォーマンスを達成する。
彼らは、議論を含むような複雑なテキストに対する明確で透明で検証可能な推論に苦慮している。
本稿では,学習に基づく議論マイニングと定量的推論を組み合わせたフレームワークを提案する。
論文 参考訳(メタデータ) (2026-03-03T11:06:23Z) - CausalFlip: A Benchmark for LLM Causal Judgment Beyond Semantic Matching [50.65932158912512]
そこで我々は,新しい大言語モデルの開発を促進するために,因果推論ベンチマークCausalFlipを提案する。
CaulFlipは、イベントトリプル上に構築された因果判断の質問で構成されており、共同創設者、チェーン、コライダーの関係が異なっている。
回答のみのトレーニング,明示的なチェーン・オブ・ソート監視,そして内在型因果推論アプローチなどを含む,複数の訓練パラダイムによるLCMの評価を行った。
論文 参考訳(メタデータ) (2026-02-23T18:06:15Z) - ART: Adaptive Reasoning Trees for Explainable Claim Verification [11.001890567834094]
ART(Adaptive Reasoning Trees)は、クレーム検証のための階層的手法である。
議論の強さは、子供のペアトーナメントを通じてボトムアップを決定する。
ARTの構造的推論は,強いベースラインよりも優れていた。
論文 参考訳(メタデータ) (2026-01-09T01:01:55Z) - CLATTER: Comprehensive Entailment Reasoning for Hallucination Detection [60.98964268961243]
我々は,系統的かつ包括的な推論プロセスを実行するためのモデルを導くことで,モデルがよりきめ細やかで正確な絞り込み決定を実行できることを提案する。
我々は,(i)クレームの分解,(ii)サブクレームの属性と包含分類,および(iii)集約分類から成る3段階の推論プロセスを定義し,そのような導出推論が実際に幻覚検出の改善をもたらすことを示す。
論文 参考訳(メタデータ) (2025-06-05T17:02:52Z) - CRAVE: A Conflicting Reasoning Approach for Explainable Claim Verification Using LLMs [15.170312674645535]
CRAVE は、説明可能なクレーム VErification に対する Conflicting Reasoning Approach である。
大規模な言語モデルによって推論される矛盾する理性に基づいて、複雑なクレームを検証することができる。
CRAVEは最先端の手法よりもはるかに優れた性能を実現している。
論文 参考訳(メタデータ) (2025-04-21T07:20:31Z) - FactReasoner: A Probabilistic Approach to Long-Form Factuality Assessment for Large Language Models [59.171510592986735]
本稿では,確率論的推論に依拠した新たな事実性評価器FactReasonerを提案する。
ラベル付きおよびラベルなしのベンチマークデータセットの実験は、FactReasonerが最先端のプロンプトベースのアプローチよりも大幅に改善されていることを示す。
論文 参考訳(メタデータ) (2025-02-25T19:01:48Z) - CASA: Causality-driven Argument Sufficiency Assessment [79.13496878681309]
ゼロショット因果関係に基づく議論十分性評価フレームワークであるCASAを提案する。
PSは前提イベントの導入が前提イベントと結論イベントの両方が欠落した場合の結論につながる可能性を測っている。
2つの論理的誤り検出データセットの実験により、CASAは不十分な議論を正確に識別することを示した。
論文 参考訳(メタデータ) (2024-01-10T16:21:18Z) - Logical Satisfiability of Counterfactuals for Faithful Explanations in
NLI [60.142926537264714]
本稿では, 忠実度スルー・カウンタファクトの方法論について紹介する。
これは、説明に表される論理述語に基づいて、反実仮説を生成する。
そして、そのモデルが表現された論理と反ファクトの予測が一致しているかどうかを評価する。
論文 参考訳(メタデータ) (2022-05-25T03:40:59Z) - Same Side Stance Classification Task: Facilitating Argument Stance
Classification by Fine-tuning a BERT Model [8.8896707993459]
同じサイドスタンス分類タスクは、両方の引数が同じスタンスを共有するかどうかによって分類された引数ペアのデータセットを提供する。
3つのエポックに対して事前学習したBERTモデルを微調整し、各引数の最初の512トークンを使用して、2つの引数が同じスタンスを持つかどうかを予測する。
論文 参考訳(メタデータ) (2020-04-23T13:54:31Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。