論文の概要: Inference-Time Conformal Reasoning with Valid Factuality Control for Large Language Models
- arxiv url: http://arxiv.org/abs/2606.08831v1
- Date: Sun, 07 Jun 2026 20:52:10 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-09 14:42:06.472639
- Title: Inference-Time Conformal Reasoning with Valid Factuality Control for Large Language Models
- Title(参考訳): 大規模言語モデルに対する正定性制御を用いた推論時間等角推論
- Authors: Ting Wang, Yuanjie Shi, Yan Yan, Huan Zhang,
- Abstract要約: 本稿では,emphInference-Time Conformal Reasoningフレームワークを提案する。
推論グラフ上のクレームレベルの事実性信号を集約する構造レベルの事実性不確実性関数を学習する。
理論的には、そのような生成がネストされ、事実性制御の有効なカバレッジ保証が得られます。
- 参考スコア(独自算出の注目度): 19.716905963081956
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Large language models (LLMs) increasingly perform multi-step reasoning, where intermediate claims form implicit directed acyclic graphs whose node correctness is structurally conditioned on their ancestors. This makes factuality uncertainty structural, rather than a trivial accumulation of node-wise errors, and necessitates inference-time uncertainty quantification over the reasoning structure. While conformal prediction (CP) offers flexible user-specified factuality control, existing work remains post-hoc and cannot intervene during generation. To fill the gap between CP's flexibility and its post-hoc limitation, we propose an \emph{Inference-Time Conformal Reasoning (ITCR)} framework that integrates CP directly into reasoning graph generation. ITCR learns a structure-level factuality uncertainty function that aggregates claim-level factuality signals over reasoning graphs without complex modeling assumptions. We then design the non-conformity score based on graph-level factuality uncertainty and calibrate the conformal threshold to decide when to stop generation. We theoretically show such generation is nested, yielding valid coverage guarantees for factuality control. Experiments over multiple datasets and coverage objectives demonstrate empirically valid coverage. In downstream reasoning tasks, inference-time calibrated graphs yield more accurate generation than post-hoc pruned graphs.
- Abstract(参考訳): 大規模言語モデル(LLM)は多段階の推論をますます行っており、中間クレームは、ノードの正しさが祖先に構造的に条件付けられている暗黙的な非巡回グラフを形成する。
これは、ノードの誤りの自明な蓄積よりも事実の不確実性を構造化し、推論時の推論構造上の不確実性を定量化する必要がある。
コンフォメーション予測(CP)は、フレキシブルなユーザ特定事実性制御を提供するが、既存の作業はポストホックのままであり、世代間は介入できない。
CPの柔軟性とポストホック制限のギャップを埋めるために,CPを直接推論グラフ生成に統合する 'emph{Inference-Time Conformal Reasoning (ITCR) フレームワークを提案する。
ITCRは、複雑なモデリング仮定なしで推論グラフ上のクレームレベルの事実性信号を集約する構造レベルの事実性不確実性関数を学習する。
次に、グラフレベルの事実性不確実性に基づいて非整合性スコアを設計し、整合しきい値の校正を行い、生成をいつ停止するかを決定する。
理論的には、そのような生成がネストされ、事実性制御の有効なカバレッジ保証が得られます。
複数のデータセットに対する実験とカバレッジの目的は、経験的に有効なカバレッジを示します。
下流の推論タスクでは、推論時キャリブレーショングラフは、ポストホットプルーンドグラフよりも正確な生成をもたらす。
関連論文リスト
- Why LLMs Fail at Causal Discovery and How Interventional Agents Escape [2.7976995580303305]
因果発見は科学的な推論の基盤であるが、大きな言語モデルが確実にそれを実行することができるかどうかについては未解決のままである。
最近のベンチマークでは、単純な因果グラフ上で微調整されたモデルでさえ、複雑さが増大するにつれて劣化するが、なぜ失敗するのかは定まっていない。
教師付き微調整, 直接選好最適化, コンテキスト内学習はすべて, 類似した観測データを生成する因果グラフを区別できない予測子を生成する。
論文 参考訳(メタデータ) (2026-05-26T18:37:03Z) - Eidoku: A Neuro-Symbolic Verification Gate for LLM Reasoning via Structural Constraint Satisfaction [0.0]
大規模言語モデル(LLM)は、しばしば、モデル自身によって高い確率で割り当てられる幻覚文を生成する。
このことは、幻覚はしばしば低信頼現象ではなく、構造的整合性の失敗であることを示している。
我々は,LLM推論を,生成可能性とは独立に動作する制約満足度問題(CSP)として検証する。
論文 参考訳(メタデータ) (2025-12-19T05:29:43Z) - COIN: Uncertainty-Guarding Selective Question Answering for Foundation Models with Provable Risk Guarantees [51.5976496056012]
COINは、統計的に有効な閾値を校正し、質問毎に1つの生成された回答をフィルタリングする不確実性保護選択フレームワークである。
COINはキャリブレーションセット上で経験的誤差率を推定し、信頼区間法を適用して真誤差率に高い確率上界を確立する。
リスク管理におけるCOINの堅牢性,許容回答を維持するための強いテストタイムパワー,キャリブレーションデータによる予測効率を実証する。
論文 参考訳(メタデータ) (2025-06-25T07:04:49Z) - Error-quantified Conformal Inference for Time Series [55.11926160774831]
時系列予測の不確かさの定量化は、時系列データの時間的依存と分布シフトのために困難である。
量子化損失関数をスムースにすることで,iError-quantified Conformal Inference (ECI)を提案する。
ECIは有効な誤発見制御と、他のベースラインよりも厳密な予測セットを出力することができる。
論文 参考訳(メタデータ) (2025-02-02T15:02:36Z) - Partial Counterfactual Identification of Continuous Outcomes with a
Curvature Sensitivity Model [30.77874108094485]
曲率感性モデルと呼ばれる新しい感度モデルを提案する。
これにより、関数のレベル集合の曲率を有界にすることで、情報的境界を得ることができる。
そこで我々は,新しい深部生成モデルとして,曲率感性モデルの実装を提案する。
論文 参考訳(メタデータ) (2023-06-02T10:30:37Z) - Uncertainty Quantification over Graph with Conformalized Graph Neural
Networks [52.20904874696597]
グラフニューラルネットワーク(GNN)は、グラフ構造化データに基づく強力な機械学習予測モデルである。
GNNには厳密な不確実性見積が欠如しており、エラーのコストが重要な設定での信頼性の高いデプロイメントが制限されている。
本稿では,共形予測(CP)をグラフベースモデルに拡張した共形GNN(CF-GNN)を提案する。
論文 参考訳(メタデータ) (2023-05-23T21:38:23Z) - Variational Causal Networks: Approximate Bayesian Inference over Causal
Structures [132.74509389517203]
離散DAG空間上の自己回帰分布をモデル化したパラメトリック変分族を導入する。
実験では,提案した変分後部が真の後部を良好に近似できることを示した。
論文 参考訳(メタデータ) (2021-06-14T17:52:49Z) - Causal Expectation-Maximisation [70.45873402967297]
ポリツリーグラフを特徴とするモデルにおいても因果推論はNPハードであることを示す。
我々は因果EMアルゴリズムを導入し、分類的表現変数のデータから潜伏変数の不確かさを再構築する。
我々は、反事実境界が構造方程式の知識なしにしばしば計算できるというトレンドのアイデアには、目立たずの制限があるように思える。
論文 参考訳(メタデータ) (2020-11-04T10:25:13Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。