論文の概要: Teaching Large Language Models When Not to Know: Learning Temporal Critique for Ex-Ante Reasoning
- arxiv url: http://arxiv.org/abs/2605.14636v1
- Date: Thu, 14 May 2026 09:49:35 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-15 21:45:34.764038
- Title: Teaching Large Language Models When Not to Know: Learning Temporal Critique for Ex-Ante Reasoning
- Title(参考訳): 知るべきでない場合の大規模言語モデルを教える:元Ante Reasoningの時間的批判を学ぶ
- Authors: Chenlu Ding, Jiancan Wu, Yanchen Luo, Zheyuan Liu, Yancheng Yuan, Xiang Wang,
- Abstract要約: 大規模言語モデル (LLM) はしばしば時間的カットオフの下では推論に失敗する。
カットオフ対応の時間的検証を得るためにモデルを訓練するフレームワークであるTCFTを提案する。
- 参考スコア(独自算出の注目度): 21.280999165642932
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Large language models (LLMs) often fail to reason under temporal cutoffs: when prompted to answer from the standpoint of an earlier time, they exploit knowledge that became available only later. We study this failure through the lens of ex-ante reasoning, where a model must rely exclusively on information knowable before a cutoff. Through a systematic analysis of prompt-level interventions, we find that temporal leakage is highly sensitive to cutoff formulation and instruction placement: explicit cutoff statements outperform implicit historical framings, and prefix constraints reduce leakage more effectively than suffix constraints. These findings indicate that prompting can steer models into a temporal frame, but does not endow them with the ability to verify whether a response is temporally admissible. We further argue that supervised fine-tuning is insufficient, since ex-ante correctness is not an intrinsic property of an answer, but a relation between the answer and the cutoff. To address this gap, we propose TCFT, a Temporal Critique Fine-Tuning framework that trains models to acquire cutoff-aware temporal verification. Given a query, a cutoff, and a candidate response, TCFT teaches the model to identify post-cutoff leakage, explain temporal boundary violations, and judge temporal admissibility. Experiments with Qwen2.5-7B-Instruct and Qwen2.5-14B-Instruct show that TCFT consistently outperforms prompting and SFT baselines, reducing average leakage by 41.89 and 37.79 percentage points, respectively.
- Abstract(参考訳): 大規模な言語モデル(LLM)は、時間的カットオフ(英語版)の下では推論に失敗することが多い。
我々は、この失敗を元アンティー推論のレンズを通して研究し、そこでは、モデルは遮断前に知ることのできる情報にのみ依存しなければならない。
即時的介入の体系的解析により, 時間的リークは, 定式化や命令の配置に非常に敏感であることが判明した。
これらの結果から, 応答が時間的に許容できるかどうかを検証できる能力を持たず, 時間的フレームにモデルをステアリングできる可能性が示唆された。
さらに, 教師付き微調整は解答の本質的な性質ではなく, 解答とカットオフの関係から, 教師付き微調整は不十分であると主張する。
このギャップに対処するため,時間的批判的微調整フレームワークTCFTを提案する。
クエリ、カットオフ、および候補応答が与えられた後、TCFTはモデルにカットオフ後のリークを特定し、時間的境界違反を説明し、時間的許容性を判断するように教える。
Qwen2.5-7B-InstructとQwen2.5-14B-Instructの実験では、TFTはプロンプトとSFTベースラインを一貫して上回り、平均リークをそれぞれ41.89ポイント、37.79ポイント削減した。
関連論文リスト
- A Progressive Training Strategy for Vision-Language Models to Counteract Spatio-Temporal Hallucinations in Embodied Reasoning [49.61652671596548]
「多像幻覚推論」では、前頭と時頭クエリ間の大規模なパフォーマンス低下は、真に理解するのではなく、表面的なショートカットへの依存を示す。
これを軽減するために、我々は、チェーンステップへの詳細な推論と決定的な判断に基づく、時間的連鎖構築という新しいデータセットを開発する。
実験により,本手法は精度を向上するだけでなく,70%以上から6.53%まで,前向きのパフォーマンスギャップも改善することが示された。
論文 参考訳(メタデータ) (2026-04-12T07:48:44Z) - Decoding Answers Before Chain-of-Thought: Evidence from Pre-CoT Probes and Activation Steering [5.427346259545067]
CoT(Chain-of- Thought)は、大規模言語モデルにおける推論機能のスケーリングの中心となっている。
命令調整モデルがCoTを生成する前に解答を決定する場合が多いことを示す。
論文 参考訳(メタデータ) (2026-03-02T04:33:55Z) - Negative-Aware Diffusion Process for Temporal Knowledge Graph Extrapolation [16.301114199423044]
時間的知識グラフ(TKG)推論は、過去の証拠から将来の行方不明の事実を予測しようとするものである。
TKG外挿(NADEx)の負の認識拡散モデル
NADExは、実体、関係、時間間隔の主題中心の履歴をシーケンシャルな埋め込みにエンコードする。
論文 参考訳(メタデータ) (2026-02-09T15:50:56Z) - When Silence Is Golden: Can LLMs Learn to Abstain in Temporal QA and Beyond? [34.471723373734605]
大型言語モデル(LLM)は、しばしば不確実性を認めず、(答えを拒否する)棄却するよりも、しばしば流動的であるが誤解を招く答えを生み出す。
この弱点は、時間差のある証拠や事実を、異なる期間にわたってしばしば無視する時間差質問応答においてさえ明らかである。
キャリブレーションのような既存のアプローチは、複雑な推論において不確実性を捉えるには信頼できないかもしれない。
我々は、禁忌を教育可能なスキルとみなし、禁忌を意識した報酬によって導かれる強化学習(RL)とCoT(Chain-of-Thought)の監督を結びつけるパイプラインを導入する。
論文 参考訳(メタデータ) (2026-02-04T16:54:47Z) - Simulated Ignorance Fails: A Systematic Study of LLM Behaviors on Forecasting Problems Before Model Knowledge Cutoff [8.706104833783318]
シミュレート・イグノランス(SI)は、プレカットオフ知識の抑制を促すモデルが潜在的な解決策として浮上した。
477の競合レベルの質問と9つのモデルで、SIは体系的に失敗する。
我々は,プレカットイベントのRFは方法論的に欠陥があると結論付けた。
論文 参考訳(メタデータ) (2026-01-20T08:21:55Z) - Temporal Predictors of Outcome in Reasoning Language Models [0.0]
CoT(Chain-of-Thought)パラダイムは、推論のプロキシとしてステップバイステップの合理性の推論を使用する。
難しい問題に対して、予測精度の低下は、選択アーティファクトを浮き彫りにする。
全体として、我々の結果は、推論モデルでは、成功の自己評価はわずか数トークンで現れる傾向にあることを示唆している。
論文 参考訳(メタデータ) (2025-11-03T08:57:18Z) - LoGU: Long-form Generation with Uncertainty Expressions [49.76417603761989]
不確実性を伴う長文生成(LoGU)の課題について紹介する。
不確実性抑制と不確実性誤認の2つの主要な課題を特定します。
当社のフレームワークでは,原子的クレームに基づく不確実性を改善するため,分割・分散戦略を採用している。
提案手法が精度を向上し,幻覚を低減し,応答の包括性を維持できることを示す。
論文 参考訳(メタデータ) (2024-10-18T09:15:35Z) - Mitigating Temporal Misalignment by Discarding Outdated Facts [58.620269228776294]
大規模な言語モデルは、しばしば時間的ミスアライメントの下で使われ、現在に関する質問に答える。
我々は、ある事実がいつまで真実であるかを予測するタスクとして、事実期間予測を提案する。
私たちのデータとコードはhttps://github.com/mikejqzhang/mitigating_misalignment.comで公開されています。
論文 参考訳(メタデータ) (2023-05-24T07:30:08Z) - Generic Temporal Reasoning with Differential Analysis and Explanation [61.96034987217583]
時間差分解析でギャップを埋めるTODAYという新しいタスクを導入する。
TODAYは、システムがインクリメンタルな変化の効果を正しく理解できるかどうかを評価する。
共同学習においてTODAYの指導スタイルと説明アノテーションが有効であることを示す。
論文 参考訳(メタデータ) (2022-12-20T17:40:03Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。