論文の概要: Can LLMs Be Constrained to the Past? Improving Knowledge Cutoff through Recall-Based Prompting
- arxiv url: http://arxiv.org/abs/2606.05804v1
- Date: Thu, 04 Jun 2026 07:33:56 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-05 22:39:44.62446
- Title: Can LLMs Be Constrained to the Past? Improving Knowledge Cutoff through Recall-Based Prompting
- Title(参考訳): LLMは過去の制約に耐えられるか?リコール型プロンプティングによる知識遮断の改善
- Authors: Michiro Asai, Ailiang Lin, Yu Kishimoto, Takao Obi, Satoshi Kosugi, Kotaro Funakoshi, Manabu Okumura,
- Abstract要約: 知識の急激なカットオフは、大きな言語モデルに対して、特定のカットオフ日を超える情報が利用できないかのように振舞うように指示する。
本稿では, 自己リコールと質問-リコールという2つのリコールベースのプロンプト戦略を提案する。
提案手法は, 直接回答と従来のステップバイステップ推論ベースラインの両方に優れる。
- 参考スコア(独自算出の注目度): 22.471189084932178
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Prompted knowledge cutoff instructs a large language model (LLM) to act as if information beyond a specified cutoff date were unavailable. However, prior work mainly relies on direct-answer generation, which struggles when post-cutoff knowledge is not explicitly queried but is only causally related to the question. To address this limitation, we propose two recall-based prompting strategies: Self-Recall (SR), which asks the model to restate its cutoff constraint, and Question-Recall (QR), which requires the model to recall question-relevant information valid under the cutoff. Across three existing benchmarks, our methods outperform both direct-answer prompting and conventional step-by-step reasoning baselines, with particularly strong improvements on counterfactual questions. To investigate robustness across different cutoff settings, we further construct the Multi-cutoff Historical Event Benchmark (MHEB), which evaluates the same question under multiple cutoff years. Results show that knowledge cutoff performance varies with cutoff distance, while combining SR and QR consistently yields the best performance.
- Abstract(参考訳): Prompted knowledge cutoffは、ある特定のカットオフ日を超える情報が利用できないかのように、大きな言語モデル(LLM)に動作するように指示する。
しかし、先行研究は主に直接回答生成に依存しており、それは、カット後の知識が明示的にクエリーされるのではなく、問題に慎重に関係しているだけである場合に苦労する。
この制限に対処するために、モデルにカットオフ制約を復活させるセルフリコール(SR)と、カットオフの下で有効な質問関連情報をリコールする必要がある質問リコール(QR)の2つのリコールベースのプロンプト戦略を提案する。
既存の3つのベンチマークにおいて,提案手法は直接回答と従来のステップ・バイ・ステップの推論ベースラインの両方を上回り,特に対実的質問に対する強い改善が見られた。
異なるカットオフ設定間のロバスト性を調べるために,複数のカットオフ期間で同じ質問を評価するマルチカットオフ履歴イベントベンチマーク(MHEB)を構築した。
その結果、知識カットオフ性能はカットオフ距離によって変化し、SRとQRを組み合わせると、常に最高の性能が得られることがわかった。
関連論文リスト
- Retrieval Feedback Memory Enhancement Large Model Retrieval Generation Method [10.654167904580838]
大規模言語モデル(LLM)は、制約付きパラメトリック知識や高いリトレーニングコストといった固有の制約に直面します。
検索フィードバックとメモリ検索拡張生成(RFM-RAG)を提案する。
RFM-RAGは, 動的エビデンスプールを構築することにより, 従来手法のステートレス検索をステートフルな継続的知識管理に変換する。
論文 参考訳(メタデータ) (2025-08-25T10:13:02Z) - Uncertainty Quantification in Retrieval Augmented Question Answering [45.573346610161195]
本稿では,QAモデルが備える通路の有効性を推定することで,QAモデルの不確実性を定量化する。
我々は、目標QAモデルの通過効率を予測するために軽量ニューラルネットワークを訓練し、単純な情報理論のメトリクスが解の正しさをある程度予測できる一方で、より高価なサンプリングベースの手法を効率的に近似または上回ることを示す。
論文 参考訳(メタデータ) (2025-02-25T11:24:52Z) - CoTKR: Chain-of-Thought Enhanced Knowledge Rewriting for Complex Knowledge Graph Question Answering [33.89497991289916]
そこで本研究では,新たな書込み手法であるCoTKRを提案し,推論トレースとそれに対応する知識をインターリーブ方式で生成する。
我々は,様々な知識グラフ質問回答 (KGQA) ベンチマークを用いて,様々な言語モデル (LLM) を用いて実験を行う。
論文 参考訳(メタデータ) (2024-09-29T16:08:45Z) - ReST meets ReAct: Self-Improvement for Multi-Step Reasoning LLM Agent [50.508669199496474]
外部知識に基づいて推論と行動を行うReAct-style LLMエージェントを開発した。
エージェントをReSTライクな手法で改良し,従来の軌道上で反復的に訓練する。
引き起こされた大きなモデルから始まり、アルゴリズムのたった2イテレーションの後に、微調整された小さなモデルを生成することができる。
論文 参考訳(メタデータ) (2023-12-15T18:20:15Z) - R-Tuning: Instructing Large Language Models to Say `I Don't Know' [66.11375475253007]
大きな言語モデル(LLM)は、優れたパフォーマンスで多くのドメインに革命をもたらしたが、それでもその課題に直面している。
事前の指導チューニング方法は、モデルが知識を知っているかどうかに関わらず、モデルに文章を完成させるよう強制する。
我々はRefusal-Aware Instruction Tuning (R-Tuning)と呼ばれる新しいアプローチを提案する。
実験の結果、R-Tuningは、既知の質問に答えたり、未知の質問に答えるのを控えるモデルの能力を効果的に改善することを示した。
論文 参考訳(メタデータ) (2023-11-16T08:45:44Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。