論文の概要: Temporal Preference Optimization for Unsupervised Retrieval
- arxiv url: http://arxiv.org/abs/2606.17664v1
- Date: Tue, 16 Jun 2026 08:27:22 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-17 17:15:32.352001
- Title: Temporal Preference Optimization for Unsupervised Retrieval
- Title(参考訳): 教師なし検索のための時間優先最適化
- Authors: HyunJin Kim, Jaejun Shim, Young Jin Kim, JinYeong Bak,
- Abstract要約: 新たなトレーニング手法であるTRPO(Temporal Retrieval Preference Optimization)を用いたTPOUR(Temporal Preference Optimization for Unsupervised Retriever)を提案する。
TPOURは学習時間埋め込みを通じて目に見えない時間に一般化し、連続的な時間的アライメントを可能にする。
Qwen-Embedding-8Bと比較すると、約72.7倍小さいにもかかわらず、TPOUR Contrieverは暗黙的なクエリで平均nDCG@5を+4.04 (+12.15%)、暗黙的なクエリで+4.98 (+15.21%)改善している。
- 参考スコア(独自算出の注目度): 11.583736130556611
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Unsupervised dense retrievers offer scalability by learning semantic similarity from unlabeled documents via contrastive learning, but they struggle to capture the temporal relevance, retrieving semantically related but temporally misaligned documents-an important aspect when a document collection spans multiple time periods (e.g., retrieving documents from 2018-2025 for "Who is the president in 2019?" introduces temporal ambiguity). Existing methods rely on supervised training with explicit timestamps, which are not always feasible. We propose TPOUR (Temporal Preference Optimization for Unsupervised Retriever), which uses our novel training method Temporal Retrieval Preference Optimization (TRPO). TRPO reinterprets preference learning in the temporal dimension, guiding the retriever to favor temporally aligned documents. TPOUR further generalizes to unseen time periods via interpolation in a learned time embedding, enabling continuous temporal alignment. Experiments on temporal information retrieval (T-IR), TPOUR outperforms both unsupervised and supervised baselines. Compared to Qwen-Embedding-8B, despite being about 72.7x smaller, TPOUR Contriever improves average nDCG@5 by +4.04 (+12.15%) on explicit and +4.98 (+15.21%) on implicit queries. We provide our code at https://github.com/agwaBom/TPOUR.
- Abstract(参考訳): 教師なしの厳密なレトリバーは、対照的な学習を通じてラベルのないドキュメントからセマンティックな類似性を学ぶことでスケーラビリティを提供するが、それらは時間的関連性を捉え、セマンティックな関連性を取り出すのに苦労している。
既存の方法は明示的なタイムスタンプによる教師付きトレーニングに依存しており、必ずしも実現可能であるとは限らない。
本稿では,新しいトレーニング手法であるTRPOを用いたTPOUR(Temporal Preference Optimization for Unsupervised Retriever)を提案する。
TRPOは、時間次元における嗜好学習を再解釈し、検索者に時間的に整列された文書を優先させる。
TPOURはさらに、学習時間埋め込みにおける補間を通して、目に見えない時間に一般化し、連続的な時間的アライメントを可能にする。
時間情報検索(T-IR)の実験では、TPOURは教師なしベースラインと教師なしベースラインの両方を上回っている。
Qwen-Embedding-8Bと比較すると、約72.7倍小さいにもかかわらず、TPOUR Contrieverは暗黙的なクエリで平均nDCG@5を+4.04 (+12.15%)、暗黙的なクエリで+4.98 (+15.21%)改善している。
私たちはhttps://github.com/agwaBom/TPOUR.comでコードを公開しています。
関連論文リスト
- FRESCO: Benchmarking and Optimizing Re-rankers for Evolving Semantic Conflict in Retrieval-Augmented Generation [73.22935457705057]
時間的動的文脈における再ランカ評価のためのベンチマークであるFRESCOを紹介する。
レクエンシ検索クエリと過去のウィキペディアのリビジョンを組み合わせることで、FRESCOは、セマンティックな関連性を維持しながら、リランカが事実として最新の証拠を優先順位付けできるかどうかをテストする。
我々の評価では、既存の再ランカ間で一貫した障害モードが明らかになっている。
論文 参考訳(メタデータ) (2026-04-14T17:04:25Z) - ImpliRet: Benchmarking the Implicit Fact Retrieval Challenge [50.93758649363798]
Impliretは、推論の課題をドキュメント側処理にシフトするベンチマークである。
我々は,この環境下で苦戦している,疎水・密集したレトリバーの幅を評価した。
論文 参考訳(メタデータ) (2025-06-17T11:08:29Z) - Maximally-Informative Retrieval for State Space Model Generation [59.954191072042526]
テスト時に特定のクエリに対するモデル不確実性を最小化するために、Retrieval In-Context Optimization (RICO)を導入する。
文書検索に外部に依存した従来の検索強化生成(RAG)とは異なり,本手法はモデルから直接のフィードバックを利用する。
モデル勾配を用いた標準のトップ$kの検索は、最適化手順を近似し、残余損失への接続を提供することを示す。
論文 参考訳(メタデータ) (2025-06-13T18:08:54Z) - TempRetriever: Fusion-based Temporal Dense Passage Retrieval for Time-Sensitive Questions [18.87473448633352]
本研究では,検索プロセスにクエリ日時と文書タイムスタンプの両方を埋め込むことで,時間情報を明示的に組み込むTempRetrieverを提案する。
TempRetrieverは、Top-1検索精度が6.63%向上し、NDCG@10が3.79%向上した。
また,トレーニング中の時間的ずれに対処し,検索性能をさらに向上する,時間に基づく新規なネガティブサンプリング戦略を提案する。
論文 参考訳(メタデータ) (2025-02-28T13:06:25Z) - Temporal Sequencing of Documents [0.0]
文献の集合を時間順に並べる教師なしの方法について概説する。
提案手法は,帯域幅推定による単語使用量の漸進的な変化を捉えることに依存する。
この教師なしのアプローチは、未処理のドキュメントセットの時間的順序付けを可能にするべきである。
論文 参考訳(メタデータ) (2023-11-05T06:51:04Z) - LaPraDoR: Unsupervised Pretrained Dense Retriever for Zero-Shot Text
Retrieval [55.097573036580066]
実験結果から,LaPraDoRは教師付き高密度検索モデルと比較して最先端の性能が得られることがわかった。
再ランクと比較すると,1ミリ秒 (22.5倍高速) でレキシコン強化手法を動作させることができるが,性能は良好である。
論文 参考訳(メタデータ) (2022-03-11T18:53:12Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。