論文の概要: RAG-Enhanced Large Language Models for Dynamic Content Expiration Prediction in Web Search
- arxiv url: http://arxiv.org/abs/2605.13052v1
- Date: Wed, 13 May 2026 06:20:28 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-14 23:30:27.842085
- Title: RAG-Enhanced Large Language Models for Dynamic Content Expiration Prediction in Web Search
- Title(参考訳): Web検索における動的コンテンツ呼出予測のためのRAG強化大規模言語モデル
- Authors: Tingyu Chen, Wenkai Zhang, Li Gao, Lixin Su, Ge Chen, Dawei Yin, Daiting Shi,
- Abstract要約: 商用ウェブ検索では、情報の寿命が非常に多様であるため、コンテンツの鮮度とユーザ意図の整合性は依然として困難である。
伝統的な産業的アプローチは静的なタイムウインドウフィルタリングに依存しており、結果として、コンテンツが時系列的に最新のが意味論的に期限切れになる「ワンサイズフィット」ランキングが作られる。
本フレームワークは,文書から詳細な時間的コンテキストを抽出し,クエリ固有の「妥当性水平線」を導出する。
- 参考スコア(独自算出の注目度): 49.70446150612307
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: In commercial web search, aligning content freshness with user intent remains challenging due to the highly varied lifespans of information. Traditional industrial approaches rely on static time-window filtering, resulting in "one-size-fits-all" rankings where content may be chronologically recent but semantically expired. To address the limitation, we present a novel Large Language Models (LLMs)-based Query-Aware Dynamic Content Expiration Prediction Framework deployed in Baidu search, reformulating timeliness as a dynamic validity inference task. Our framework extracts fine-grained temporal contexts from documents and leverages LLMs to deduce a query-specific "validity horizon"-a semantic boundary defining when information becomes obsolete based on user intent. Integrated with robust hallucination mitigation strategies to ensure reliability, our approach has been evaluated through offline and online A/B testing on live production traffic. Results demonstrate significant improvements in search freshness and user experience metrics, validating the effectiveness of LLM-driven reasoning for solving semantic expiration at an industrial scale.
- Abstract(参考訳): 商用ウェブ検索では、情報の寿命が非常に多様であるため、コンテンツの鮮度とユーザ意図の整合性は依然として困難である。
伝統的な産業的アプローチは静的なタイムウインドウフィルタリングに依存しており、結果として、コンテンツが時系列的に最新のが意味論的に期限切れになる「ワンサイズフィット」ランキングが作られる。
この制限に対処するため、我々はBaidu検索に展開されたクエリ対応動的コンテンツ有効期限予測フレームワークを、動的妥当性推論タスクとしてタイムラインを再構成する。
我々のフレームワークは文書から微細な時間的コンテキストを抽出し、LCMを利用してクエリ固有の「妥当性水平線」を導出する。
信頼性を確保するための堅牢な幻覚緩和戦略と統合して,本手法は実運用トラフィックのオフラインおよびオンラインA/Bテストを通じて評価されている。
その結果、検索の鮮度とユーザエクスペリエンスの指標が大幅に向上し、産業規模でのセマンティック・エクスプロイトの解決にLLMによる推論の有効性が検証された。
関連論文リスト
- Tracking the Truth: Object-Centric Spatio-Temporal Monitoring for Video Large Language Models [154.39583176906893]
大規模言語モデル(ML)は高度な理解を持ち、シーンにおける幻覚の傾向が高い。
これは、時間的モニタリングの失敗、オブジェクトの動的アイデンティティ、状態、そして時間とともに関係を永続的に追跡する能力に起因している、と我々は主張する。
既存のベンチマークでは、局所的な視覚的手がかりや統計的先行によってしばしば解決される1つの最終回答クエリに頼って、この欠陥を曖昧にしている。
論文 参考訳(メタデータ) (2026-05-09T14:32:36Z) - Resolving Evidence Sparsity: Agentic Context Engineering for Long-Document Understanding [49.26132236798123]
視覚言語モデル(VLM)は、文書理解における主要なアプローチになりつつある。
本稿では,粗いプロセスにおいて,検索者と4つの協調エージェントを編成するマルチエージェントフレームワークSLEUTHを提案する。
このフレームワークは、検索したページ内の重要なテキストおよび視覚的手がかりを特定し、テーブルやチャートなどの健全な視覚的エビデンスをフィルタし、クエリを分析して推論戦略を考案する。
論文 参考訳(メタデータ) (2025-11-28T03:09:40Z) - Enhancing Temporal Sensitivity of Large Language Model for Recommendation with Counterfactual Tuning [8.798364656768657]
我々は、アンダーライン勧告(CETRec)の枠組みを提案する。
CETRecは因果推論の原則に基づいており、時間情報の特定の影響をレコメンデーション結果に分離し、測定することができる。
私たちのコードはhttps://anonymous.4open.science/r/CETRec-B9CE/で利用可能です。
論文 参考訳(メタデータ) (2025-07-03T10:11:35Z) - Context-aware TFL: A Universal Context-aware Contrastive Learning Framework for Temporal Forgery Localization [60.73623588349311]
本研究では,時間的フォージェリーローカライゼーションのための共通文脈対応コントラスト学習フレームワーク (UniCaCLF) を提案する。
提案手法は教師付きコントラスト学習を利用して,異常検出による偽造瞬間の検出と同定を行う。
実物と偽物との間における特徴の識別可能性の限界をさらに押し上げるために、効率的な文脈対応コントラスト符号化を導入する。
論文 参考訳(メタデータ) (2025-06-10T06:40:43Z) - MERIT: Multilingual Semantic Retrieval with Interleaved Multi-Condition Query [91.01970848241075]
MERITは、インターリーブされたマルチ条件セマンティック検索のための最初の多言語データセットである。
本稿では,多条件セマンティック検索のための最初の多言語データセットであるMERITを紹介する。
論文 参考訳(メタデータ) (2025-06-03T17:59:14Z) - Scent of Knowledge: Optimizing Search-Enhanced Reasoning with Information Foraging [11.377241012645994]
InForageは、動的情報探索プロセスとして検索強化推論を形式化する強化学習フレームワークである。
我々は,複雑な実世界のWebタスクに対する反復探索と推論のトラジェクトリをキャプチャするヒューマンガイドデータセットを構築した。
これらの結果は、堅牢で適応的で効率的な推論エージェントの構築におけるInForageの有効性を強調している。
論文 参考訳(メタデータ) (2025-05-14T12:13:38Z) - Towards Boosting LLMs-driven Relevance Modeling with Progressive Retrieved Behavior-augmented Prompting [23.61061000692023]
本研究では,検索ログに記録されたユーザインタラクションを活用して,ユーザの暗黙の検索意図に対する洞察を得ることを提案する。
ProRBPは,探索シナリオ指向の知識を大規模言語モデルと統合するための,プログレッシブ検索行動拡張型プロンプトフレームワークである。
論文 参考訳(メタデータ) (2024-08-18T11:07:38Z) - Synergistic Interplay between Search and Large Language Models for
Information Retrieval [141.18083677333848]
InteRにより、RMはLLM生成した知識コレクションを使用してクエリの知識を拡張することができる。
InteRは、最先端手法と比較して総合的に優れたゼロショット検索性能を実現する。
論文 参考訳(メタデータ) (2023-05-12T11:58:15Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。