論文の概要: Large Language Model-Powered Query-Driven Event Timeline Summarization in Industrial Search
- arxiv url: http://arxiv.org/abs/2605.27066v1
- Date: Tue, 26 May 2026 14:16:27 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-27 17:51:42.213424
- Title: Large Language Model-Powered Query-Driven Event Timeline Summarization in Industrial Search
- Title(参考訳): 産業検索における大規模言語モデルによるクエリ駆動イベントタイムライン要約
- Authors: Mingyue Wang, Xingyu Xie, Hang Yang, Li Gao, Lixin Su, Ge Chen, Dawei Yin, Daiting Shi,
- Abstract要約: 本稿では、Baidu Search上にデプロイされた実運用システムであるQDET(Query-Driven Event Timeline Summarization)を紹介する。
QDETは、毎日取得された数百万のドキュメントによって形成されたノイズの多い候補セットから、クエリに密接に関連するサブイベントを特定し、整理する。
Baidu SearchのオンラインA/Bテストでは、現実世界の有効性が検証され、CTRが5.5%改善し、居住時間が4.6%長く、4.4%深かった。
- 参考スコア(独自算出の注目度): 49.02761046363752
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Understanding how events evolve over time is essential for search engines handling queries about trending news. We present QDET (Query-Driven Event Timeline Summarization), a production system deployed on Baidu Search that constructs focused event timelines to explain specific query events. Unlike traditional topic-centric approaches that aim for comprehensive coverage, QDET identifies and organizes sub-events closely relevant to the query from noisy candidate sets formed by millions of documents retrieved daily. QDET incorporates two key innovations: (1) multi-task supervised fine-tuning with three auxiliary tasks-temporal ordering, causal judgment, and timeline completion-that enable compact models to match the performance of much larger general-purpose models in specialized domains; (2) reinforcement learning-based event concise summarization that enforces strict length constraints while maintaining semantic quality, achieving 88.2% length compliance and outperforming 671B-scale models by 7.7 points in constraint satisfaction. Our fine-tuned 7B parameter model achieves 76.2% F1 score on timeline summarization, slightly surpassing the zero-shot performance of DeepSeek-R1-671B (76.1% F1) while using only 1% of its parameters-demonstrating that domain-specific optimization enables production-ready models with comparable quality at drastically reduced computational costs. Online A/B tests on Baidu Search validate real-world effectiveness, showing 5.5% CTR improvement, 4.6% longer dwell time, and 4.4% deeper exploration compared to single-task baselines. We further demonstrate that timeline understanding transfers to heat prediction, confirming effective knowledge transfer to downstream tasks.
- Abstract(参考訳): トレンドニュースに関するクエリを扱う検索エンジンにとって、時間とともにイベントがどのように進化するかを理解することが不可欠である。
QDET(Query-Driven Event Timeline Summarization)はBaidu Search上にデプロイされた,特定のクエリイベントを説明するイベントタイムラインを構築する実運用システムである。
包括的カバレッジを目的とした従来のトピック中心のアプローチとは異なり、QDETは毎日取得された数百万のドキュメントによって形成されたノイズの多い候補セットからクエリに密接に関連するサブイベントを特定し、整理する。
QDETは,(1)時間的順序付け,因果判断,タイムライン補完の3つの補助的タスクによる微調整を指導し,より大規模な汎用モデルの性能に適合するコンパクトモデルの実現,(2)意味的品質を維持しながら厳密な長さ制約を強制する強化学習に基づくイベント簡潔な要約,88.2%の長さコンプライアンスの実現,および制約満足度7.7ポイントの671Bスケールモデルよりも優れた671Bスケールモデルを実現する。
我々の微調整 7B パラメータモデルは、タイムラインの要約において 76.2% F1 スコアを達成し、DeepSeek-R1-671B (76.1% F1) のゼロショット性能をわずかに上回っている。
Baidu SearchのオンラインA/Bテストでは、CTRの改善が5.5%、居住時間が4.6%長く、シングルタスクのベースラインと比較して4.4%深かった。
さらに、タイムライン理解が熱予測に移行し、下流タスクへの効果的な知識伝達を確認することを実証する。
関連論文リスト
- ReacTOD: Bounded Neuro-Symbolic Agentic NLU for Zero-Shot Dialogue State Tracking [2.2573512203799626]
本稿では,NLUを独立したツールコールとして再構成する有界神経シンボルアーキテクチャであるReacTODを提案する。
有界ReActループは反復自己補正を可能にし、MultiWOZ上のシングルパス推論よりも最大9.3ポイント精度を向上させる。
論文 参考訳(メタデータ) (2026-05-18T20:06:04Z) - When to Retrieve During Reasoning: Adaptive Retrieval for Large Reasoning Models [13.891522069967507]
本稿では、推論対応検索フレームワークReaLM-Retrieveを紹介する。
ステップレベルの不確実性検出は、トークンや文レベルではなく、推論ステップで知識ギャップを識別する。
検索介入政策は、外部証拠が進行中の推論に最大限の利益をもたらすことを学習する。
論文 参考訳(メタデータ) (2026-04-29T13:15:44Z) - TSAQA: Time Series Analysis Question And Answering Benchmark [85.35545785252309]
時系列データは、金融、医療、交通、環境科学といった分野における重要な応用に不可欠である。
TSAQAはタスクカバレッジを拡大し、多様な時間的分析能力を評価するために設計された新しい統合ベンチマークである。
論文 参考訳(メタデータ) (2026-01-30T17:28:56Z) - Memory-T1: Reinforcement Learning for Temporal Reasoning in Multi-session Agents [80.33280979339123]
強化学習(RL)を用いた時間認識メモリ選択ポリシーを学習するフレームワークであるMemory-T1を紹介する。
Time-Dialogベンチマークでは、Memory-T1が7Bモデルを67.0%に引き上げ、オープンソースモデルの新たな最先端パフォーマンスを確立した。
論文 参考訳(メタデータ) (2025-12-23T06:37:29Z) - HAMLET: Switch your Vision-Language-Action Model into a History-Aware Policy [61.668591984635846]
HAMLETは、行動予測中の歴史的状況に対応するためにビジョン・ランゲージ・アクションモデルを適用するためのフレームワークである。
HAMLETは、最先端のVLAを履歴認識ポリシーに変換することに成功していることを示す。
GR00T N1.5に加えて、HAMLETは歴史に依存した実世界のタスクで平均76.4%の成功率を達成した。
論文 参考訳(メタデータ) (2025-10-01T09:15:52Z) - TimeOmni-1: Incentivizing Complex Reasoning with Time Series in Large Language Models [105.47481207029047]
時系列を推論する3つの基本的な機能にまたがる4つのアトミックタスクを形式化した時系列推論スイート(TSR-Suite)を紹介する。
また,時系列推論を必要とする多種多様な実世界の問題に対処するために設計された最初の統一推論モデルであるTime Omni-1を紹介する。
論文 参考訳(メタデータ) (2025-09-29T13:54:34Z) - TempRetriever: Fusion-based Temporal Dense Passage Retrieval for Time-Sensitive Questions [18.87473448633352]
本研究では,検索プロセスにクエリ日時と文書タイムスタンプの両方を埋め込むことで,時間情報を明示的に組み込むTempRetrieverを提案する。
TempRetrieverは、Top-1検索精度が6.63%向上し、NDCG@10が3.79%向上した。
また,トレーニング中の時間的ずれに対処し,検索性能をさらに向上する,時間に基づく新規なネガティブサンプリング戦略を提案する。
論文 参考訳(メタデータ) (2025-02-28T13:06:25Z) - Zero-shot Retrieval: Augmenting Pre-trained Models with Search Engines [83.65380507372483]
大規模で事前訓練されたモデルは、問題を解決するのに必要なタスク固有のデータの量を劇的に削減するが、多くの場合、ドメイン固有のニュアンスを箱から取り出すのに失敗する。
本稿では,NLPとマルチモーダル学習の最近の進歩を活用して,検索エンジン検索による事前学習モデルを強化する方法について述べる。
論文 参考訳(メタデータ) (2023-11-29T05:33:28Z) - MOTOR: A Time-To-Event Foundation Model For Structured Medical Records [4.773344142823636]
我々はMOTOR(Many Outcome Time Oriented Representations)と呼ばれるTTE基盤モデルを提案する。
TTEモデルは、特定の事象が起こるまでの時間の確率分布を推定するために使用される。
最大5500万件の患者記録(9億件の臨床イベント)を事前トレーニングすることで、この課題に対処する。
論文 参考訳(メタデータ) (2023-01-09T02:42:39Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。