論文の概要: Personalized Deep Research: A User-Centric Framework, Dataset, and Hybrid Evaluation for Knowledge Discovery
- arxiv url: http://arxiv.org/abs/2605.10530v1
- Date: Mon, 11 May 2026 13:14:54 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-12 23:28:50.838393
- Title: Personalized Deep Research: A User-Centric Framework, Dataset, and Hybrid Evaluation for Knowledge Discovery
- Title(参考訳): パーソナライズドディープリサーチ:知識発見のためのユーザ中心フレームワーク、データセット、ハイブリッド評価
- Authors: Xiaopeng Li, Wenlin Zhang, Yingyi Zhang, Pengyue Jia, Yejing Wang, Yichao Wang, Yong Liu, Huifeng Guo, Xiangyu Zhao,
- Abstract要約: 動的ユーザコンテキストをコア検索・推論ループに統合するPDR(Personalized Deep Research)を導入する。
PDRは、ユーザープロファイルモデリングを反復的なクエリ開発、二重ステージ(プライベート/パブリック)検索、コンテキスト認識合成と統合する。
これにより、研究サブゴールとユーザの意図を自律的に調整し、エビデンス収集の停止基準を最適化することができる。
- 参考スコア(独自算出の注目度): 36.57361069825463
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Deep Research agents driven by LLMs have automated the scholarly discovery pipeline, from planning and query formulation to iterative web exploration. Yet they remain constrained by a static, ``one-size-fits-all'' retrieval paradigm. Current systems fail to adaptively adjust the depth and breadth of exploration based on the user's existing expertise or latent interests, frequently resulting in reports that are either redundant for experts or overly dense for novices. To address this, we introduce Personalized Deep Research (PDR), a framework that integrates dynamic user context into the core retrieval-reasoning loop. Rather than treating personalization as a post-hoc formatting step, PDR unifies user profile modeling with iterative query development, dual-stage (private/public) retrieval, and context-aware synthesis. This allows the system to autonomously align research sub-goals with user intent and optimize the stopping criteria for evidence collection. To facilitate benchmarking, we release the PDR Dataset, covering four realistic user tasks, and propose a hybrid evaluation framework combining lexical metrics with LLM-based judgments to assess factual accuracy and personalization alignment. Experimental results against commercial baselines demonstrate that PDR significantly improves retrieval utility and report relevance, effectively bridging the gap between generic information retrieval and personalized knowledge acquisition. The resource is available to the public at https://github.com/Applied-Machine-Learning-Lab/SIGIR2026_PDR.
- Abstract(参考訳): LLMによって駆動されるDeep Researchエージェントは、計画やクエリの定式化から反復的なWeb探索まで、学術的な発見パイプラインを自動化した。
しかし、それらは静的な ``1-size-fits-all'' 検索パラダイムに制約され続けている。
現在のシステムは、ユーザの既存の専門知識や潜伏した関心に基づいて、探索の深さと幅を適応的に調整することができない。
これを解決するために,動的ユーザコンテキストをコア検索推論ループに統合するPDR(Personalized Deep Research)を導入する。
パーソナライズをポストホックフォーマッティングのステップとして扱う代わりに、PDRはユーザープロファイルモデリングを反復的なクエリ開発、二重ステージ(プライベート/パブリック)検索、コンテキスト認識合成と統合する。
これにより、研究サブゴールとユーザの意図を自律的に調整し、エビデンス収集の停止基準を最適化することができる。
ベンチマークを容易にするために,4つの現実的なユーザタスクをカバーしたPDRデータセットをリリースし,LLMに基づく判断と語彙メトリクスを組み合わせたハイブリッド評価フレームワークを提案し,実際の精度とパーソナライズアライメントアライメントを評価する。
商用ベースラインに対する実験の結果、PDRは検索ユーティリティとレポート関連性を著しく改善し、汎用情報検索とパーソナライズド知識獲得のギャップを効果的に埋めることを示した。
リソースはhttps://github.com/Applied-Machine-Learning-Lab/SIGIR2026_PDRで公開されている。
関連論文リスト
- Learning to Reason for Multi-Step Retrieval of Personal Context in Personalized Question Answering [39.08300602619814]
QA(Personalization in Question Answering)は、ユーザーの背景、好み、歴史的文脈に合致した正確で正確な回答を必要とする。
個人化のための個人的コンテキストからの推論と検索を統合した強化学習フレームワークPR2を提案する。
論文 参考訳(メタデータ) (2026-02-22T19:43:43Z) - Learning Query-Specific Rubrics from Human Preferences for DeepResearch Report Generation [80.12435680651488]
本稿では,DeepResearchレポート生成に適した,人間の参照型クエリ専用ルーリックジェネレータを訓練するためのパイプラインを提案する。
まず,DeepResearchスタイルのアノテートクエリのデータセットを,ペアレポートよりも人間の好みで構築し,強化学習を通じてルーリックジェネレータを訓練する。
提案したルーリック・ジェネレータは既存のルーリック・デザイン・ストラテジーよりも、より差別的で優れたヒューマン・アライメント・インテリジェンスを実現することを実証的に示す。
論文 参考訳(メタデータ) (2026-02-03T15:09:56Z) - Investigating LLM Variability in Personalized Conversational Information Retrieval [14.220276130333849]
Moらは、個人用テキスト知識ベース(PTKB)を大規模言語モデル(LLM)に組み込むためのいくつかの戦略を探求した。
提案手法を新しいTREC iKAT 2024データセットに適用し,Llama (1B-70B), Qwen-7B, GPT-4o-miniを含む多種多様なモデルの評価を行った。
その結果,人間の選択したPTKBは連続的に検索性能を向上する一方,LLMに基づく選択法は手作業による選択を確実に上回るものではないことがわかった。
論文 参考訳(メタデータ) (2025-10-04T12:13:19Z) - DRBench: A Realistic Benchmark for Enterprise Deep Research [81.49694432639406]
DRBenchは、エンタープライズ環境で複雑でオープンなディープリサーチタスクでAIエージェントを評価するためのベンチマークである。
セールス、サイバーセキュリティ、コンプライアンスなど10のドメインにわたる15のディープリサーチタスクをリリースしています。
論文 参考訳(メタデータ) (2025-09-30T18:47:20Z) - Towards Personalized Deep Research: Benchmarks and Evaluations [56.581105664044436]
我々は、Deep Research Agents(DRA)におけるパーソナライズ評価のための最初のベンチマークであるPersonalized Deep Research Benchを紹介する。
さまざまな研究タスク50と、構造化されたペルソナ属性と動的現実世界のコンテキストを組み合わせた25のユーザプロファイルを組み合わせ、250のリアルなユーザタスククエリを生成する。
さまざまなシステムの実験は、パーソナライズされたディープリサーチを扱う際の現在の能力と限界を強調します。
論文 参考訳(メタデータ) (2025-09-29T17:39:17Z) - BESPOKE: Benchmark for Search-Augmented Large Language Model Personalization via Diagnostic Feedback [9.980170820190093]
本稿では,検索強化された大規模言語モデルにおけるパーソナライズ評価のための現実的なベンチマークであるBESPOKEを提案する。
BESPOKEは、人間から直接、本物のチャットと検索履歴を収集することによって、現実的なものの両方を意図している。
我々は,情報探索タスクにおける効果的なパーソナライズのための重要な要件を明らかにする体系的な分析を行う。
論文 参考訳(メタデータ) (2025-09-25T12:53:07Z) - Intent-Aware Neural Query Reformulation for Behavior-Aligned Product Search [0.0]
この作業では、大規模なバイヤークエリログのマイニングと分析用に設計された堅牢なデータパイプラインが導入されている。
パイプラインは、潜在購入意図を示すパターンを体系的にキャプチャし、高忠実でインテントリッチなデータセットの構築を可能にする。
本研究は,スパースユーザ入力と複雑な製品発見目標とのギャップを埋めることにおける意図中心モデリングの価値を強調した。
論文 参考訳(メタデータ) (2025-07-29T20:20:07Z) - Benchmarking Deep Search over Heterogeneous Enterprise Data [73.55304268238474]
検索強化生成(RAG)の形式を評価するための新しいベンチマークを提案する。
RAGは、多種多様な、しかし関連するソースに対して、ソースを意識したマルチホップ推論を必要とする。
製品計画、開発、サポートステージをまたいだビジネスをシミュレートする合成データパイプラインを使用して構築します。
論文 参考訳(メタデータ) (2025-06-29T08:34:59Z) - InfoDeepSeek: Benchmarking Agentic Information Seeking for Retrieval-Augmented Generation [63.55258191625131]
InfoDeepSeekは、現実世界の動的Web環境でエージェント情報を求めるための新しいベンチマークである。
本稿では,決定性,難易度,多様性の基準を満たす課題クエリを構築するための体系的手法を提案する。
本研究では,情報探索結果の正確性,有用性,コンパクト性に関する詳細な指標を含む,動的エージェント情報探索に適した最初の評価フレームワークを開発する。
論文 参考訳(メタデータ) (2025-05-21T14:44:40Z) - STaRK: Benchmarking LLM Retrieval on Textual and Relational Knowledge Bases [93.96463520716759]
テキストと知識ベースを用いた大規模半構造検索ベンチマークSTARKを開発した。
本ベンチマークでは, 製品検索, 学術論文検索, 精密医療におけるクエリの3分野について検討した。
多様なリレーショナル情報と複雑なテキスト特性を統合した,現実的なユーザクエリを合成する,新しいパイプラインを設計する。
論文 参考訳(メタデータ) (2024-04-19T22:54:54Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。