論文の概要: PaperFlow: Profiling, Recommending, and Adapting Across Daily Paper Streams
- arxiv url: http://arxiv.org/abs/2606.07454v1
- Date: Fri, 05 Jun 2026 17:00:20 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-08 14:33:29.857862
- Title: PaperFlow: Profiling, Recommending, and Adapting Across Daily Paper Streams
- Title(参考訳): PaperFlow: 日刊紙ストリームのプロファイリング,リコメンデーション,適応
- Authors: Fuqiang Wang, Song Tan, Zheng Guo, Jiaohao Fu, Xinglong Xu, Bihui Yu, Jie Dong, Zheng Sun, Siyuan Li, Jingxuan Wei, Cheng Tan,
- Abstract要約: 実際の科学的読解は、関心が変化し、フィードバックが蓄積する、日々の縦方向のプロセスとして展開される。
PaperFlowは、プロファイリング、レコメンド、アダプティングの3つの段階にまとめるフレームワークです。
ベンチマークには、シミュレーションされた24人の調査ユーザ、50の日刊紙ストリーム、1200のユーザデーエピソード、20,727のユニークな論文、497,448のエピソードペーパーレコードが含まれている。
- 参考スコア(独自算出の注目度): 15.529453946332161
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Scientific paper recommendation is typically evaluated as static ranking over a fixed candidate set, yet real scientific reading unfolds as a daily, longitudinal process in which interests shift and feedback accumulates. We introduce PaperFlow, a framework that organizes it into three coupled stages: Profiling, which constructs and maintains a structured, inspectable scholarly profile from heterogeneous cold-start evidence; Recommending, which ranks each date-specific paper stream through multi-signal aggregation under a fixed display budget; and Adapting, which updates user state from semantically distinct feedback signals and models interest drift across days. We further define a longitudinal user-day benchmark that fixes users, dates, candidate pools, visible inputs, and hidden simulated relevance labels under a shared temporal information boundary. The benchmark contains 24 simulated research users, 50 daily paper streams, 1,200 user-day episodes, 20,727 unique papers, and 497,448 episode-paper records. We additionally specify a blind human-evaluation protocol to validate alignment between automatic metrics and expert judgments. Experiments against five scientific recommendation baselines show that PaperFlow achieves the strongest oracle-based ranking, the highest behavioral alignment with simulated reading selections, and the best blind human-evaluation score.
- Abstract(参考訳): 科学論文の推薦は、一般に固定された候補セットよりも静的なランキングとして評価されるが、実際の科学的読解は、関心の変化とフィードバックが蓄積される、毎日の縦方向のプロセスとして展開される。
提案手法は,不均一なコールドスタート証拠から構造化された,検査可能な学術的プロファイルを構築し,維持するフレームワークであるPaperFlowと,固定された表示予算の下で,複数の信号の集約を通じて各日付固有の論文ストリームをランク付けするRecommendingと,意味的に異なるフィードバック信号からユーザ状態を更新するAdaptingを紹介した。
さらに、ユーザ、日付、候補プール、可視性入力、および共有時間情報境界の下で擬似関連ラベルを固定する縦型ユーザデーベンチマークを定義した。
このベンチマークには、シミュレーションされた24人の調査ユーザー、50の日刊紙ストリーム、1200のユーザーデーエピソード、20,727のユニークな論文、497,448のエピソードペーパー記録が含まれている。
また、自動メトリクスと専門家の判断の整合性を検証するために、視覚障害者評価プロトコルを規定する。
5つの科学的勧告ベースラインに対する実験は、PaperFlowが最強のオラクルベースのランキング、シミュレートされた読書選択による行動アライメント、盲目評価スコアを達成していることを示している。
関連論文リスト
- Chain of Retrieval: Multi-Aspect Iterative Search Expansion and Post-Order Search Aggregation for Full Paper Retrieval [68.71038700559195]
The Chain of Retrieval (COR) is a novel repeaterative framework for full-paper search。
SCIBENCH(SCIBENCH)は、クエリと候補のための全論文の完全なコンテキストとセグメント化されたコンテキストを提供するベンチマークである。
論文 参考訳(メタデータ) (2025-07-14T08:41:53Z) - Fact Checking Beyond Training Set [64.88575826304024]
本稿では,レトリバーリーダが,あるドメインのラベル付きデータに基づいてトレーニングし,別のドメインで使用する場合,性能劣化に悩まされることを示す。
本稿では,レトリバー成分を分散シフトに対して頑健にするための逆アルゴリズムを提案する。
次に、これらのデータセットから8つの事実チェックシナリオを構築し、モデルと強力なベースラインモデルのセットを比較します。
論文 参考訳(メタデータ) (2024-03-27T15:15:14Z) - Knowledge-Centric Templatic Views of Documents [2.654058995940072]
著者はしばしば、スライドデッキ、ニュースレター、レポート、ポスターなど、様々な文書形式でアイデアを共有している。
文書生成装置の品質測定に適応できる新しい統一評価フレームワークを提案する。
人間の評価を行い,提案手法を用いて作成した文書の82%を利用者が好んでいることを示す。
論文 参考訳(メタデータ) (2024-01-13T01:22:15Z) - Beyond Document Page Classification: Design, Datasets, and Challenges [32.94494070330065]
本稿では,文書分類ベンチマークを現実のアプリケーションに近づける必要性を強調した。
我々は、パブリックなマルチページ文書分類データセットの欠如を特定し、アプリケーションシナリオにおける異なる分類タスクを形式化し、効率的なマルチページ文書表現をターゲットとする価値を動機づける。
論文 参考訳(メタデータ) (2023-08-24T16:16:47Z) - Tag-Aware Document Representation for Research Paper Recommendation [68.8204255655161]
本稿では,ユーザによって割り当てられたソーシャルタグに基づいて,研究論文の深い意味表現を活用するハイブリッドアプローチを提案する。
提案手法は,評価データが極めて少ない場合でも研究論文の推薦に有効である。
論文 参考訳(メタデータ) (2022-09-08T09:13:07Z) - Efficient Classification of Long Documents Using Transformers [13.927622630633344]
様々なベースラインと多様なデータセットに対して測定された相対的有効性を評価する。
結果として、より複雑なモデルは、単純なベースラインを上回り、データセット間で一貫性のないパフォーマンスを得ることができないことがしばしば示される。
論文 参考訳(メタデータ) (2022-03-21T18:36:18Z) - Investigating Crowdsourcing Protocols for Evaluating the Factual
Consistency of Summaries [59.27273928454995]
要約に適用される現在の事前学習モデルは、ソーステキストを誤って表現したり、外部情報を導入したりする事実上の矛盾がちである。
評価ベースのLikertスケールとランキングベースのBest-Worst Scalingプロトコルを用いた,事実整合性のためのクラウドソーシング評価フレームワークを構築した。
ランキングベースのプロトコルは、データセット間の要約品質をより信頼性の高い尺度を提供するのに対して、Likertレーティングの信頼性はターゲットデータセットと評価設計に依存する。
論文 参考訳(メタデータ) (2021-09-19T19:05:00Z) - Hierarchical Bi-Directional Self-Attention Networks for Paper Review
Rating Recommendation [81.55533657694016]
本稿では,階層型双方向自己注意ネットワークフレームワーク(HabNet)を提案する。
具体的には、文エンコーダ(レベル1)、レビュー内エンコーダ(レベル2)、レビュー間エンコーダ(レベル3)の3つのレベルで、論文レビューの階層構造を利用する。
我々は、最終的な受理決定を行う上で有用な予測者を特定することができ、また、数値的なレビュー評価とレビュアーが伝えるテキストの感情の不整合を発見するのに役立てることができる。
論文 参考訳(メタデータ) (2020-11-02T08:07:50Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。