論文の概要: Discourse-Aware Scientific Paper Recommendation via QA-Style Summarization and Multi-Level Contrastive Learning
- arxiv url: http://arxiv.org/abs/2511.03330v1
- Date: Wed, 05 Nov 2025 09:55:12 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-06 18:19:32.400548
- Title: Discourse-Aware Scientific Paper Recommendation via QA-Style Summarization and Multi-Level Contrastive Learning
- Title(参考訳): QA-Style Summarization と Multi-Level Contrastive Learning による対話型科学論文推薦
- Authors: Shenghua Wang, Zhen Yin,
- Abstract要約: OMRC-MRは、QAスタイルのOMRC要約、マルチレベルコントラスト学習、そして学術的推薦のための構造認識の再分類を統合する階層的なフレームワークである。
DBLP、S2ORC、新たに構築されたSci-OMRCデータセットの実験は、OMRC-MRが最先端のベースラインを一貫して超えることを示した。
- 参考スコア(独自算出の注目度): 2.105564340986074
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The rapid growth of open-access (OA) publications has intensified the challenge of identifying relevant scientific papers. Due to privacy constraints and limited access to user interaction data, recent efforts have shifted toward content-based recommendation, which relies solely on textual information. However, existing models typically treat papers as unstructured text, neglecting their discourse organization and thereby limiting semantic completeness and interpretability. To address these limitations, we propose OMRC-MR, a hierarchical framework that integrates QA-style OMRC (Objective, Method, Result, Conclusion) summarization, multi-level contrastive learning, and structure-aware re-ranking for scholarly recommendation. The QA-style summarization module converts raw papers into structured and discourse-consistent representations, while multi-level contrastive objectives align semantic representations across metadata, section, and document levels. The final re-ranking stage further refines retrieval precision through contextual similarity calibration. Experiments on DBLP, S2ORC, and the newly constructed Sci-OMRC dataset demonstrate that OMRC-MR consistently surpasses state-of-the-art baselines, achieving up to 7.2% and 3.8% improvements in Precision@10 and Recall@10, respectively. Additional evaluations confirm that QA-style summarization produces more coherent and factually complete representations. Overall, OMRC-MR provides a unified and interpretable content-based paradigm for scientific paper recommendation, advancing trustworthy and privacy-aware scholarly information retrieval.
- Abstract(参考訳): オープンアクセス(OA)出版物の急速な成長は、関連する科学論文の特定という課題を強めている。
プライバシーの制約とユーザインタラクションデータへのアクセス制限により、最近の取り組みは、テキスト情報のみに依存するコンテンツベースのレコメンデーションへと移行している。
しかし、既存のモデルは論文を非構造化のテキストとして扱い、会話の組織を無視し、意味的完全性と解釈可能性を制限する。
これらの制約に対処するため、学術的な推薦のために、QAスタイルのOMRC(Objective, Method, Result, Conclusion)要約、マルチレベルコントラスト学習、構造認識を組み込んだ階層的フレームワークであるOMRC-MRを提案する。
QAスタイルの要約モジュールは、原論文を構造化および談話一貫性のある表現に変換し、マルチレベルのコントラスト目的はメタデータ、セクション、ドキュメントレベルにまたがって意味表現を調整する。
最終段階は、文脈類似度校正による検索精度をさらに向上させる。
DBLP、S2ORC、新たに構築されたSci-OMRCデータセットの実験では、OMRC-MRが最先端のベースラインを一貫して越え、Precision@10とRecall@10の最大7.2%と3.8%の改善が達成されている。
さらなる評価により、QAスタイルの要約はより一貫性があり、事実的に完全な表現を生み出すことが確認される。
全体として、OMRC-MRは科学論文推薦のための統一的で解釈可能なコンテンツベースパラダイムを提供し、信頼性とプライバシーに配慮した学術情報検索を推進している。
関連論文リスト
- Leveraging Hierarchical Organization for Medical Multi-document Summarization [9.907620975399185]
医用多文書要約の入力に階層構造を組み込むことで、文書間で情報を整理・コンテキスト化するモデルの能力が向上するかどうかを検討する。
本研究は,人文要約よりもモデル生成要約を好むことを示す。
論文 参考訳(メタデータ) (2025-10-27T08:18:02Z) - CoT Referring: Improving Referring Expression Tasks with Grounded Reasoning [67.18702329644526]
CoT Referringは、構造化されたチェーン・オブ・シークレット・トレーニングデータ構造を通じて、モデル推論をモダリティにわたって強化する。
トレーニングデータを再構築して、新たな出力フォームを実行し、既存のデータセットに新たなアノテーションを提供します。
また、検出とセグメント化機能を統合MLLMフレームワークに統合し、新しい適応重み付き損失で学習して性能を最適化する。
論文 参考訳(メタデータ) (2025-10-03T08:50:21Z) - Beyond Chunking: Discourse-Aware Hierarchical Retrieval for Long Document Question Answering [51.7493726399073]
本稿では,長文質問応答を改善するための対話型階層型フレームワークを提案する。
このフレームワークには3つの重要な革新がある: 長文の専門的な談話解析、LLMに基づく談話関係ノードの拡張、構造誘導階層検索である。
論文 参考訳(メタデータ) (2025-05-26T14:45:12Z) - CoRank: LLM-Based Compact Reranking with Document Features for Scientific Retrieval [30.341167520613197]
第一段階の検索はしばしば科学的領域において最適でないため、関連する文書は下位にランクされる。
我々は、科学検索のためのトレーニング不要でモデルに依存しないフレームワークであるCoRankを提案する。
論文 参考訳(メタデータ) (2025-05-19T22:10:27Z) - XtraGPT: Context-Aware and Controllable Academic Paper Revision [43.263488839387584]
本稿では,基準誘導型意図アライメントと文脈認識モデリングを中心とした学術論文改訂のための人間-AI協調フレームワークを提案する。
XtraGPTは,コンテクスト対応,命令誘導型書き込み支援のためのオープンソースのLLMスイートである。
論文 参考訳(メタデータ) (2025-05-16T15:02:19Z) - Beyond Factual Accuracy: Evaluating Coverage of Diverse Factual Information in Long-form Text Generation [56.82274763974443]
ICATは、長文テキスト生成における多様な事実情報のカバレッジを測定するための評価フレームワークである。
原子の事実的クレームと出力で提示されるであろう様々な側面のアライメントを計算する。
私たちのフレームワークは、多様性とカバレッジの解釈可能かつきめ細かな分析を提供します。
論文 参考訳(メタデータ) (2025-01-07T05:43:23Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。