論文の概要: ScholarSum: Student-Teacher Abstractive Summarization via Knowledge Graph Reasoning and Reflective Refinement
- arxiv url: http://arxiv.org/abs/2606.18850v1
- Date: Wed, 17 Jun 2026 09:31:07 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-18 17:16:51.087274
- Title: ScholarSum: Student-Teacher Abstractive Summarization via Knowledge Graph Reasoning and Reflective Refinement
- Title(参考訳): ScholarSum:知識グラフ推論とリフレクティブリファインメントによる学生・教師の抽象要約
- Authors: Bohou Zhang, Xiaoyu Tao, Mingyue Cheng, Huijie Liu, Qi Liu,
- Abstract要約: 本稿では, 生徒-教師の学習過程をエミュレートし, 流動的で忠実な科学的要約を実現するための階層的反射グラフベースのフレームワークを提案する。
ScholarSumはまず文書を階層的な知識グラフに分類し、意味的に一貫性のある単位に分類する。
事実整合性を確保するために、教師のようなレビュアーは、ドラフトを反復的に検証し、サポート対象のコンテンツを識別し、ターゲットの再検索と書き換えを促す。
- 参考スコア(独自算出の注目度): 9.620629066606197
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Abstractive summarization plays a crucial role in enabling efficient understanding of scientific literature, yet it inherently demands both linguistic fluency and factual faithfulness. Existing approaches often fail to reconcile these two requirements. Extractive methods rely on rigid sentence splicing that disrupts macro-level logical coherence, while large language model (LLM)-based generative approaches, despite mastering linguistic fluency, exhibit limited factual consistency. In this work, we propose ScholarSum, a hierarchical reflective graph-based framework that emulates a student-teacher writing process for fluent and faithful scientific summarization. ScholarSum first organizes the document into a hierarchical knowledge graph by segmenting it into semantically coherent units, whose multi-layered community structure captures global logic and macro-level themes. Guided by this global structure, the student generates an initial draft, which is subsequently refined through fine-grained evidence retrieval. To ensure factual consistency, a teacher-like reviewer then iteratively examines the draft, identifies unsupported content, and prompts targeted re-retrieval and rewriting until the summary meets rigorous quality standards. Extensive experiments demonstrate that ScholarSum significantly outperforms previous baselines in terms of both completeness and faithfulness. Our code is available at https://github.com/Xiaoyu-Tao/ScholarSum.
- Abstract(参考訳): 抽象的な要約は、科学的文献の効率的な理解を可能にする上で重要な役割を担っているが、本質的には言語流布と事実の忠実さの両方を要求する。
既存のアプローチでは、これらの2つの要件の調整に失敗することが多い。
抽出法は、マクロレベルの論理的コヒーレンスを阻害する厳密な文スプライシングに依存し、一方、大言語モデル(LLM)に基づく生成アプローチは、言語流布を習得するにも拘わらず、限定的な事実整合性を示す。
本研究では, 生徒-教員の書記過程をエミュレートし, 流動的で忠実な科学的要約を行う階層的反射グラフベースのフレームワークであるScholarSumを提案する。
ScholarSumはまず、文書を階層的な知識グラフに分類し、意味的に一貫性のある単位に分類し、その多層コミュニティ構造がグローバル論理とマクロレベルのテーマをキャプチャする。
このグローバルな構造によってガイドされ、学生は初期ドラフトを生成し、その後、きめ細かい証拠の検索によって洗練される。
事実整合性を確保するために、教師ライクなレビュアーは、ドラフトを反復的に検証し、サポート対象のコンテンツを識別し、その要約が厳格な品質基準を満たすまで、ターゲットの再検索と書き換えを促す。
広範な実験により、ScholarSumは完全性と忠実性の両方の観点から、以前のベースラインを著しく上回っていることが示されている。
私たちのコードはhttps://github.com/Xiaoyu-Tao/ScholarSum.comで公開されています。
関連論文リスト
- LECTOR: Joint Optimization of Scientific Reasoning Graphs and Introduction Generation [57.70907667652966]
序文は特に難解であり、論理的な健全さと検証可能な忠実さを要求する。
ほとんどのAI支援手法は、推論や構造化ではなく、タスクをテキスト生成として扱うため、深刻な欠点が生じる。
我々は,科学者の論理を厳格に追従し,高品質な引用を加え,構造化された表現を維持できる新しい論理表現協調強化学習フレームワークであるLECTORを提案する。
論文 参考訳(メタデータ) (2026-05-25T15:41:16Z) - Scientific Paper Retrieval with LLM-Guided Semantic-Based Ranking [23.23119083861653]
SemRankは効率的かつ効率的な紙検索フレームワークである。
クエリ理解と概念ベースのセマンティックインデックスを組み合わせる。
実験の結果、SemRankは様々なベースレトリバーの性能を一貫して改善していることがわかった。
論文 参考訳(メタデータ) (2025-05-27T22:49:18Z) - Beyond Chunking: Discourse-Aware Hierarchical Retrieval for Long Document Question Answering [51.7493726399073]
本稿では,長文質問応答を改善するための対話型階層型フレームワークを提案する。
このフレームワークには3つの重要な革新がある: 長文の専門的な談話解析、LLMに基づく談話関係ノードの拡張、構造誘導階層検索である。
論文 参考訳(メタデータ) (2025-05-26T14:45:12Z) - Enhancing Abstractive Summarization of Scientific Papers Using Structure Information [6.414732533433283]
本稿では,学術論文における構造的機能の自動認識を活用する2段階の抽象的要約フレームワークを提案する。
第1段階では,多くの学術論文から章題を標準化し,構造関数認識のための大規模データセットを構築した。
第2段階では、Longformerを用いて、セクション間のリッチなコンテキスト関係をキャプチャし、コンテキスト対応の要約を生成する。
論文 参考訳(メタデータ) (2025-05-20T10:34:45Z) - Taxonomy Tree Generation from Citation Graph [15.188580557890942]
HiGTLは、人為的な指示や好みのトピックによってガイドされる、新しいエンドツーエンドフレームワークである。
我々は,各クラスタに中心的な概念を反復的に生成する,新しい分類ノード言語化戦略を開発した。
実験により、HiGTLはコヒーレントで高品質な概念を効果的に生成することが示された。
論文 参考訳(メタデータ) (2024-10-02T13:02:03Z) - Hierarchical Indexing for Retrieval-Augmented Opinion Summarization [60.5923941324953]
本稿では,抽出アプローチの帰属性と拡張性と,大規模言語モデル(LLM)の一貫性と拡散性を組み合わせた,教師なし抽象的意見要約手法を提案する。
我々の方法であるHIROは、意味的に整理された離散的な階層を通して文を経路にマッピングするインデックス構造を学習する。
推測時にインデックスを投入し、入力レビューから人気意見を含む文群を識別し、検索する。
論文 参考訳(メタデータ) (2024-03-01T10:38:07Z) - How Well Do Text Embedding Models Understand Syntax? [50.440590035493074]
テキスト埋め込みモデルが幅広い構文的文脈にまたがって一般化する能力は、まだ解明されていない。
その結果,既存のテキスト埋め込みモデルは,これらの構文的理解課題に十分対応していないことが明らかとなった。
多様な構文シナリオにおけるテキスト埋め込みモデルの一般化能力を高めるための戦略を提案する。
論文 参考訳(メタデータ) (2023-11-14T08:51:00Z) - Factually Consistent Summarization via Reinforcement Learning with
Textual Entailment Feedback [57.816210168909286]
我々は,この問題を抽象的な要約システムで解くために,テキストエンテーメントモデルの最近の進歩を活用している。
我々は、事実整合性を最適化するために、レファレンスフリーのテキストエンターメント報酬を用いた強化学習を用いる。
自動測定と人的評価の両結果から,提案手法は生成した要約の忠実さ,サリエンス,簡潔さを著しく向上させることが示された。
論文 参考訳(メタデータ) (2023-05-31T21:04:04Z) - Lexically-constrained Text Generation through Commonsense Knowledge
Extraction and Injection [62.071938098215085]
我々は、ある入力概念のセットに対して妥当な文を生成することを目的としているcommongenベンチマークに焦点を当てる。
生成したテキストの意味的正しさを高めるための戦略を提案する。
論文 参考訳(メタデータ) (2020-12-19T23:23:40Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。