論文の概要: CE-GOCD: Central Entity-Guided Graph Optimization for Community Detection to Augment LLM Scientific Question Answering
- arxiv url: http://arxiv.org/abs/2601.21733v1
- Date: Thu, 29 Jan 2026 13:53:44 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-30 16:22:49.869215
- Title: CE-GOCD: Central Entity-Guided Graph Optimization for Community Detection to Augment LLM Scientific Question Answering
- Title(参考訳): CE-GOCD:コミュニティ検出のための中央エンティティガイドグラフ最適化によるLLM科学質問応答の強化
- Authors: Jiayin Lan, Jiaqi Li, Baoxin Wang, Ming Liu, Dayong Wu, Shijin Wang, Bing Qin, Guoping Hu,
- Abstract要約: 大規模言語モデル (LLM) は、科学的研究論文に対する質問応答にますます使われている。
既存の検索拡張手法は、しばしば孤立したテキストチャンクや概念に依存しているが、論文間の深いセマンティックな関係を見落としている。
本稿では,学術知識グラフ内の意味的部分構造を明示的にモデル化し,活用することにより,LLMの科学的質問応答を強化する手法を提案する。
- 参考スコア(独自算出の注目度): 36.76110608580489
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Large Language Models (LLMs) are increasingly used for question answering over scientific research papers. Existing retrieval augmentation methods often rely on isolated text chunks or concepts, but overlook deeper semantic connections between papers. This impairs the LLM's comprehension of scientific literature, hindering the comprehensiveness and specificity of its responses. To address this, we propose Central Entity-Guided Graph Optimization for Community Detection (CE-GOCD), a method that augments LLMs' scientific question answering by explicitly modeling and leveraging semantic substructures within academic knowledge graphs. Our approach operates by: (1) leveraging paper titles as central entities for targeted subgraph retrieval, (2) enhancing implicit semantic discovery via subgraph pruning and completion, and (3) applying community detection to distill coherent paper groups with shared themes. We evaluated the proposed method on three NLP literature-based question-answering datasets, and the results demonstrate its superiority over other retrieval-augmented baseline approaches, confirming the effectiveness of our framework.
- Abstract(参考訳): 大規模言語モデル (LLM) は、科学的研究論文に対する質問応答にますます使われている。
既存の検索拡張手法は、しばしば孤立したテキストチャンクや概念に依存しているが、論文間の深いセマンティックな関係を見落としている。
このことはLLMの科学文献の理解を損なうものであり、その反応の包括性と特異性を妨げている。
そこで我々は,学術知識グラフ内の意味的部分構造を明示的にモデル化し,活用することにより,LLMの科学的質問に答える手法であるCentral Entity-Guided Graph Optimization for Community Detection (CE-GOCD)を提案する。
提案手法は,(1)紙のタイトルを目的のサブグラフ検索のための中心的なエンティティとして活用すること,(2)サブグラフのプルーニングと完了による暗黙的な意味発見を強化すること,(3)コヒーレントな紙群を共有テーマで蒸留するためにコミュニティ検出を適用すること,である。
提案手法を3つのNLP文献に基づく質問応答データセットで評価し,提案手法が他の検索拡張ベースライン手法よりも優れていることを示すとともに,本フレームワークの有効性を確認した。
関連論文リスト
- Context-Aware Hierarchical Taxonomy Generation for Scientific Papers via LLM-Guided Multi-Aspect Clustering [59.54662810933882]
既存の分類体系の構築手法は、教師なしクラスタリングや大きな言語モデルの直接的プロンプトを利用しており、コヒーレンスと粒度の欠如が多かった。
LLM誘導型マルチアスペクト符号化と動的クラスタリングを統合したコンテキスト対応階層型階層型分類生成フレームワークを提案する。
論文 参考訳(メタデータ) (2025-09-23T15:12:58Z) - Cross-Granularity Hypergraph Retrieval-Augmented Generation for Multi-hop Question Answering [49.43814054718318]
マルチホップ質問応答 (MHQA) は、正しい回答を得るために複数の経路に散在する知識を統合する必要がある。
従来の検索拡張生成法(RAG)は主に粗い粒度のテキスト意味的類似性に焦点を当てている。
本稿では,HGRAG for MHQAという新しいRAG手法を提案する。
論文 参考訳(メタデータ) (2025-08-15T06:36:13Z) - Question-Answer Extraction from Scientific Articles Using Knowledge Graphs and Large Language Models [1.8637078358591848]
本稿では,科学的論文から質問と回答のペアを生成するための2つのアプローチを提案する。
最初のアプローチは、質問を生成するためにLarge Language Model(LLM)を使用して、有能な段落を選択することである。
第2のアプローチでは、QA生成に知識グラフ(KG)を活用する。
論文 参考訳(メタデータ) (2025-07-18T11:31:52Z) - Scientific Paper Retrieval with LLM-Guided Semantic-Based Ranking [23.23119083861653]
SemRankは効率的かつ効率的な紙検索フレームワークである。
クエリ理解と概念ベースのセマンティックインデックスを組み合わせる。
実験の結果、SemRankは様々なベースレトリバーの性能を一貫して改善していることがわかった。
論文 参考訳(メタデータ) (2025-05-27T22:49:18Z) - Harnessing Large Language Models for Knowledge Graph Question Answering via Adaptive Multi-Aspect Retrieval-Augmentation [81.18701211912779]
本稿では,KG(Amar)フレームワーク上での適応型マルチアスペクト検索手法を提案する。
この方法は、エンティティ、リレーション、サブグラフを含む知識を検索し、検索した各テキストを即時埋め込みに変換する。
提案手法は2つの共通データセットに対して最先端の性能を達成した。
論文 参考訳(メタデータ) (2024-12-24T16:38:04Z) - Ground Every Sentence: Improving Retrieval-Augmented LLMs with Interleaved Reference-Claim Generation [51.8188846284153]
分散テキスト生成(ATG)は,RAGシステムにおける信頼性と妥当性を高めるために提案される。
本稿では,参照と回答を段階的に交互に生成する詳細なATG手法であるReClaimを提案する。
広範囲な実験により,ReClaimの有効性が検証され,90%の引用精度が得られた。
論文 参考訳(メタデータ) (2024-07-01T20:47:47Z) - Robust Saliency-Aware Distillation for Few-shot Fine-grained Visual
Recognition [57.08108545219043]
サンプルが少ない新しいサブカテゴリを認識することは、コンピュータビジョンにおいて不可欠で挑戦的な研究課題である。
既存の文献は、ローカルベースの表現アプローチを採用することでこの問題に対処している。
本稿では,ロバスト・サリエンシ・アウェア蒸留法(RSaD)を提案する。
論文 参考訳(メタデータ) (2023-05-12T00:13:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。