論文の概要: Reconnecting Fragmented Citation Networks with Semantic Augmentation
- arxiv url: http://arxiv.org/abs/2605.12263v1
- Date: Tue, 12 May 2026 15:28:39 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-13 21:48:56.964937
- Title: Reconnecting Fragmented Citation Networks with Semantic Augmentation
- Title(参考訳): 意味的拡張によるフラグメンテッド・サイテーション・ネットワークの再接続
- Authors: Vu Thi Huong, Annika Buchholz, Imene Khebouri, Thorsten Koch, Tim Kunt, Wolfgang Peters-Kottig, Tomasz Stompor, Janina Zittel,
- Abstract要約: 本稿では,大規模言語モデル(LLM)に基づくテキスト類似度と,引用トポロジを統合した計算効率のよいハイブリッドフレームワークを提案する。
分割された小さなコンポーネントから意味的なエッジを追加し、テキストの類似性に応じて既存の引用を重み付けすることで、元のグラフを強化します。
この方法は,大規模なデータセットに効率よくスケールし,学際的境界を崩壊させることなく,引用に基づく指標を強化するための実践的戦略を提供する。
- 参考スコア(独自算出の注目度): 0.6598115808819748
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Citation graphs are fundamental tools for modeling scientific structure, but are often fragmented due to missing citations of scientifically connected articles. To address this issue, we propose a computationally efficient hybrid framework integrating citation topology with large language model (LLM)-based text similarity. Using 662,369 Web of Science publications in Mathematics and Operations Research & Management Science, we augment the original graph by adding semantic edges from small, disconnected components and weighting existing citations according to textual similarity. Semantic augmentation substantially reduces fragmentation while preserving disciplinary homogeneity. Compared to embedding-only clustering, cluster detection on augmented graphs using the Leiden algorithm retains structural interpretability while offering multi-scale organization. The method scales efficiently to large datasets and offers a practical strategy for strengthening citation-based indicators without collapsing disciplinary boundaries.
- Abstract(参考訳): 沈み込みグラフは科学構造をモデル化するための基本的な道具であるが、しばしば科学的に連結された論文の引用が欠如しているために断片化される。
この問題に対処するために,大規模言語モデル (LLM) に基づくテキスト類似度と引用トポロジを統合した計算効率のよいハイブリッドフレームワークを提案する。
662,369のウェブ・オブ・サイエンス・パブリッシングを数学・オペレーション・リサーチ・マネジメント・サイエンスで使用し、テキストの類似性に応じて既存の引用を重み付けし、小さなコンポーネントのセマンティック・エッジを追加することで、元のグラフを強化する。
意味的拡張は、分断性を保ちながら断片化を著しく減少させる。
埋め込みのみのクラスタリングと比較して、Leidenアルゴリズムを用いた拡張グラフ上のクラスタ検出は、マルチスケールな組織を提供しながら構造的解釈可能性を維持している。
この方法は,大規模なデータセットに効率よくスケールし,学際的境界を崩壊させることなく,引用に基づく指標を強化するための実践的戦略を提供する。
関連論文リスト
- Word-Centered Semantic Graphs for Interpretable Diachronic Sense Tracking [0.3033221007650832]
我々は,ダイアクロニック・スキップ・グラムの埋め込みから分布類似性を統合する単語中心セマンティック・ネットワークを,時間固有のマスキング言語モデルから語彙置換性に導出する。
周辺グラフのクラスタ化,ノードオーバーラップによる時間的クラスタのアライメント,クラスタ構成と正規化クラスタマスによる変化の追跡により,感覚関連構造を同定する。
論文 参考訳(メタデータ) (2026-01-29T23:45:58Z) - MetaHGNIE: Meta-Path Induced Hypergraph Contrastive Learning in Heterogeneous Knowledge Graphs [16.36978652807043]
本稿ではメタパスによるハイパーグラフ学習フレームワークであるMetaHGNIEを提案する。
本結果は,異種知識グラフにおける高次相互作用と相互アライメントを明示的にモデル化することの有効性を強調した。
論文 参考訳(メタデータ) (2025-12-13T22:21:33Z) - Cross-Granularity Hypergraph Retrieval-Augmented Generation for Multi-hop Question Answering [49.43814054718318]
マルチホップ質問応答 (MHQA) は、正しい回答を得るために複数の経路に散在する知識を統合する必要がある。
従来の検索拡張生成法(RAG)は主に粗い粒度のテキスト意味的類似性に焦点を当てている。
本稿では,HGRAG for MHQAという新しいRAG手法を提案する。
論文 参考訳(メタデータ) (2025-08-15T06:36:13Z) - Clustering scientific publications: lessons learned through experiments with a real citation network [0.0]
スペクトル、ルービン、ライデンアルゴリズムなどのグラフベースのクラスタリング手法は、引用ネットワークをモデル化する能力のために頻繁に利用される。
本研究では,Web of Scienceから抽出した約70万枚の論文と460万個の引用からなる引用グラフ上で,これらのクラスタリングアルゴリズムの性能を評価する。
論文 参考訳(メタデータ) (2025-05-15T14:27:53Z) - Taxonomy Tree Generation from Citation Graph [15.188580557890942]
HiGTLは、人為的な指示や好みのトピックによってガイドされる、新しいエンドツーエンドフレームワークである。
我々は,各クラスタに中心的な概念を反復的に生成する,新しい分類ノード言語化戦略を開発した。
実験により、HiGTLはコヒーレントで高品質な概念を効果的に生成することが示された。
論文 参考訳(メタデータ) (2024-10-02T13:02:03Z) - Scientific Paper Extractive Summarization Enhanced by Citation Graphs [50.19266650000948]
我々は、引用グラフを活用して、異なる設定下での科学的論文の抽出要約を改善することに重点を置いている。
予備的な結果は、単純な教師なしフレームワークであっても、引用グラフが有用であることを示している。
そこで我々は,大規模ラベル付きデータが利用可能である場合のタスクにおいて,より正確な結果を得るために,グラフベースのスーパービジョン・サムライゼーション・モデル(GSS)を提案する。
論文 参考訳(メタデータ) (2022-12-08T11:53:12Z) - Deep Graph Learning for Anomalous Citation Detection [55.81334139806342]
本稿では,新たな深層グラフ学習モデルであるGLAD(Graph Learning for Anomaly Detection)を提案する。
GLADフレームワーク内ではCPU(Citation PUrpose)と呼ばれるアルゴリズムが提案され,引用テキストに基づく引用の目的が明らかになった。
論文 参考訳(メタデータ) (2022-02-23T09:05:28Z) - Hierarchical Heterogeneous Graph Representation Learning for Short Text
Classification [60.233529926965836]
短文分類のためのグラフニューラルネットワーク(GNN)に基づく ShiNE と呼ばれる新しい手法を提案する。
まず,短文データセットを単語レベル成分グラフからなる階層的不均一グラフとしてモデル化する。
そして、類似した短いテキスト間の効果的なラベル伝搬を容易にするショート文書グラフを動的に学習する。
論文 参考訳(メタデータ) (2021-10-30T05:33:05Z) - Enhancing Scientific Papers Summarization with Citation Graph [78.65955304229863]
引用グラフを用いて科学論文の要約作業を再定義します。
我々は,141kの研究論文を異なる領域に格納した,新しい科学論文要約データセットセマンティックスタディネットワーク(ssn)を構築した。
我々のモデルは、事前訓練されたモデルと比較して競争性能を達成することができる。
論文 参考訳(メタデータ) (2021-04-07T11:13:35Z) - Amortized Probabilistic Detection of Communities in Graphs [39.56798207634738]
そこで我々は,アモータイズされたコミュニティ検出のためのシンプルなフレームワークを提案する。
我々はGNNの表現力と最近のアモータイズクラスタリングの手法を組み合わせる。
我々は、合成および実データセットに関するフレームワークから、いくつかのモデルを評価する。
論文 参考訳(メタデータ) (2020-10-29T16:18:48Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。