論文の概要: STAR: Semantic-Tuned and Tail-Adaptive Retriever for Graph-Augmented Generation
- arxiv url: http://arxiv.org/abs/2605.18765v1
- Date: Sat, 11 Apr 2026 10:16:51 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-25 12:34:33.92417
- Title: STAR: Semantic-Tuned and Tail-Adaptive Retriever for Graph-Augmented Generation
- Title(参考訳): STAR: グラフ拡張ジェネレーションのためのセマンティックチューニングとテール適応レトリバー
- Authors: Shuai Li, Chen Huang, Duanyu Feng, Wenqiang Lei, See-Kiong Ng,
- Abstract要約: 本稿では,GraphRAGのためのセマンティックチューニングとテール適応型レトリバーSTARを提案する。
STARは一貫してベースラインを上回り、平均検索性能は1.8%向上した。
- 参考スコア(独自算出の注目度): 69.66045538889777
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: To augment Large Language Models (LLMs) for multi-hop question answering, a mainstream solution within Graph Retrieval Augmented Generation (GraphRAG) leverages lightweight retrievers to efficiently extract information from a given Knowledge Graph (KG). However, existing methods often overlook the inherent challenge of sparse semantic information in graphs. Specifically, our experiments reveal that these methods produce biased retrieval Semantic Shortcut Bias and Long-Tail Path Bias, leading to inadequate semantic modeling and limited GraphRAG effectiveness. To address these issues, we propose STAR, a semantic-tuned and tail-adaptive retriever for GraphRAG. STAR integrates two key learning paradigms: token-level interaction learning and path-weighted contrastive learning. The former employs a cross-attention architecture and a hard path mining mechanism to jointly model the query and path, thereby mitigating the Semantic Shortcut Bias. The latter introduces a tailored contrastive learning objective that utilizes tail-adaptive path weighting, designed to optimize the training process and ease the Long-Tail Path Bias. Extensive experiments demonstrate that STAR consistently outperforms baselines, achieving average retrieval performance gains of 1.8\% and LLM QA performance improvements of 2.2\% across all benchmark datasets. Our code is available at https://anonymous.4open.science/r/STAR-C583.
- Abstract(参考訳): マルチホップ質問応答のための大規模言語モデル(LLM)を強化するため、GraphRAG(Graph Retrieval Augmented Generation)内のメインストリームソリューションでは、軽量レトリバーを活用して所定の知識グラフ(KG)から情報を効率的に抽出する。
しかし、既存の手法はグラフにおけるスパース意味情報の固有の課題をしばしば見落としている。
具体的には,これらの手法がセマンティック・ショートカットバイアスとロングテール・パスバイアスの偏りを生じ,セマンティック・ショートカットバイアスが不適切なセマンティック・モデリングと限定的なグラフRAGの有効性をもたらすことを示した。
これらの問題に対処するため、我々はGraphRAGのセマンティックチューニングとテール適応型レトリバーSTARを提案する。
STARはトークンレベルのインタラクション学習とパス重み付きコントラスト学習という,2つの重要な学習パラダイムを統合している。
前者はクロスアテンションアーキテクチャとハードパスマイニング機構を使用して、クエリとパスを共同でモデル化し、セマンティックショートカットバイアスを緩和する。
後者は、尾適応パス重み付けを利用して、トレーニングプロセスを最適化し、Long-Tail Path Biasを緩和する、調整されたコントラスト学習の目的を導入する。
大規模な実験により、STARはベースラインを一貫して上回り、平均検索性能は1.8\%、LLM QA性能は全ベンチマークデータセットで2.2\%向上した。
私たちのコードはhttps://anonymous.4open.science/r/STAR-C583で公開されています。
関連論文リスト
- Semi-supervised Instruction Tuning for Large Language Models on Text-Attributed Graphs [62.544129365882014]
本稿では,SIT-Graph というグラフ学習用セミ教師付きインストラクションチューニングパイプラインを提案する。
SIT-Graphはモデルに依存しず、LSMを予測子として利用するグラフ命令チューニングメソッドにシームレスに統合することができる。
SIT-Graphは、最先端グラフチューニング手法に組み込むと、テキスト分散グラフベンチマークの性能を大幅に向上することを示した。
論文 参考訳(メタデータ) (2026-01-19T08:10:53Z) - Reasoning by Exploration: A Unified Approach to Retrieval and Generation over Graphs [39.425801384830415]
構造化グラフに対する推論は、大規模言語モデルにとって依然として根本的な課題である。
グラフ探索のプロセスとしてグラフ上の推論をフレーミングすることによって検索と生成を統一する新しい手法であるReasoning by Exploration (RoE)を提案する。
RoEは、ベースラインよりも大幅に全体的な改善を実現し、また、目に見えないグラフに効果的に一般化する。
論文 参考訳(メタデータ) (2025-10-08T19:29:19Z) - GRAIL:Learning to Interact with Large Knowledge Graphs for Retrieval Augmented Reasoning [13.481673780508215]
GRAILは、検索強化推論のための大規模グラフと相互作用するように設計されたフレームワークである。
GRAILは知識グラフ問合せデータセットの平均精度を21.01%改善し、F1改善を22.43%改善する。
論文 参考訳(メタデータ) (2025-08-07T15:34:41Z) - GraphRunner: A Multi-Stage Framework for Efficient and Accurate Graph-Based Retrieval [3.792463570467098]
GraphRunnerは、新しいグラフベースの検索フレームワークで、計画、検証、実行の3つの異なる段階で動作する。
推論エラーを著しく低減し、実行前に幻覚を検出する。
GRBenchデータセットによる評価は、GraphRunnerが既存のアプローチを一貫して上回っていることを示している。
論文 参考訳(メタデータ) (2025-07-11T18:10:01Z) - DiRW: Path-Aware Digraph Learning for Heterophily [34.32328516545247]
グラフニューラルネットワーク(GNN)は、グラフ構造化データのための強力な表現学習ツールとして登場した。
DiRWは、ほとんどの空間ベースのDiGNNのためのプラグアンドプレイ戦略であり、新しいダイグラフ学習パラダイムを提供する革新的なモデルである。
9つのデータセットの実験から,(1)プラグアンドプレイ戦略としての空間的手法,(2)新しいディグラフ学習パラダイムとしてのSOTA性能,の2つが示された。
論文 参考訳(メタデータ) (2024-10-14T09:26:56Z) - Efficient Heterogeneous Graph Learning via Random Projection [58.4138636866903]
不均一グラフニューラルネットワーク(HGNN)は、異種グラフを深層学習するための強力なツールである。
最近のプリ計算ベースのHGNNは、一時間メッセージパッシングを使用して不均一グラフを正規形テンソルに変換する。
我々はRandom Projection Heterogeneous Graph Neural Network (RpHGNN) というハイブリッド計算前HGNNを提案する。
論文 参考訳(メタデータ) (2023-10-23T01:25:44Z) - SimTeG: A Frustratingly Simple Approach Improves Textual Graph Learning [131.04781590452308]
テキストグラフ学習におけるフラストレーションに富んだアプローチであるSimTeGを提案する。
まず、下流タスクで予め訓練されたLM上で、教師付きパラメータ効率の微調整(PEFT)を行う。
次に、微調整されたLMの最後の隠れ状態を用いてノード埋め込みを生成する。
論文 参考訳(メタデータ) (2023-08-03T07:00:04Z) - Node Feature Extraction by Self-Supervised Multi-scale Neighborhood
Prediction [123.20238648121445]
我々は、新しい自己教師型学習フレームワーク、グラフ情報支援ノード機能exTraction (GIANT)を提案する。
GIANT は eXtreme Multi-label Classification (XMC) 形式を利用しており、これはグラフ情報に基づいた言語モデルの微調整に不可欠である。
我々は,Open Graph Benchmarkデータセット上での標準GNNパイプラインよりもGIANTの方が優れた性能を示す。
論文 参考訳(メタデータ) (2021-10-29T19:55:12Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。