論文の概要: GRACE: Graph-Guided Repository-Aware Code Completion through Hierarchical Code Fusion
- arxiv url: http://arxiv.org/abs/2509.05980v1
- Date: Sun, 07 Sep 2025 09:01:48 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-09 14:07:03.802602
- Title: GRACE: Graph-Guided Repository-Aware Code Completion through Hierarchical Code Fusion
- Title(参考訳): GRACE:階層型コードフュージョンによるグラフガイド型リポジトリ対応コード補完
- Authors: Xingliang Wang, Baoyi Wang, Chen Zhi, Junxiao Han, Xinkui Zhao, Jianwei Yin, Shuiguang Deng,
- Abstract要約: LLMはローカライズされたコード補完に優れていますが、コンテキストウィンドウが限られているため、リポジトリレベルのタスクに苦労しています。
GRACEは、静的および動的コードセマンティクスの両方をキャプチャするために、マルチレベルでマルチセマンティックなコードグラフを構築する。
実験によると、GRACEはすべてのメトリクスで最先端のメソッドよりも大幅に優れています。
- 参考スコア(独自算出の注目度): 33.66085762717581
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: LLMs excel in localized code completion but struggle with repository-level tasks due to limited context windows and complex semantic and structural dependencies across codebases. While Retrieval-Augmented Generation (RAG) mitigates context scarcity by retrieving relevant code snippets, current approaches face significant limitations. They overly rely on textual similarity for retrieval, neglecting structural relationships such as call chains and inheritance hierarchies, and lose critical structural information by naively concatenating retrieved snippets into text sequences for LLM input. To address these shortcomings, GRACE constructs a multi-level, multi-semantic code graph that unifies file structures, abstract syntax trees, function call graphs, class hierarchies, and data flow graphs to capture both static and dynamic code semantics. For retrieval, GRACE employs a Hybrid Graph Retriever that integrates graph neural network-based structural similarity with textual retrieval, refined by a graph attention network-based re-ranker to prioritize topologically relevant subgraphs. To enhance context, GRACE introduces a structural fusion mechanism that merges retrieved subgraphs with the local code context and preserves essential dependencies like function calls and inheritance. Extensive experiments on public repository-level benchmarks demonstrate that GRACE significantly outperforms state-of-the-art methods across all metrics. Using DeepSeek-V3 as the backbone LLM, GRACE surpasses the strongest graph-based RAG baselines by 8.19% EM and 7.51% ES points on every dataset. The code is available at https://anonymous.4open.science/r/grace_icse-C3D5.
- Abstract(参考訳): LLMは、ローカライズされたコード補完に優れていますが、コンテキストウィンドウの制限とコードベース間の複雑なセマンティックと構造的依存関係のために、リポジトリレベルのタスクに苦労しています。
Retrieval-Augmented Generation (RAG)は、関連するコードスニペットを取得することでコンテキストの不足を軽減するが、現在のアプローチは重大な制限に直面している。
検索にはテキストの類似性に過度に依存し、コールチェーンや継承階層のような構造的関係を無視し、抽出したスニペットをLSM入力用のテキストシーケンスにナビゲートすることで重要な構造的情報を失う。
これらの欠点に対処するため、GRACEはファイル構造、抽象構文木、関数呼び出しグラフ、クラス階層、データフローグラフを統一し、静的および動的コードセマンティクスの両方をキャプチャするマルチレベルなマルチセマンティックコードグラフを構築している。
検索にはHybrid Graph Retrieverを使用し、グラフニューラルネットワークに基づく構造的類似性とテキスト検索を統合し、グラフアテンションネットワークベースのリランカによって洗練され、トポロジ的に関係のあるサブグラフの優先順位付けを行う。
コンテキストを強化するため、GRACEは検索したサブグラフをローカルコードコンテキストとマージし、関数呼び出しや継承のような必須の依存関係を保存する構造的な融合メカニズムを導入した。
公開リポジトリレベルのベンチマークに関する大規模な実験は、GRACEがすべてのメトリクスで最先端のメソッドを大幅に上回っていることを示している。
バックボーンLLMとしてDeepSeek-V3を使用することで、GRACEはグラフベースのRAGベースラインを8.19%のEMと7.51%のESポイントで上回っている。
コードはhttps://anonymous.4open.science/r/grace_icse-C3D5で公開されている。
関連論文リスト
- Graph-Anchored Knowledge Indexing for Retrieval-Augmented Generation [53.42323544075114]
グラフアンコール型知識インデックス手法であるGraphAnchorを提案する。
4つのマルチホップ質問応答ベンチマークの実験では、GraphAnchorの有効性が示されている。
論文 参考訳(メタデータ) (2026-01-23T05:41:05Z) - LinearRAG: Linear Graph Retrieval Augmented Generation on Large-scale Corpora [17.929144506419064]
Retrieval-Augmented Generation (RAG) は大規模言語モデル(LLM)の幻覚を軽減するために広く用いられている。
既存のグラフベースのRAG法は、グラフ構築のための不安定でコストのかかる関係抽出に依存している。
信頼性の高いグラフ構築と正確な経路抽出を可能にする効率的なフレームワークであるLinearRAGを提案する。
論文 参考訳(メタデータ) (2025-10-11T08:43:45Z) - GILT: An LLM-Free, Tuning-Free Graph Foundational Model for In-Context Learning [50.40400074353263]
グラフニューラルネットワーク(GNN)は、リレーショナルデータを先行する強力なツールであるが、しばしば目に見えないグラフに一般化するのに苦労する。
textbfGraph textbfIn-context textbfL textbfTransformer (GILT)を導入する。
論文 参考訳(メタデータ) (2025-10-06T08:09:15Z) - Cross-Granularity Hypergraph Retrieval-Augmented Generation for Multi-hop Question Answering [49.43814054718318]
マルチホップ質問応答 (MHQA) は、正しい回答を得るために複数の経路に散在する知識を統合する必要がある。
従来の検索拡張生成法(RAG)は主に粗い粒度のテキスト意味的類似性に焦点を当てている。
本稿では,HGRAG for MHQAという新しいRAG手法を提案する。
論文 参考訳(メタデータ) (2025-08-15T06:36:13Z) - Align-GRAG: Reasoning-Guided Dual Alignment for Graph Retrieval-Augmented Generation [75.9865035064794]
大きな言語モデル(LLM)は目覚ましい能力を示しているが、幻覚や時代遅れの情報といった問題に苦戦している。
Retrieval-augmented Generation (RAG) は、情報検索システム(IR)を用いて、外部知識のLLM出力を基底にすることで、これらの問題に対処する。
本稿では、検索後句における新しい推論誘導二重アライメントフレームワークであるAlign-GRAGを提案する。
論文 参考訳(メタデータ) (2025-05-22T05:15:27Z) - Graph Chain-of-Thought: Augmenting Large Language Models by Reasoning on Graphs [60.71360240206726]
大規模言語モデル(LLM)は、特に知識集約的なタスクにおいて幻覚に悩まされる。
既存の研究は、外部知識コーパスから取得した個々のテキスト単位でLLMを拡張することを提案する。
本稿では,グラフを反復的に推論することで,LLMをグラフで拡張するためのGraph Chain-of-thinkt (Graph-CoT) というフレームワークを提案する。
論文 参考訳(メタデータ) (2024-04-10T15:41:53Z) - RepoHyper: Search-Expand-Refine on Semantic Graphs for Repository-Level Code Completion [12.173834895070827]
Toolは、リポジトリレベルのコード補完に関連する複雑な問題に対処するために設計されたフレームワークである。
Em Repoレベルセマンティックグラフ(RSG)は、コードリポジトリの広大なコンテキストをカプセル化する、新しいセマンティックグラフ構造である。
評価の結果,ツールがリポジトリレベルのコード補完において,既存のテクニックを著しく上回っていることが明らかとなった。
論文 参考訳(メタデータ) (2024-03-10T05:10:34Z) - G-Retriever: Retrieval-Augmented Generation for Textual Graph Understanding and Question Answering [61.93058781222079]
現実のテキストグラフを対象とするフレキシブルな問合せフレームワークを開発した。
一般のテキストグラフに対する最初の検索拡張生成(RAG)手法を提案する。
G-Retrieverは、このタスクをSteiner Tree最適化問題として定式化し、グラフ上でRAGを実行する。
論文 参考訳(メタデータ) (2024-02-12T13:13:04Z) - Coreference Graph Guidance for Mind-Map Generation [5.289044688419791]
近年、最先端の手法が文書の文を逐次エンコードし、シークエンス・トゥ・グラフを介して関係グラフに変換する。
外部構造知識を組み込むためのコア推論誘導マインドマップ生成ネットワーク(CMGN)を提案する。
論文 参考訳(メタデータ) (2023-12-19T09:39:27Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。