論文の概要: GRACE: Graph-Guided Repository-Aware Code Completion through Hierarchical Code Fusion
- arxiv url: http://arxiv.org/abs/2509.05980v1
- Date: Sun, 07 Sep 2025 09:01:48 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-09 14:07:03.802602
- Title: GRACE: Graph-Guided Repository-Aware Code Completion through Hierarchical Code Fusion
- Title(参考訳): GRACE:階層型コードフュージョンによるグラフガイド型リポジトリ対応コード補完
- Authors: Xingliang Wang, Baoyi Wang, Chen Zhi, Junxiao Han, Xinkui Zhao, Jianwei Yin, Shuiguang Deng,
- Abstract要約: LLMはローカライズされたコード補完に優れていますが、コンテキストウィンドウが限られているため、リポジトリレベルのタスクに苦労しています。
GRACEは、静的および動的コードセマンティクスの両方をキャプチャするために、マルチレベルでマルチセマンティックなコードグラフを構築する。
実験によると、GRACEはすべてのメトリクスで最先端のメソッドよりも大幅に優れています。
- 参考スコア(独自算出の注目度): 33.66085762717581
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: LLMs excel in localized code completion but struggle with repository-level tasks due to limited context windows and complex semantic and structural dependencies across codebases. While Retrieval-Augmented Generation (RAG) mitigates context scarcity by retrieving relevant code snippets, current approaches face significant limitations. They overly rely on textual similarity for retrieval, neglecting structural relationships such as call chains and inheritance hierarchies, and lose critical structural information by naively concatenating retrieved snippets into text sequences for LLM input. To address these shortcomings, GRACE constructs a multi-level, multi-semantic code graph that unifies file structures, abstract syntax trees, function call graphs, class hierarchies, and data flow graphs to capture both static and dynamic code semantics. For retrieval, GRACE employs a Hybrid Graph Retriever that integrates graph neural network-based structural similarity with textual retrieval, refined by a graph attention network-based re-ranker to prioritize topologically relevant subgraphs. To enhance context, GRACE introduces a structural fusion mechanism that merges retrieved subgraphs with the local code context and preserves essential dependencies like function calls and inheritance. Extensive experiments on public repository-level benchmarks demonstrate that GRACE significantly outperforms state-of-the-art methods across all metrics. Using DeepSeek-V3 as the backbone LLM, GRACE surpasses the strongest graph-based RAG baselines by 8.19% EM and 7.51% ES points on every dataset. The code is available at https://anonymous.4open.science/r/grace_icse-C3D5.
- Abstract(参考訳): LLMは、ローカライズされたコード補完に優れていますが、コンテキストウィンドウの制限とコードベース間の複雑なセマンティックと構造的依存関係のために、リポジトリレベルのタスクに苦労しています。
Retrieval-Augmented Generation (RAG)は、関連するコードスニペットを取得することでコンテキストの不足を軽減するが、現在のアプローチは重大な制限に直面している。
検索にはテキストの類似性に過度に依存し、コールチェーンや継承階層のような構造的関係を無視し、抽出したスニペットをLSM入力用のテキストシーケンスにナビゲートすることで重要な構造的情報を失う。
これらの欠点に対処するため、GRACEはファイル構造、抽象構文木、関数呼び出しグラフ、クラス階層、データフローグラフを統一し、静的および動的コードセマンティクスの両方をキャプチャするマルチレベルなマルチセマンティックコードグラフを構築している。
検索にはHybrid Graph Retrieverを使用し、グラフニューラルネットワークに基づく構造的類似性とテキスト検索を統合し、グラフアテンションネットワークベースのリランカによって洗練され、トポロジ的に関係のあるサブグラフの優先順位付けを行う。
コンテキストを強化するため、GRACEは検索したサブグラフをローカルコードコンテキストとマージし、関数呼び出しや継承のような必須の依存関係を保存する構造的な融合メカニズムを導入した。
公開リポジトリレベルのベンチマークに関する大規模な実験は、GRACEがすべてのメトリクスで最先端のメソッドを大幅に上回っていることを示している。
バックボーンLLMとしてDeepSeek-V3を使用することで、GRACEはグラフベースのRAGベースラインを8.19%のEMと7.51%のESポイントで上回っている。
コードはhttps://anonymous.4open.science/r/grace_icse-C3D5で公開されている。
関連論文リスト
- Align-GRAG: Reasoning-Guided Dual Alignment for Graph Retrieval-Augmented Generation [75.9865035064794]
大きな言語モデル(LLM)は目覚ましい能力を示しているが、幻覚や時代遅れの情報といった問題に苦戦している。
Retrieval-augmented Generation (RAG) は、情報検索システム(IR)を用いて、外部知識のLLM出力を基底にすることで、これらの問題に対処する。
本稿では、検索後句における新しい推論誘導二重アライメントフレームワークであるAlign-GRAGを提案する。
論文 参考訳(メタデータ) (2025-05-22T05:15:27Z) - Graph Chain-of-Thought: Augmenting Large Language Models by Reasoning on Graphs [60.71360240206726]
大規模言語モデル(LLM)は、特に知識集約的なタスクにおいて幻覚に悩まされる。
既存の研究は、外部知識コーパスから取得した個々のテキスト単位でLLMを拡張することを提案する。
本稿では,グラフを反復的に推論することで,LLMをグラフで拡張するためのGraph Chain-of-thinkt (Graph-CoT) というフレームワークを提案する。
論文 参考訳(メタデータ) (2024-04-10T15:41:53Z) - RepoHyper: Search-Expand-Refine on Semantic Graphs for Repository-Level Code Completion [12.173834895070827]
Toolは、リポジトリレベルのコード補完に関連する複雑な問題に対処するために設計されたフレームワークである。
Em Repoレベルセマンティックグラフ(RSG)は、コードリポジトリの広大なコンテキストをカプセル化する、新しいセマンティックグラフ構造である。
評価の結果,ツールがリポジトリレベルのコード補完において,既存のテクニックを著しく上回っていることが明らかとなった。
論文 参考訳(メタデータ) (2024-03-10T05:10:34Z) - G-Retriever: Retrieval-Augmented Generation for Textual Graph Understanding and Question Answering [61.93058781222079]
現実のテキストグラフを対象とするフレキシブルな問合せフレームワークを開発した。
一般のテキストグラフに対する最初の検索拡張生成(RAG)手法を提案する。
G-Retrieverは、このタスクをSteiner Tree最適化問題として定式化し、グラフ上でRAGを実行する。
論文 参考訳(メタデータ) (2024-02-12T13:13:04Z) - Coreference Graph Guidance for Mind-Map Generation [5.289044688419791]
近年、最先端の手法が文書の文を逐次エンコードし、シークエンス・トゥ・グラフを介して関係グラフに変換する。
外部構造知識を組み込むためのコア推論誘導マインドマップ生成ネットワーク(CMGN)を提案する。
論文 参考訳(メタデータ) (2023-12-19T09:39:27Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。