論文の概要: HCAG: Hierarchical Abstraction and Retrieval-Augmented Generation on Theoretical Repositories with LLMs
- arxiv url: http://arxiv.org/abs/2603.20299v1
- Date: Thu, 19 Mar 2026 07:41:52 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-24 19:11:38.816037
- Title: HCAG: Hierarchical Abstraction and Retrieval-Augmented Generation on Theoretical Repositories with LLMs
- Title(参考訳): HCAG:LLMを用いた理論的レポジトリの階層的抽象化と検索型生成
- Authors: Yusen Wu, Xiaotie Deng,
- Abstract要約: Hierarchical Code/Architecture-Guided Agent Generation (HCAG)は、階層的な知識よりも構造化され計画指向のプロセスとしてリポジトリレベルのコード生成を再構築するフレームワークである。
HCAGは、コード品質、アーキテクチャコヒーレンス、要求パス率において、代表的なリポジトリレベルのメソッドを大幅に上回る。
AGTで実証されているが、HCAGパラダイムは、他のドメインにおける構造化されたアライメントから複雑なシステムをマイニング、再利用、生成するための一般的な青写真を提供する。
- 参考スコア(独自算出の注目度): 12.68443002994035
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Existing Retrieval-Augmented Generation (RAG) methods for code struggle to capture the high-level architectural patterns and cross-file dependencies inherent in complex, theory-driven codebases, such as those in algorithmic game theory (AGT), leading to a persistent semantic and structural gap between abstract concepts and executable implementations. To address this challenge, we propose Hierarchical Code/Architecture-guided Agent Generation (HCAG), a framework that reformulates repository-level code generation as a structured, planning-oriented process over hierarchical knowledge. HCAG adopts a two-phase design: an offline hierarchical abstraction phase that recursively parses code repositories and aligned theoretical texts to construct a multi-resolution semantic knowledge base explicitly linking theory, architecture, and implementation; and an online hierarchical retrieval and scaffolded generation phase that performs top-down, level-wise retrieval to guide LLMs in an architecture-then-module generation paradigm. To further improve robustness and consistency, HCAG integrates a multi-agent discussion inspired by cooperative game. We provide a theoretical analysis showing that hierarchical abstraction with adaptive node compression achieves cost-optimality compared to flat and iterative RAG baselines. Extensive experiments on diverse game-theoretic system generation tasks demonstrate that HCAG substantially outperforms representative repository-level methods in code quality, architectural coherence, and requirement pass rate. In addition, HCAG produces a large-scale, aligned theory-implementation dataset that effectively enhances domain-specific LLMs through post-training. Although demonstrated in AGT, HCAG paradigm also offers a general blueprint for mining, reusing, and generating complex systems from structured codebases in other domains.
- Abstract(参考訳): 既存のRAG(Retrieval-Augmented Generation)メソッドは、アルゴリズムゲーム理論(AGT)のような複雑な理論駆動のコードベースに固有の高レベルなアーキテクチャパターンとファイル間の依存関係を捕捉し、抽象概念と実行可能実装の間に永続的な意味と構造的ギャップをもたらす。
この課題に対処するために、階層的コード/アーキテクチャ誘導エージェント生成(HCAG)を提案する。
HCAGは2段階の設計を採用しており、コードリポジトリを再帰的に解析し、理論的なテキストを整列して、理論、アーキテクチャ、実装を明確にリンクするマルチレゾリューションなセマンティック知識ベースを構築するオフライン階層的抽象化フェーズと、アーキテクチャ-テーマ-モジュール生成パラダイムでLLMをガイドするためのトップダウン、レベルワイド検索を実行するオンライン階層的検索および足場生成フェーズである。
HCAGは、堅牢性と一貫性をさらに向上するため、協調ゲームに触発されたマルチエージェントの議論を統合する。
本稿では,適応ノード圧縮による階層的抽象化が,フラットかつ反復的なRAGベースラインと比較してコスト最適化を実現することを示す。
多様なゲーム理論システム生成タスクに関する広範な実験により、HCAGはコード品質、アーキテクチャコヒーレンス、要求パス率において、代表的なリポジトリレベルのメソッドを大幅に上回っていることが示された。
さらにHCAGは、大規模で整列した理論実装データセットを生成し、ポストトレーニングを通じてドメイン固有のLLMを効果的に強化する。
AGTで実証されているが、HCAGパラダイムは、他のドメインの構造化コードベースから複雑なシステムをマイニング、再利用、生成するための一般的な青写真を提供する。
関連論文リスト
- Beyond the Academic Monoculture: A Unified Framework and Industrial Perspective for Attributed Graph Clustering [75.50670592447219]
分散グラフクラスタリング(AGC)は、構造トポロジとノード属性を共同でモデル化することによって、ノードを凝集性グループに分割する基本的な教師なしタスクである。
この調査は、3つの相補的な視点からAGCを包括的かつ工業的に基礎づけたレビューを提供する。
論文 参考訳(メタデータ) (2026-03-21T14:15:34Z) - Understanding by Reconstruction: Reversing the Software Development Process for LLM Pretraining [66.89012795621349]
大規模言語モデル(LLM)は、複雑なソフトウェア工学に必要な、深く、長期にわたる推論に苦しむことが多い。
本稿では,再構築による理解という,新しいパラダイムを提案する。
マルチエージェントシミュレーションを用いて潜在エージェント軌道を合成するフレームワークを提案する。
論文 参考訳(メタデータ) (2026-03-11T09:23:20Z) - T-Retriever: Tree-based Hierarchical Retrieval Augmented Generation for Textual Graphs [14.797057622726037]
グラフベースのRAGアプローチは、局所グラフ構造に損傷を与える厳密な層特異的圧縮クォータを強制する。
グラフ検索をツリーベースとして再構成する新しいフレームワークであるT-Retrieverを紹介する。
T-Retrieverは最先端のRAG法を著しく上回り、複雑なクエリに対してより一貫性があり、文脈的に関連する応答を提供する。
論文 参考訳(メタデータ) (2026-01-08T13:49:12Z) - Domain-Specific Data Generation Framework for RAG Adaptation [58.20906914537952]
Retrieval-Augmented Generation (RAG)は、大規模言語モデルの言語理解と推論能力と外部検索を組み合わせ、ドメイン基底応答を可能にする。
本稿では,様々なRAG適応手法に合わせて,ドメイン基底型質問応答コンテキスト(QAC)トリプルを生成するフレームワークであるRAGenを提案する。
論文 参考訳(メタデータ) (2025-10-13T09:59:49Z) - Dynamic Generation of Multi-LLM Agents Communication Topologies with Graph Diffusion Models [99.85131798240808]
我々はtextitGuided Topology Diffusion (GTD) と呼ばれる新しい生成フレームワークを導入する。
条件付き離散グラフ拡散モデルにインスパイアされたGTD式は、反復的な構成過程としてトポロジー合成を行う。
各ステップで生成は、多目的報酬を予測する軽量プロキシモデルによって制御される。
実験により、GTDは高いタスク適応性、スパース、効率的な通信トポロジを生成できることが示されている。
論文 参考訳(メタデータ) (2025-10-09T05:28:28Z) - Retrieval-Augmented Code Generation: A Survey with Focus on Repository-Level Approaches [6.740646039135986]
Retrieval-Augmented Generation (RAG) は、LLMと外部検索機構を統合する強力なパラダイムとして登場した。
リポジトリレベルのアプローチを重視したRACG(Retrieval-Augmented Code Generation)の研究を包括的にレビューする。
私たちのゴールは、この急速に進化する分野を理解するための統合分析フレームワークを確立し、AIによるソフトウェア工学の継続的な進歩を刺激することです。
論文 参考訳(メタデータ) (2025-10-06T15:20:03Z) - LeanRAG: Knowledge-Graph-Based Generation with Semantic Aggregation and Hierarchical Retrieval [10.566901995776025]
LeanRAGは知識集約と検索戦略を組み合わせたフレームワークです。
グラフ上のパス検索に関連するかなりのオーバーヘッドを軽減し、冗長な情報検索を最小限にする。
論文 参考訳(メタデータ) (2025-08-14T06:47:18Z) - HM-RAG: Hierarchical Multi-Agent Multimodal Retrieval Augmented Generation [11.53083922927901]
HM-RAGは階層型マルチエージェントマルチモーダルRAGフレームワークである。
構造化、非構造化、グラフベースのデータ間での動的知識合成のための協調知能の先駆者である。
論文 参考訳(メタデータ) (2025-04-13T06:55:33Z) - Chain-of-Programming (CoP) : Empowering Large Language Models for Geospatial Code Generation [2.6026969939746705]
本稿では,コード生成プロセスを5段階に分解するプログラミングフレームワークを提案する。
このフレームワークには、共有情報プール、知識ベース検索、ユーザフィードバック機構が含まれている。
生成されたコードの論理的明確性、構文的正確性、実行可能性を大幅に改善する。
論文 参考訳(メタデータ) (2024-11-16T09:20:35Z) - Provable Hierarchy-Based Meta-Reinforcement Learning [50.17896588738377]
HRLをメタRL設定で解析し、下流タスクで使用するメタトレーニング中に学習者が潜在階層構造を学習する。
我々は、この自然階層の標本効率の回復を保証し、抽出可能な楽観主義に基づくアルゴリズムとともに「多様性条件」を提供する。
我々の境界は、時間的・状態的・行動的抽象化などのHRL文献に共通する概念を取り入れており、我々の設定と分析が実際にHRLの重要な特徴を捉えていることを示唆している。
論文 参考訳(メタデータ) (2021-10-18T17:56:02Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。