論文の概要: TICoder: A Repository-Level Code Generation Framework with Test-Driven Planning and Implementation-Aware Reuse
- arxiv url: http://arxiv.org/abs/2606.08135v1
- Date: Sat, 06 Jun 2026 12:23:30 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-09 14:42:05.866122
- Title: TICoder: A Repository-Level Code Generation Framework with Test-Driven Planning and Implementation-Aware Reuse
- Title(参考訳): TICoder: テスト駆動計画と実装対応再利用を備えたリポジトリレベルのコード生成フレームワーク
- Authors: Siyu Nan, Yaling Luo, Jian Wang, Neng Zhang, Bing Li,
- Abstract要約: 我々は、計画と再利用の両方を改善する新しいリポジトリレベルのコード生成フレームワークTICoderを提案する。
TICoderは、テストケースを振る舞い仕様として活用して実装手順を洗練する、テスト駆動反復計画メカニズムを導入している。
次に、構造に基づくクラスタリングとパープレキシティに基づくフィルタリングを組み合わせた2段階選択戦略により、関連する利用パターンを同定する。
- 参考スコア(独自算出の注目度): 6.560303090465954
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Repository-level code generation with Large Language Models (LLMs) remains challenging, primarily due to complex dependencies and limited context windows. Recent approaches adopt retrieval-augmented generation (RAG) and the planning mechanism to reuse potential callee functions in the repository. However, these approaches often suffer from two limitations: lack of test-driven behavioral guidance during planning and overlooking the implementation logic embedded in repository code during reuse. As a result, generated plans may not align with expected behaviors, and retrieved functions may not be effectively reused. In this paper, we propose TICoder, a novel repository-level code generation framework that improves both planning and reuse. TICoder introduces a test-driven iterative planning mechanism that leverages test cases as behavioral specifications to refine implementation steps. Furthermore, TICoder employs an implementation-aware code reuse strategy, which retrieves potential callee functions using a dual-view similarity that captures both functional and implementation aspects. We then identify relevant usage patterns through a dual-stage selection strategy, combining structure-based clustering and perplexity-based filtering. We conduct extensive experiments on widely used repository-level code generation benchmarks with various LLMs. Experimental results demonstrate that TICoder outperforms state-of-the-art (SOTA) methods, achieving an average improvement of 11.52%.
- Abstract(参考訳): 大きな言語モデル(LLM)によるリポジトリレベルのコード生成は、主に複雑な依存関係と限られたコンテキストウィンドウのため、依然として困難である。
近年のアプローチでは、検索強化生成(RAG)と、リポジトリ内の潜在的な呼び出し関数を再利用するための計画メカニズムが採用されている。
しかしながら、これらのアプローチは、計画中のテスト駆動の行動ガイダンスの欠如と、再利用中のリポジトリコードに埋め込まれた実装ロジックの見落としという2つの制限に悩まされることが多い。
その結果、生成された計画は期待された振る舞いと一致せず、検索された関数は効果的に再利用されない。
本稿では,新しいリポジトリレベルのコード生成フレームワークであるTICoderを提案する。
TICoderは、テストケースを振る舞い仕様として活用して実装手順を洗練する、テスト駆動反復計画メカニズムを導入している。
さらに、TICoderは実装対応のコード再利用戦略を採用しており、機能面と実装面の両方をキャプチャするデュアルビュー類似性を使用して、潜在的な呼び出し関数を検索する。
次に、構造に基づくクラスタリングとパープレキシティに基づくフィルタリングを組み合わせた2段階選択戦略により、関連する利用パターンを同定する。
様々なLSMを用いて広く使われているリポジトリレベルのコード生成ベンチマークについて広範な実験を行った。
実験の結果,TICoderは最先端(SOTA)法より優れ,平均11.52%の改善が得られた。
関連論文リスト
- Understanding by Reconstruction: Reversing the Software Development Process for LLM Pretraining [66.89012795621349]
大規模言語モデル(LLM)は、複雑なソフトウェア工学に必要な、深く、長期にわたる推論に苦しむことが多い。
本稿では,再構築による理解という,新しいパラダイムを提案する。
マルチエージェントシミュレーションを用いて潜在エージェント軌道を合成するフレームワークを提案する。
論文 参考訳(メタデータ) (2026-03-11T09:23:20Z) - Do Not Treat Code as Natural Language: Implications for Repository-Level Code Generation and Beyond [13.550121154853715]
自然言語ではなく構造化コードとしてコードを扱う,リポジトリレベルのコード生成フレームワークであるHydraを紹介します。
我々はHydraがオープンソースおよびクローズドソースのCodeLLMにまたがって最先端のパフォーマンスを実現することを示す。
論文 参考訳(メタデータ) (2026-02-12T07:44:00Z) - UCRBench: Benchmarking LLMs on Use Case Recovery [42.35653533011503]
ユーザゴールとサブファンクションの両方のユースケースを手作業で検証することで構築されたコード整列型ユースケースベンチマークを導入する。
大規模言語モデル(LLM)の最初の体系的な研究を行い,階層的評価プロトコルを提案する。
その結果,LLMはシステム機能を部分的に再構築できるが,その性能はプロジェクトによって大きく異なることがわかった。
論文 参考訳(メタデータ) (2025-12-15T14:12:57Z) - Enhancing LLM Code Generation: A Systematic Evaluation of Multi-Agent Collaboration and Runtime Debugging for Improved Accuracy, Reliability, and Latency [0.0]
プログラミング活動の異なる構成や訓練パラダイムがコード生成の効率に与える影響について検討する。
私たちの発見は、堅牢なAI駆動型コーディングソリューションを求める組織に貴重な洞察を与えます。
論文 参考訳(メタデータ) (2025-05-04T14:44:27Z) - PERC: Plan-As-Query Example Retrieval for Underrepresented Code Generation [20.105490443135672]
コード生成(PERC)における数ショットプロンプトのためのPlan-as-query例検索
PERCはコード生成における最先端のRAGメソッドよりも一貫して優れている。
論文 参考訳(メタデータ) (2024-12-17T01:23:45Z) - Binary Code Similarity Detection via Graph Contrastive Learning on Intermediate Representations [52.34030226129628]
バイナリコード類似度検出(BCSD)は、脆弱性検出、マルウェア分析、コードの再利用識別など、多くの分野で重要な役割を果たしている。
本稿では,LLVM-IRと高レベルのセマンティック抽象化を利用して,コンパイル差を緩和するIRBinDiffを提案する。
IRBinDiffは1対1の比較と1対多の検索シナリオにおいて,他の主要なBCSD手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2024-10-24T09:09:20Z) - Hierarchical Reinforcement Learning for Temporal Abstraction of Listwise Recommendation [51.06031200728449]
我々はmccHRLと呼ばれる新しいフレームワークを提案し、リストワイドレコメンデーションにおける時間的抽象化のレベルを異なるものにする。
階層的な枠組みの中では、ハイレベルエージェントがユーザ知覚の進化を研究し、低レベルエージェントがアイテム選択ポリシーを作成している。
その結果,本手法による性能改善は,いくつかのよく知られたベースラインと比較して有意な結果が得られた。
論文 参考訳(メタデータ) (2024-09-11T17:01:06Z) - Tractable Offline Learning of Regular Decision Processes [50.11277112628193]
この研究は、正則決定過程(RDP)と呼ばれる非マルコフ環境のクラスにおけるオフライン強化学習(RL)を研究する。
インスは、未来の観測と過去の相互作用からの報酬の未知の依存を実験的に捉えることができる。
多くのアルゴリズムは、まずこの未知の依存関係を自動学習技術を用いて再構築する。
論文 参考訳(メタデータ) (2024-09-04T14:26:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。