論文の概要: Refactoring-aware Block Tracking in Commit History
- arxiv url: http://arxiv.org/abs/2409.16185v1
- Date: Tue, 24 Sep 2024 15:33:39 GMT
- ステータス: 処理完了
- システム内更新日: 2024-09-26 05:17:23.303736
- Title: Refactoring-aware Block Tracking in Commit History
- Title(参考訳): コミット履歴におけるリファクタリング対応ブロック追跡
- Authors: Mohammed Tayeeb Hasan, Nikolaos Tsantalis, Pouria Alikhanifard,
- Abstract要約: CodeTrackerは、コードブロックのコミット変更履歴を生成できるオラクル対応ツールである。
実験の結果,CodeTrackerはGumTreeベースのベースラインよりも精度が高く,実行時間が速いことがわかった。
- 参考スコア(独自算出の注目度): 1.8352113484137624
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Tracking statements in the commit history of a project is in many cases useful for supporting various software maintenance, comprehension, and evolution tasks. A high level of accuracy can facilitate the adoption of code tracking tools by developers and researchers. To this end, we propose CodeTracker, a refactoring-aware tool that can generate the commit change history for code blocks. To evaluate its accuracy, we created an oracle with the change history of 1,280 code blocks found within 200 methods from 20 popular open-source project repositories. Moreover, we created a baseline based on the current state-of-the-art Abstract Syntax Tree diff tool, namely GumTree 3.0, in order to compare the accuracy and execution time. Our experiments have shown that CodeTracker has a considerably higher precision/recall and faster execution time than the GumTree-based baseline, and can extract the complete change history of a code block with a precision and recall of 99.5% within 3.6 seconds on average.
- Abstract(参考訳): プロジェクトのコミット履歴におけるステートメントの追跡は、多くの場合、様々なソフトウェアのメンテナンス、理解、進化のタスクをサポートするのに役立ちます。
高いレベルの精度は、開発者や研究者によるコード追跡ツールの採用を促進することができる。
この目的のために,コードブロックのコミット変更履歴を生成するリファクタリング対応ツールであるCodeTrackerを提案する。
その正確性を評価するために、20の人気のあるオープンソースプロジェクトリポジトリから200のメソッドで見つかった1,280のコードブロックの変更履歴を持つオラクルを作成しました。
さらに,現在最先端の抽象構文木差分ツールであるGumTree 3.0に基づくベースラインを作成し,精度と実行時間を比較した。
実験の結果、CodeTrackerはGumTreeベースのベースラインよりもはるかに精度が高く、実行時間が速く、コードブロックの完全な変更履歴を、平均3.6秒で99.5%の精度で抽出できることがわかった。
関連論文リスト
- CodeTree: Agent-guided Tree Search for Code Generation with Large Language Models [106.11371409170818]
大規模言語モデル(LLM)は、生成されたコードを自己定義し、自律的に改善する機能を持つエージェントとして機能する。
コード生成プロセスの異なる段階における探索空間を効率的に探索するLLMエージェントのためのフレームワークであるCodeTreeを提案する。
具体的には、異なるコーディング戦略を明示的に探求し、対応するコーディングソリューションを生成し、その後、ソリューションを洗練するために統合されたツリー構造を採用しました。
論文 参考訳(メタデータ) (2024-11-07T00:09:54Z) - Understanding Code Understandability Improvements in Code Reviews [79.16476505761582]
GitHub上のJavaオープンソースプロジェクトからの2,401のコードレビューコメントを分析した。
改善提案の83.9%が承認され、統合され、1%未満が後に復活した。
論文 参考訳(メタデータ) (2024-10-29T12:21:23Z) - ChangeGuard: Validating Code Changes via Pairwise Learning-Guided Execution [16.130469984234956]
ChangeGuardは、学習誘導型実行を使用して、修正された関数の実行動作を比較するアプローチである。
提案手法は,77.1%の精度で,69.5%のリコールで意味的変化を識別する。
論文 参考訳(メタデータ) (2024-10-21T15:13:32Z) - Codev-Bench: How Do LLMs Understand Developer-Centric Code Completion? [60.84912551069379]
Code-Development Benchmark (Codev-Bench)は、細粒度で現実世界、リポジトリレベル、開発者中心の評価フレームワークです。
Codev-Agentは、リポジトリのクローリングを自動化し、実行環境を構築し、既存のユニットテストから動的呼び出しチェーンを抽出し、データ漏洩を避けるために新しいテストサンプルを生成するエージェントベースのシステムである。
論文 参考訳(メタデータ) (2024-10-02T09:11:10Z) - A Novel Refactoring and Semantic Aware Abstract Syntax Tree Differencing Tool and a Benchmark for Evaluating the Accuracy of Diff Tools [2.0625936401496237]
Syntax Tree (AST) diffツールは、ほとんどの開発者が使っている行ベースのdiffツールの制限を克服するために開発された。
上記の制限をすべて解決するRefactoringMinerに基づく新しいAST diffツールを提案する。
当社のツールは,特にコミットにおいて,非互換性ツールに匹敵する実行時間で,大幅な精度の向上とリコールを実現しています。
論文 参考訳(メタデータ) (2024-03-09T15:32:41Z) - Teaching Code LLMs to Use Autocompletion Tools in Repository-Level Code Generation [15.461189659020187]
コード大言語モデル(LLM)は、リポジトリレベルの依存関係に対する認識の欠如により、リポジトリレベルのコード生成の制限に直面します。
ToolGenは、自動補完ツールをコードLLM生成プロセスに統合し、これらの依存関係に対処するアプローチです。
ToolGenは、Trigger InsertionとModel Fine-tuning(Offline)とツール統合コード生成(Online)の2つの主要なフェーズで構成されている。
論文 参考訳(メタデータ) (2024-01-12T06:03:56Z) - Coeditor: Leveraging Contextual Changes for Multi-round Code Auto-editing [57.776971051512234]
本研究では,複数ラウンドのコードの自動編集設定について検討し,その内部の最近の変更に基づいて,コード領域への編集を予測することを目的とした。
我々のモデルであるCoeditorは、コード編集タスクに特化して設計された微調整言語モデルである。
単純化されたシングルラウンドのシングル編集タスクでは、Coeditor は GPT-3.5 と SOTA のオープンソースコード補完モデルを大幅に上回っている。
論文 参考訳(メタデータ) (2023-05-29T19:57:36Z) - RepoCoder: Repository-Level Code Completion Through Iterative Retrieval
and Generation [96.75695811963242]
RepoCoderはリポジトリレベルのコード補完プロセスを合理化するフレームワークである。
類似性ベースのレトリバーと、事前訓練されたコード言語モデルが組み込まれている。
バニラ検索で拡張されたコード補完アプローチよりも一貫して優れています。
論文 参考訳(メタデータ) (2023-03-22T13:54:46Z) - All You Need Is Logs: Improving Code Completion by Learning from
Anonymous IDE Usage Logs [55.606644084003094]
そこで本研究では,IDEのユーザからコンプリート利用ログを収集する手法を提案する。
機械学習ベースのモデルをトレーニングして、完成候補をランク付けします。
評価の結果,過去のユーザ動作ログに基づいてトレーニングした単純なランキングモデルを用いることで,コード補完エクスペリエンスが大幅に向上した。
論文 参考訳(メタデータ) (2022-05-21T23:21:26Z) - Using Source Code Density to Improve the Accuracy of Automatic Commit
Classification into Maintenance Activities [7.53201324244815]
コミットのネットサイズを測るソースコード密度を導入し、自動コミット分類の精度を向上させる方法を示す。
1つのプロジェクトでモデルをトレーニングし、他のプロジェクトに適用するクロスプロジェクトコミット分類では、最大89%の精度と0.82のKappaを達成します。
論文 参考訳(メタデータ) (2020-05-28T11:05:39Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。