Fugu-MT 論文翻訳(概要): HistoryFinder: Advancing Method-Level Source Code History Generation with Accurate Oracles and Enhanced Algorithm

論文の概要: HistoryFinder: Advancing Method-Level Source Code History Generation with Accurate Oracles and Enhanced Algorithm

arxiv url: http://arxiv.org/abs/2507.14716v1
Date: Sat, 19 Jul 2025 18:37:42 GMT
ステータス: 翻訳完了
システム内更新日: 2025-07-22 20:51:32.018003
Title: HistoryFinder: Advancing Method-Level Source Code History Generation with Accurate Oracles and Enhanced Algorithm
Title（参考訳）: HistoryFinder: 正確なOracleと拡張アルゴリズムによるメソッドレベルソースコード履歴生成の改善
Authors: Shahidul Islam, Ashik Aowal, Md Sharif Uddin, Shaiful Chowdhury,
Abstract要約: HistoryFinderは、メソッド変更履歴の正確性と完全性を改善するために設計された新しいメソッド履歴生成ツールである。 CodeShovel、CodeTracker、IntelliJ、Gitベースのベースラインを精度、リコール、F1スコアで一貫して上回る。
参考スコア（独自算出の注目度）: 0.0
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Reconstructing a method's change history efficiently and accurately is critical for many software engineering tasks, including maintenance, refactoring, and comprehension. Despite the availability of method history generation tools such as CodeShovel and CodeTracker, existing evaluations of their effectiveness are limited by inaccuracies in the ground truth oracles used. In this study, we systematically construct two new oracles -- the corrected CodeShovel oracle and a newly developed HistoryFinder oracle -- by combining automated analysis with expert-guided manual validation. We also introduce HistoryFinder, a new method history generation tool designed to improve not only the accuracy and completeness of method change histories but also to offer competitive runtime performance. Through extensive evaluation across 400 methods from 40 open-source repositories, we show that HistoryFinder consistently outperforms CodeShovel, CodeTracker, IntelliJ, and Git-based baselines in terms of precision, recall, and F1 score. Moreover, HistoryFinder achieves competitive runtime performance, offering the lowest mean and median execution times among all the research-based tools. While Git-based tools exhibit the fastest runtimes, this efficiency comes at the cost of significantly lower precision and recall -- leaving HistoryFinder as the best overall choice when both accuracy and efficiency are important. To facilitate adoption, we provide a web interface, CLI, and Java library for flexible usage.
Abstract（参考訳）: メソッドの変更履歴を効率的に正確に再構築することは、メンテナンス、リファクタリング、理解を含む多くのソフトウェアエンジニアリングタスクにとって重要なことです。 CodeShovelやCodeTrackerのようなメソッド履歴生成ツールが利用可能であるにも関わらず、それらの有効性に関する既存の評価は、使用する真理のオラクルの不正確さによって制限されている。本研究では,専門家が指導する手動検証と自動解析を組み合わせることで,修正されたCodeShovelオラクルと新たに開発されたHistoryFinderオラクルという,2つの新しいオラクルを体系的に構築する。また、メソッド変更履歴の正確性と完全性だけでなく、競合するランタイムパフォーマンスを提供するために設計された新しいメソッド履歴生成ツールであるHistoryFinderを紹介します。 40のオープンソースリポジトリから400メソッドにわたる広範な評価を通じて、HistoryFinderは、精度、リコール、F1スコアの点で、CodeShovel、CodeTracker、IntelliJ、Gitベースのベースラインを一貫して上回っていることを示す。さらに、HistoryFinderは競争力のあるランタイムパフォーマンスを実現し、すべてのリサーチベースのツールの中で、最低平均と中央値の実行時間を提供します。 Gitベースのツールは、最速のランタイムを示すが、この効率性は、精度とリコールを大幅に低下させるコストが伴う。採用を容易にするため、フレキシブルな使用のためのWebインターフェース、CLI、Javaライブラリを提供しています。

関連論文リスト

HiconAgent: History Context-aware Policy Optimization for GUI Agents [44.7305249511765]
完全な履歴の使用は、過剰な計算オーバーヘッドと、無関係な情報への注意を喚起します。ヒコンアジェント(HiconAgent)は、ヒストリー・コンテクスト・アウェア・ポリシー・オプティマイゼーションで訓練されたGUIエージェントである。メインストリームのGUIナビゲーションベンチマークの実験は、強力なパフォーマンスを示している。
論文参考訳（メタデータ） (2025-12-01T15:06:45Z)
Alignment with Fill-In-the-Middle for Enhancing Code Generation [56.791415642365415]
コードスニペットを小さな粒度のブロックに分割し,同じテストケースからより多様なDPOペアを生成する手法を提案する。提案手法は,HumanEval (+), MBPP (+), APPS, LiveCodeBench, BigCodeBenchといったベンチマークデータセットの実験によって検証された,コード生成タスクの大幅な改善を示す。
論文参考訳（メタデータ） (2025-08-27T03:15:53Z)
Let's Revise Step-by-Step: A Unified Local Search Framework for Code Generation with LLMs [16.818072348542923]
本稿では,ステップバイステップのコード修正を効果的に行う統一的なローカル検索フレームワークを提案する。具体的には、ReLocは4つの主要なアルゴリズムコンポーネントを通して、一連のローカルリビジョンを探索する。そこで我々は,修正距離に基づいてコード品質を評価できる特化リビジョン報酬モデルを構築し,微粒な選好を生成する。
論文参考訳（メタデータ） (2025-08-10T17:11:56Z)
Log-Augmented Generation: Scaling Test-Time Reasoning with Reusable Computation [80.69067017594709]
大規模言語モデル(LLM)とそのエージェントモデルは、以前のタスクからの推論を維持するのに苦労する。本稿では,従来の計算を直接再利用し,テスト時に過去のログから推論する新しいフレームワークであるLAGを提案する。本手法は,ログを使用しない標準的なエージェントシステムよりも優れている。
論文参考訳（メタデータ） (2025-05-20T14:14:38Z)
Automated Generation of Commit Messages in Software Repositories [0.7366405857677226]
コミットメッセージはソフトウェア変更の文書化に不可欠であり、プログラムの理解とメンテナンスを支援する。機械学習(ML)と自然言語処理(NLP)を用いたコミットメッセージの自動生成手法を提案する。コード変更とそれに対応するコミットメッセージのデータセットをLiuらによって使用しました。
論文参考訳（メタデータ） (2025-04-17T15:08:05Z)
HAFix: History-Augmented Large Language Models for Bug Fixing [14.593589983869135]
バグ修正におけるヒストリ拡張LDMを表すHAFixを提案する。 11のオープンソースプロジェクトからソースを得た51の単一行バグのデータセットにCode Llamaを採用し、バグの歴史的コンテキストデータをマイニングしています。評価の結果,歴史的Llamasはバグ修正性能を著しく向上させることがわかった。
論文参考訳（メタデータ） (2025-01-15T20:39:32Z)
SECRET: Towards Scalable and Efficient Code Retrieval via Segmented Deep Hashing [83.35231185111464]
ディープラーニングは、検索パラダイムを語彙ベースのマッチングから、ソースコードとクエリをベクトル表現にエンコードした。従来の研究では、クエリやコードスニペットのハッシュコードを生成し、ハミング距離を使ってコード候補を高速にリコールするディープハッシュベースの手法が提案されている。提案手法は,既存の深層ハッシュ法によって計算された長いハッシュコードを,反復的学習戦略により複数の短いハッシュコードセグメントに変換する手法である。
論文参考訳（メタデータ） (2024-12-16T12:51:35Z)
CodeXEmbed: A Generalist Embedding Model Family for Multiligual and Multi-task Code Retrieval [103.116634967815]
CodeXEmbedは400Mから7Bパラメータの大規模なコード埋め込みモデルのファミリーである。我々の新しいトレーニングパイプラインは、複数のプログラミング言語を統合し、様々なコード関連タスクを共通の検索フレームワークに変換する。私たちの7Bモデルは、コード検索において新しい最先端(SOTA)を設定し、以前の主要なモデルであるVoyage-CodeをCoIRベンチマークで20%以上上回っています。
論文参考訳（メタデータ） (2024-11-19T16:54:45Z)
Refactoring-aware Block Tracking in Commit History [1.8352113484137624]
CodeTrackerは、コードブロックのコミット変更履歴を生成できるオラクル対応ツールである。実験の結果,CodeTrackerはGumTreeベースのベースラインよりも精度が高く,実行時間が速いことがわかった。
論文参考訳（メタデータ） (2024-09-24T15:33:39Z)
P-RAG: Progressive Retrieval Augmented Generation For Planning on Embodied Everyday Task [94.08478298711789]
Embodied Everyday Taskは、インボディードAIコミュニティで人気のあるタスクである。自然言語命令は明示的なタスクプランニングを欠くことが多い。タスク環境に関する知識をモデルに組み込むには、広範囲なトレーニングが必要である。
論文参考訳（メタデータ） (2024-09-17T15:29:34Z)
Efficient and Scalable Estimation of Tool Representations in Vector Space [34.767193045989515]
ツール検索のための合成データを生成するためのフレームワークと,小型エンコーダモデルを用いた効率的なデータ駆動型ツール検索戦略を提案する。 ToolBankは、実際のユーザ利用を反映した、新しいツール検索データセットです。これらの新しい方法により、ToolBenchデータセット上のRecall@Kで最大27.28、ToolBank上のRecall@Kで30.5の改善を実現しています。
論文参考訳（メタデータ） (2024-09-02T19:39:24Z)
DiscoveryBench: Towards Data-Driven Discovery with Large Language Models [50.36636396660163]
我々は、データ駆動探索の多段階プロセスを形式化する最初の包括的なベンチマークであるDiscoveryBenchを紹介する。我々のベンチマークには、社会学や工学などの6つの分野にまたがる264のタスクが含まれている。私たちのベンチマークでは、自律的なデータ駆動型発見の課題を説明し、コミュニティが前進するための貴重なリソースとして役立ちます。
論文参考訳（メタデータ） (2024-07-01T18:58:22Z)
Exploring Data-Efficient Adaptation of Large Language Models for Code Generation [64.5583894165813]
コード生成のための誤り駆動学習を用いたデータ効率向上のための新しい適応手法DEEDを提案する。実験により、他の主流の微調整手法と比較して、DEEDは訓練データが少なく、優れた性能を発揮することが示された。
論文参考訳（メタデータ） (2024-02-29T16:09:02Z)
EVOR: Evolving Retrieval for Code Generation [17.46870626157077]
検索拡張コード生成のための既存のパイプラインは、単一のソースを持つ静的ナレッジベースを使用している。我々は,クエリと多様な知識ベースを同期的に進化させる新しいパイプラインEVORを開発した。
論文参考訳（メタデータ） (2024-02-19T17:37:28Z)
ML-Bench: Evaluating Large Language Models and Agents for Machine Learning Tasks on Repository-Level Code [76.84199699772903]
ML-Benchは、既存のコードリポジトリを利用してタスクを実行する現実世界のプログラミングアプリケーションに根ざしたベンチマークである。 LLM(Large Language Model)とAIエージェントの両方を評価するために、事前に定義されたデプロイメント環境でLLMのテキスト-コード変換を評価するML-LLM-Benchと、Linuxサンドボックス環境でエンドツーエンドのタスク実行で自律エージェントをテストするML-Agent-Benchの2つの設定が採用されている。
論文参考訳（メタデータ） (2023-11-16T12:03:21Z)
HIPTrack: Visual Tracking with Historical Prompts [37.85656595341516]
シームズパラダイムに忠実かつ更新された履歴情報を追従するトラッカーを提供することにより,大幅な性能向上が達成できることを示す。我々は,履歴プロンプトネットワークに基づくHIPTrackと呼ばれる新しいトラッカーを構築し,モデル全体を再トレーニングすることなく,大幅な性能向上を実現した。
論文参考訳（メタデータ） (2023-11-03T17:54:59Z)
Autoregressive Search Engines: Generating Substrings as Document Identifiers [53.0729058170278]
自動回帰言語モデルは、回答を生成するデファクト標準として現れています。これまでの研究は、探索空間を階層構造に分割する方法を探究してきた。本研究では,検索空間の任意の構造を強制しない代替として,経路内のすべてのngramを識別子として使用することを提案する。
論文参考訳（メタデータ） (2022-04-22T10:45:01Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。