論文の概要: LinkAnchor: An Autonomous LLM-Based Agent for Issue-to-Commit Link Recovery
- arxiv url: http://arxiv.org/abs/2508.12232v1
- Date: Sun, 17 Aug 2025 04:21:44 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-19 14:49:10.626559
- Title: LinkAnchor: An Autonomous LLM-Based Agent for Issue-to-Commit Link Recovery
- Title(参考訳): LinkAnchor: 自動LLMベースのリンクリカバリエージェント
- Authors: Arshia Akhavan, Alireza Hosseinpour, Abbas Heydarnoori, Mehdi Keshani,
- Abstract要約: GitHubの調査によると、問題の42.2%だけがコミットに正しくリンクされている。
提案するLinkAnchorは,プロポーザル・ツー・コミットリンクリカバリ用に設計された,初の自律型LCMエージェントである。
- 参考スコア(独自算出の注目度): 3.1998815025767025
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Issue-to-commit link recovery plays an important role in software traceability and improves project management. However, it remains a challenging task. A study on GitHub shows that only 42.2% of the issues are correctly linked to their commits. This highlights the potential for further development and research in this area. Existing studies have employed various AI/ML-based approaches, and with the recent development of large language models, researchers have leveraged LLMs to tackle this problem. These approaches suffer from two main issues. First, LLMs are constrained by limited context windows and cannot ingest all of the available data sources, such as long commit histories, extensive issue comments, and large code repositories. Second, most methods operate on individual issue-commit pairs; that is, given a single issue-commit pair, they determine whether the commit resolves the issue. This quickly becomes impractical in real-world repositories containing tens of thousands of commits. To address these limitations, we present LinkAnchor, the first autonomous LLM-based agent designed for issue-to-commit link recovery. The lazy-access architecture of LinkAnchor enables the underlying LLM to access the rich context of software, spanning commits, issue comments, and code files, without exceeding the token limit by dynamically retrieving only the most relevant contextual data. Additionally, LinkAnchor is able to automatically pinpoint the target commit rather than exhaustively scoring every possible candidate. Our evaluations show that LinkAnchor outperforms state-of-the-art issue-to-commit link recovery approaches by 60-262% in Hit@1 score across all our case study projects. We also publicly release LinkAnchor as a ready-to-use tool, along with our replication package. LinkAnchor is designed and tested for GitHub and Jira, and is easily extendable to other platforms.
- Abstract(参考訳): ソフトウェアトレーサビリティにおいて,課題間リンクリカバリが重要な役割を担い,プロジェクト管理を改善する。
しかし、これは依然として困難な課題である。
GitHubの調査によると、問題の42.2%だけがコミットに正しくリンクされている。
このことは、この分野におけるさらなる開発と研究の可能性を強調している。
既存の研究では様々なAI/MLベースのアプローチを採用しており、近年の大規模言語モデルの開発では、この問題を解決するためにLLMを活用している。
これらのアプローチは2つの主要な問題に悩まされる。
まず、LLMは制限されたコンテキストウィンドウによって制約され、長いコミット履歴、広範なイシューコメント、大規模なコードリポジトリなど、利用可能なすべてのデータソースを取り込みません。
第二に、ほとんどのメソッドは個々のイシューコミットペアで動作します。
これは、数万のコミットを含む現実世界のリポジトリでは、すぐに非現実的になる。
これらの制約に対処するため、我々は、発行対コミットリンクリカバリ用に設計された最初のLLMベースの自律エージェントであるLinkAnchorを提示する。
LinkAnchorの遅延アクセスアーキテクチャにより、基盤となるLLMは、最も関連するコンテキストデータのみを動的に取得することにより、トークン制限を超えることなく、コミット、コメント、コードファイルにまたがる、ソフトウェアのリッチなコンテキストにアクセスすることができる。
さらにLinkAnchorは、すべての候補を徹底的に評価するのではなく、自動的にターゲットコミットを特定できる。
評価の結果,LinkAnchorはすべてのケーススタディプロジェクトにおいて60~262%のHit@1スコアを達成できた。
また、レプリケーションパッケージとともに、LinkAnchorを使えるツールとして公開しています。
LinkAnchorはGitHubとJira用に設計およびテストされており、他のプラットフォームにも容易に拡張可能である。
関連論文リスト
- Back to the Basics: Rethinking Issue-Commit Linking with LLM-Assisted Retrieval [12.213080309713574]
問題と修正するコミットを結びつけるイシューコミットリンクは、ソフトウェアのメンテナンスに不可欠である。
本稿では,ベクトルデータベースを現代的な情報検索手法として活用したEasyLinkを提案する。
我々の評価では、EasyLinkは平均的なPrecision@1の75.91%を達成し、最先端の技術を4回以上改善している。
論文 参考訳(メタデータ) (2025-07-12T08:42:10Z) - SwingArena: Competitive Programming Arena for Long-context GitHub Issue Solving [90.32201622392137]
We present SwingArena, a competitive evaluation framework for Large Language Models (LLMs)。
従来の静的ベンチマークとは異なり、SwingArenaはLLMをイテレーションとして組み合わせて、テストケースを作成し、継続的インテグレーション(CI)パイプラインを通じてパッチを検証するパッチとレビュアーを生成することで、ソフトウェアのコラボレーションプロセスをモデル化する。
論文 参考訳(メタデータ) (2025-05-29T18:28:02Z) - RepoMaster: Autonomous Exploration and Understanding of GitHub Repositories for Complex Task Solving [9.477917878478188]
RepoMasterは、複雑なタスクを解決するためにGitHubリポジトリを探索、再利用するために設計された、自律的なエージェントフレームワークである。
RepoMasterは関数呼び出しグラフ、モジュール依存グラフ、階層的なコードツリーを構築し、必須コンポーネントを特定する。
新たにリリースしたGitTaskBenchでは、RepoMasterがタスクパス率を24.1%から62.9%に引き上げ、トークン使用率を95%削減しました。
論文 参考訳(メタデータ) (2025-05-27T08:35:05Z) - SWE-Fixer: Training Open-Source LLMs for Effective and Efficient GitHub Issue Resolution [56.9361004704428]
大規模言語モデル(LLM)は、様々な複雑なタスクにまたがる顕著な習熟度を示している。
SWE-Fixerは、GitHubの問題を効果的かつ効率的に解決するために設計された、新しいオープンソースフレームワークである。
我々は,SWE-Bench LiteとVerifiedベンチマークに対するアプローチを評価し,オープンソースモデル間の競合性能を実現する。
論文 参考訳(メタデータ) (2025-01-09T07:54:24Z) - MAGIS: LLM-Based Multi-Agent Framework for GitHub Issue Resolution [47.850418420195304]
大規模言語モデル(LLM)はコード生成において有望であるが、GitHubの問題を解決する上で困難に直面している。
ソフトウェア進化のためにカスタマイズされた4つのエージェントからなる、GitHub Issue Resolution, MAGISのための新しいMulti-Agentフレームワークを提案する。
論文 参考訳(メタデータ) (2024-03-26T17:57:57Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。