論文の概要: Fine-grained Multi-Document Extraction and Generation of Code Change Rationale
- arxiv url: http://arxiv.org/abs/2604.10345v1
- Date: Sat, 11 Apr 2026 20:49:36 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-14 20:13:15.968779
- Title: Fine-grained Multi-Document Extraction and Generation of Code Change Rationale
- Title(参考訳): 微粒化多文書抽出とコード変更規則の生成
- Authors: Mehedi Sun, Antu Saha, Nadeeshan De Silva, Antonio Mastropaolo, Oscar Chaparro,
- Abstract要約: 私たちは、いかに合理的なコンポーネント(例えば、変更の目標、ニーズ、代替品)がアーティファクトに分散されているかを調べます。
LLMベースのアプローチであるARGUSを導入し、コミットのアーティファクトのゴール、ニーズ、代替を表現した文を識別する。
- 参考スコア(独自算出の注目度): 9.038241584076468
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Understanding the reasons behind past code changes is critical for many software engineering tasks, including refactoring and reviewing code, diagnosing bugs, and implementing new features. Unfortunately, locating and reconstructing this rationale can be difficult for developers because the information is often fragmented, inconsistently documented, and scattered across different artifacts such as commit messages, issue reports, and PRs. In this paper, we address this challenge in two steps. First, we conduct an empirical study of 63 commits from five open-source Java projects to analyze how rationale components (e.g., a change's goal, need, and alternative) are distributed across artifacts. We find that the rationale is highly fragmented: commit messages and pull requests primarily capture goals, while needs and alternatives are more often found in issues and PRs. Other components are scarce but found in artifacts other than commit messages. No single artifact type captures all components, underscoring the need for cross-document reasoning and synthesis. Second, we introduce ARGUS, an LLM-based approach that identifies sentences expressing goal, need, and alternative across a commit's artifacts and creates concise rationale summaries to support code comprehension and maintenance tasks. We evaluated ARGUS on the 63 commits and compared its performance against baseline variants. The best-performing version achieved 51.4% precision and 93.2% recall for rationale identification, while producing rationale summaries rated as accurate. A user study with 12 Java developers further showed that these summaries were perceived as useful and helpful for tasks such as code review, documentation, and debugging. Our results highlight the need for multi-document reasoning in capturing rationale and demonstrate the potential of ARGUS to help developers understand and maintain software systems.
- Abstract(参考訳): 過去のコード変更の背後にある理由を理解することは、リファクタリングやコードレビュー、バグの診断、新機能の実装など、多くのソフトウェアエンジニアリングタスクにとって重要である。
残念ながら、情報はしばしば断片化され、一貫性のないドキュメント化され、コミットメッセージ、イシューレポート、PRなど、さまざまなアーティファクトに分散しているため、この根拠の特定と再構築は、開発者にとって難しい場合がある。
本稿では,この課題を2つのステップで解決する。
まず、我々は5つのオープンソースJavaプロジェクトからの63のコミットについて実証的研究を行い、コンポーネント(例えば、変更のゴール、ニーズ、代替品)がどのようにアーティファクトに分散されているかを分析します。
メッセージのコミットとプルリクエストが主に目標を捉えているのに対して、ニーズや代替手段は問題やPRでよく見られます。
他のコンポーネントは少ないが、コミットメッセージ以外のアーティファクトで見つかる。
単一のアーティファクトタイプがすべてのコンポーネントをキャプチャしておらず、クロスドキュメントの推論と合成の必要性が強調されている。
第2に、LDMベースのアプローチであるARGUSを導入し、コミットの成果物全体にわたる目的、ニーズ、代替を表現した文を特定し、簡潔な合理的な要約を作成し、コードの理解とメンテナンスタスクをサポートする。
63コミットに対してARGUSを評価し,その性能をベースライン変種と比較した。
ベストパフォーマンス版は51.4%の精度と93.2%のリコールを達成し、合理的な要約を正確と評価した。
12人のJava開発者によるユーザ調査では、これらの要約がコードレビューやドキュメント、デバッグといったタスクに役立つと認識されていることが示されている。
この結果は,ソフトウェアシステムを理解し維持する上でのARGUSの可能性を実証し,合理性を捉える上でのマルチドキュメント推論の必要性を強調した。
関連論文リスト
- The Value of Effective Pull Request Description [5.518378568494161]
プルベースの開発では、コードコントリビューションはプルリクエスト(PR)として送信され、他の開発者のレビューや承認を受ける。
筆者らは,PR記述書作成ガイドラインの灰色文献レビューを行い,推奨8項目の分類を導出した。
我々は156のプロジェクトと5つのプログラミング言語にまたがる80万のGitHub PRを分析し、これらの要素とコードレビューの結果の関連性を評価した。
論文 参考訳(メタデータ) (2026-02-16T10:15:21Z) - TeaRAG: A Token-Efficient Agentic Retrieval-Augmented Generation Framework [62.66056331998838]
TeaRAGは、検索内容と推論ステップの両方を圧縮できるトークン効率のエージェントRAGフレームワークである。
報奨関数は,過剰な推論ステップをペナルティ化しながら,知識マッチング機構によって知識満足度を評価する。
論文 参考訳(メタデータ) (2025-11-07T16:08:34Z) - Contextual Code Retrieval for Commit Message Generation: A Preliminary Study [18.46986692375691]
コミットメッセージはコミットの主要なコード変更を記述し、ソフトウェアメンテナンスにおいて重要な役割を果たす。
既存のコミットメッセージ生成アプローチでは、コード差分を入力し、短い記述文を出力として生成する、直接マッピングとしてフレーム化するのが一般的である。
原コード差分は、高品質なコミットメッセージを生成するのに必要な完全なコンテキストをキャプチャできないため、コード差分のみに依存することは不十分である、と私たちは主張する。
論文 参考訳(メタデータ) (2025-07-23T16:54:57Z) - SciReplicate-Bench: Benchmarking LLMs in Agent-driven Algorithmic Reproduction from Research Papers [16.80818230868491]
本研究では,最近のNLP論文におけるアルゴリズム記述からコードを生成する際の言語モデル (LLM) を評価する。
厳密な評価を容易にするため、2024年に発行された36のNLP論文から100のタスクのベンチマークであるSciReplicate-Benchを紹介する。
SciReplicate-Bench上に構築されたSci-Reproducerは,論文からアルゴリズムの概念を解釈するPaper Agentと,リポジトリから依存関係を検索してソリューションを実装するCode Agentで構成された,デュアルエージェントフレームワークである。
論文 参考訳(メタデータ) (2025-03-31T22:02:24Z) - Learning Refined Document Representations for Dense Retrieval via Deliberate Thinking [58.69615583599489]
Deliberate Thinking based Retriever (Debater) は、段階的な思考プロセスを導入することで文書表現を強化する新しいアプローチである。
Debaterは、いくつかのベンチマークで既存のメソッドよりも大幅に優れています。
論文 参考訳(メタデータ) (2025-02-18T15:56:34Z) - An Empirical Study on the Impact of Code Duplication-aware Refactoring Practices on Quality Metrics [5.516979718589074]
128のオープンソースJavaプロジェクトから、日々の変更で開発者が適用し、ドキュメント化した332のコミットのコーパスを抽出します。
我々は、これらの操作が共通の最先端の設計品質指標に与える影響を実証的に分析する。
論文 参考訳(メタデータ) (2025-02-06T13:34:25Z) - CodeRAG-Bench: Can Retrieval Augment Code Generation? [78.37076502395699]
検索拡張生成を用いたコード生成の系統的,大規模な解析を行う。
まず、コード生成タスクの3つのカテゴリを含む総合的な評価ベンチマークであるCodeRAG-Benchをキュレートする。
CodeRAG-Bench上のトップパフォーマンスモデルについて、1つまたは複数のソースから検索したコンテキストを提供することにより検討する。
論文 参考訳(メタデータ) (2024-06-20T16:59:52Z) - On The Importance of Reasoning for Context Retrieval in Repository-Level Code Editing [82.96523584351314]
我々は、コンテキスト検索のタスクをリポジトリレベルのコード編集パイプラインの他のコンポーネントと分離する。
我々は、推論が収集された文脈の精度を向上させるのに役立っているが、それでもその十分性を識別する能力は欠如していると結論づける。
論文 参考訳(メタデータ) (2024-06-06T19:44:17Z) - RepoCoder: Repository-Level Code Completion Through Iterative Retrieval
and Generation [96.75695811963242]
RepoCoderはリポジトリレベルのコード補完プロセスを合理化するフレームワークである。
類似性ベースのレトリバーと、事前訓練されたコード言語モデルが組み込まれている。
バニラ検索で拡張されたコード補完アプローチよりも一貫して優れています。
論文 参考訳(メタデータ) (2023-03-22T13:54:46Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。