論文の概要: CodeMapper: A Language-Agnostic Approach to Mapping Code Regions Across Commits
- arxiv url: http://arxiv.org/abs/2511.05205v1
- Date: Fri, 07 Nov 2025 12:50:56 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-10 21:00:44.761577
- Title: CodeMapper: A Language-Agnostic Approach to Mapping Code Regions Across Commits
- Title(参考訳): CodeMapper: コミッタ間のコード領域マッピングのための言語に依存しないアプローチ
- Authors: Huimin Hu, Michael Pradel,
- Abstract要約: 開発者は一般的に、特定のコード領域をコミットから別のコミットにマッピングする問題に直面します。
git diffのような既存のテクニックは、開発者の選択するコード領域にフォーカスするのではなく、ファイルに行われたすべての変更を表示するためだけに、この問題に対処する。
本稿では,特定のプログラム要素やプログラミング言語に依存しない方法で,コードマッピング問題に対処するアプローチであるCodeMapperを紹介する。
- 参考スコア(独自算出の注目度): 14.265317773238529
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: During software evolution, developers commonly face the problem of mapping a specific code region from one commit to another. For example, they may want to determine how the condition of an if-statement, a specific line in a configuration file, or the definition of a function changes. We call this the code mapping problem. Existing techniques, such as git diff, address this problem only insufficiently because they show all changes made to a file instead of focusing on a code region of the developer's choice. Other techniques focus on specific code elements and programming languages (e.g., methods in Java), limiting their applicability. This paper introduces CodeMapper, an approach to address the code mapping problem in a way that is independent of specific program elements and programming languages. Given a code region in one commit, CodeMapper finds the corresponding region in another commit. The approach consists of two phases: (i) computing candidate regions by analyzing diffs, detecting code movements, and searching for specific code fragments, and (ii) selecting the most likely target region by calculating similarities. Our evaluation applies CodeMapper to four datasets, including two new hand-annotated datasets containing code region pairs in ten popular programming languages. CodeMapper correctly identifies the expected target region in 71.0%--94.5% of all cases, improving over the best available baselines by 1.5--58.8 absolute percent points.
- Abstract(参考訳): ソフトウェア進化の間、開発者は一般的に、特定のコード領域をコミットから別のコミットにマッピングするという問題に直面します。
例えば、ifステートメントの条件、設定ファイルの特定の行、関数の定義がどう変わるかを決めたい場合もあります。
これをコードマッピング問題と呼びます。
git diffのような既存のテクニックは、開発者の選択するコード領域にフォーカスするのではなく、ファイルに行われたすべての変更を表示するためだけに、この問題に対処する。
他のテクニックは、特定のコード要素とプログラミング言語(例えば、Javaのメソッド)に焦点を当て、適用性を制限する。
本稿では,特定のプログラム要素やプログラミング言語に依存しない方法で,コードマッピング問題に対処するアプローチであるCodeMapperを紹介する。
あるコミットでコード領域が与えられた場合、CodeMapperは別のコミットで対応するリージョンを見つける。
アプローチは2つのフェーズで構成されます。
一 差分を解析し、符号の動きを検出し、特定符号の断片を検索して、候補領域を演算すること。
二 類似性を計算することにより、最も可能性の高い対象領域を選択すること。
評価では、CodeMapperを4つのデータセットに適用し、その中には10の人気のあるプログラミング言語のコード領域ペアを含む2つの手書きのデータセットが含まれています。
CodeMapperは、すべてのケースの71.0%--94.5%で予測対象領域を正しく識別し、最高のベースラインを1.5-58.8絶対値で改善している。
関連論文リスト
- LocAgent: Graph-Guided LLM Agents for Code Localization [25.395102705800916]
LocAgentは、グラフベースの表現を通じてコードのローカライゼーションに対処するフレームワークである。
細調整したQwen-2.5-Coder-Instruct-32Bモデルを用いて,SOTAプロプライエタリモデルと比較して,コストを大幅に削減した。
論文 参考訳(メタデータ) (2025-03-12T05:55:01Z) - Understanding Code Understandability Improvements in Code Reviews [79.16476505761582]
GitHub上のJavaオープンソースプロジェクトからの2,401のコードレビューコメントを分析した。
改善提案の83.9%が承認され、統合され、1%未満が後に復活した。
論文 参考訳(メタデータ) (2024-10-29T12:21:23Z) - SuperCoder2.0: Technical Report on Exploring the feasibility of LLMs as Autonomous Programmer [0.0]
SuperCoder2.0は、人工知能によるソフトウェア開発を強化するために設計された高度な自律システムである。
システムは、AIネイティブな開発アプローチとインテリジェントエージェントを組み合わせて、完全に自律的なコーディングを可能にする。
論文 参考訳(メタデータ) (2024-09-17T13:44:42Z) - Coeditor: Leveraging Contextual Changes for Multi-round Code Auto-editing [57.776971051512234]
本研究では,複数ラウンドのコードの自動編集設定について検討し,その内部の最近の変更に基づいて,コード領域への編集を予測することを目的とした。
我々のモデルであるCoeditorは、コード編集タスクに特化して設計された微調整言語モデルである。
単純化されたシングルラウンドのシングル編集タスクでは、Coeditor は GPT-3.5 と SOTA のオープンソースコード補完モデルを大幅に上回っている。
論文 参考訳(メタデータ) (2023-05-29T19:57:36Z) - Tackling Long Code Search with Splitting, Encoding, and Aggregating [67.02322603435628]
長いコード検索のための新しいベースラインSEA(Split, Encode, Aggregate)を提案する。
長いコードをコードブロックに分割し、これらのブロックを埋め込みにエンコードし、それらを集約して包括的な長いコード表現を得る。
エンコーダとしてGraphCodeBERTを使用すると、SEAはコードSearchNetベンチマークでGraphCodeBERTよりも10.1%高い0.785という総合的な平均逆ランキングスコアを達成する。
論文 参考訳(メタデータ) (2022-08-24T02:27:30Z) - Code Search based on Context-aware Code Translation [9.346066889885684]
既存のテクニックは、ディープラーニングモデルを利用して、コードスニペットとクエリの埋め込み表現を構築する。
本稿では,コードスニペットを自然言語記述に変換する,文脈認識型コード翻訳手法を提案する。
我々は,1000クエリのCodeSearchNetコーパス上で,TranCSと呼ばれる手法の有効性を評価する。
論文 参考訳(メタデータ) (2022-02-16T12:45:47Z) - Faster Person Re-Identification [68.22203008760269]
本稿では,新しいハッシュコード検索戦略を定式化することによって,高速ReIDのための新しいソリューションを提案する。
より短いコードを使用して、より正確なReIDのいくつかのトップ候補を洗練するために、より広い一致の類似性を粗くランク付けし、より長いコードを使用する。
2つのデータセットに対する実験結果から,提案手法(CtF)は現在のハッシュReID法よりも8%精度が高いだけでなく,5倍高速であることがわかった。
論文 参考訳(メタデータ) (2020-08-16T03:02:49Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。