Fugu-MT 論文翻訳(概要): Merge-Bench: Resolve Merge Conflicts with Large Language Models

論文の概要: Merge-Bench: Resolve Merge Conflicts with Large Language Models

arxiv url: http://arxiv.org/abs/2605.25890v1
Date: Mon, 25 May 2026 14:17:48 GMT
ステータス: 翻訳完了
システム内更新日: 2026-05-26 19:50:20.251582
Title: Merge-Bench: Resolve Merge Conflicts with Large Language Models
Title（参考訳）: Merge-Bench: 大きな言語モデルによるマージ競合を解決する
Authors: Benedikt Schesch, Michael D. Ernst,
Abstract要約: 本稿では,バージョン管理統合の困難かつ重要な課題に対して,機械学習を適用した。私たちは1439のGitHubリポジトリから7938の現実世界のマージコンフリクトハンクのデータセットMerge-Benchを構築しました。 Javaプログラムのマージ競合を解決するために、モデルであるLLMergeJをトレーニングしました。
参考スコア（独自算出の注目度）: 1.8162282886873073
License: http://creativecommons.org/licenses/by/4.0/
Abstract: This paper applies machine learning to the difficult and important task of version control merging. (1) We constructed a dataset, Merge-Bench, of 7938 real-world merge conflict hunks from 1439 GitHub repositories. The ground truth is the merge resolution that developers committed to the repository. Our dataset construction methodology is scalable to arbitrary amounts of data since no manual labeling is required. (2) We trained a model, LLMergeJ, to resolve merge conflicts in Java programs. Our approach uses Group Relative Policy Optimization (GRPO), an online reinforcement learning method, to train a Large Language Model (LLM). (3) We performed two evaluations of the performance of LLMs on resolving merge conflicts. On Java programs, LLMergeJ with 14B parameters outperforms 3 commercial LLMs, trailing only Gemini 2.5 Pro. Across 11 programming languages, commercial LLM performance is largely stable from language to language. The best models correctly resolve less than 60% of merge conflicts.
Abstract（参考訳）: 本稿では,バージョン管理統合の困難かつ重要な課題に対して,機械学習を適用した。 1) 1439のGitHubリポジトリから7938のリアルワールドマージコンフリクトのデータセットであるMerge-Benchを構築した。基本的な真実は、開発者がリポジトリにコミットしたマージ解決である。データセット構築手法は、手動ラベリングを必要としないため、任意の量のデータに対してスケーラブルです。 2) Java プログラムにおけるマージ競合を解決するため,モデル LLMergeJ を訓練した。提案手法は,大規模言語モデル(LLM)を学習するために,オンライン強化学習手法であるGRPO(Group Relative Policy Optimization)を用いている。 (3) 合併紛争の解決に向け, LLMの性能評価を2回行った。 Javaプログラムでは、14Bパラメータを持つLLMergeJが3つの商用LLMより優れており、Gemini 2.5 Proに次いでいる。 11言語にまたがって、商用のLLM性能は言語から言語へ大きく安定している。最良のモデルはマージ競合の60%未満を正しく解決する。

関連論文リスト

LLM-based vs. Search-based Merge Conflict Resolution: An Empirical Study of Competing Paradigms [0.0]
大規模言語モデル(LLM)に基づく生成的アプローチと検索ベースソフトウェア工学(SBSE)からの最適化手法本稿では,これらのパラダイムを直接比較し,実世界のシナリオにおけるそれらの能力と限界を識別する実験を行った。
論文参考訳（メタデータ） (2026-05-15T21:34:32Z)
SWE-Fixer: Training Open-Source LLMs for Effective and Efficient GitHub Issue Resolution [56.9361004704428]
大規模言語モデル(LLM)は、様々な複雑なタスクにまたがる顕著な習熟度を示している。 SWE-Fixerは、GitHubの問題を効果的かつ効率的に解決するために設計された、新しいオープンソースフレームワークである。我々は,SWE-Bench LiteとVerifiedベンチマークに対するアプローチを評価し,オープンソースモデル間の競合性能を実現する。
論文参考訳（メタデータ） (2025-01-09T07:54:24Z)
LLM$\times$MapReduce: Simplified Long-Sequence Processing using Large Language Models [73.13933847198395]
本稿では,文書理解を包括的に行うための分割・対数戦略を利用して,長文処理のための学習自由フレームワークを提案する。提案された LLM$times$MapReduce フレームワークは、ドキュメント全体を LLM が読み取るためにいくつかのチャンクに分割し、中間回答を集約して最終的な出力を生成する。
論文参考訳（メタデータ） (2024-10-12T03:13:44Z)
CONGRA: Benchmarking Automatic Conflict Resolution [3.9910625211670485]
ConGraは、ソフトウェアマージツールのパフォーマンスを評価するために設計されたベンチマークスキームである。我々は34の現実世界プロジェクトから44,948のコンフリクトに基づいて大規模な評価データセットを構築した。
論文参考訳（メタデータ） (2024-09-21T12:21:41Z)
WizardMerge -- Save Us From Merging Without Any Clues [8.21089093466603]
WizardMergeは、Gitのマージ結果を利用して、テキストとLLVM-IRレベルのコードブロック依存を検索する補助ツールです。その結果、WizardMergeは競合の合併コストを減少させ、23.85%の削減を実現している。
論文参考訳（メタデータ） (2024-07-03T05:40:29Z)
LLM-Pruner: On the Structural Pruning of Large Language Models [65.02607075556742]
大規模言語モデル(LLM)は、言語理解と生成において顕著な能力を示している。タスク非依存であり、元のトレーニングデータセットへの依存を最小限に抑えるという2つの制約の範囲内でLLMの圧縮に取り組む。 LLM-Prunerという名前のこの手法は、非臨界結合構造を選択的に除去する構造プルーニングを採用する。
論文参考訳（メタデータ） (2023-05-19T12:10:53Z)
MergeBERT: Program Merge Conflict Resolution via Neural Transformers [11.460182185916704]
マージコンフリクトは、プルリクエストと継続的インテグレーションパイプラインを数時間から数日にわたって停止させる可能性がある。本稿ではトークンレベルの3方向差分とトランスフォーマーモデルに基づく新しいニューラルプログラムマージフレームワークであるMergeBERTを紹介する。我々のモデルは,64～69%のマージ分解能合成を達成し,既存の構造化およびニューラルプログラムマージツールよりも約2倍の性能向上を実現した。
論文参考訳（メタデータ） (2021-08-31T21:37:53Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。