論文の概要: LLM-based vs. Search-based Merge Conflict Resolution: An Empirical Study of Competing Paradigms
- arxiv url: http://arxiv.org/abs/2605.16646v1
- Date: Fri, 15 May 2026 21:34:32 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-26 16:54:09.311366
- Title: LLM-based vs. Search-based Merge Conflict Resolution: An Empirical Study of Competing Paradigms
- Title(参考訳): LLM-based vs. Search-based Merge Conflict Resolution: 競合するパラダイムの実証的研究
- Authors: Heleno de Souza Campos Junior, Leonardo Gresta Paulino Murta,
- Abstract要約: 大規模言語モデル(LLM)に基づく生成的アプローチと検索ベースソフトウェア工学(SBSE)からの最適化手法
本稿では,これらのパラダイムを直接比較し,実世界のシナリオにおけるそれらの能力と限界を識別する実験を行った。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Context: The resolution of software merge conflicts is being reshaped by two competing paradigms: generative approaches based on Large Language Models (LLMs) and optimization approaches from Search-Based Software Engineering (SBSE). While tools from both paradigms have shown promise, their relative strengths, weaknesses, and trade-offs are not yet well understood. Objective: This paper presents the first in-depth empirical study directly comparing these paradigms to identify their capabilities and limitations in real-world scenarios. Method: We evaluated MergeGen, a state-of-the-art LLM-based tool, against SBCR, a novel SBSE approach employing a Random Restart Hill Climbing (RRHC) algorithm. The comparison used thousands of real-world conflicts from open-source projects written in Java, C#, JavaScript, and TypeScript. Results: Our findings reveal fundamental trade-offs. The LLM paradigm excels at resolving conflicts with imbalanced content by leveraging learned patterns. However, it struggles with non-English content and large inputs, which can lead to truncated or empty resolutions. Conversely, the SBSE paradigm demonstrates superior generalization across datasets and performs best on balanced conflicts, highlighting its potential as a robust, data-independent alternative. Conclusions: Neither paradigm is a silver bullet. Our findings highlight context-dependent strengths and motivate the development of hybrid systems that combine the complementary capabilities of LLM and SBSE approaches to create more robust and reliable merge conflict resolution tools.
- Abstract(参考訳): コンテキスト: ソフトウェアマージコンフリクトの解決は、LLM(Large Language Models)に基づく生成的アプローチと、検索ベースソフトウェアエンジニアリング(SBSE)による最適化アプローチという、2つの競合するパラダイムによって作り直されています。
両方のパラダイムのツールは約束を示しているが、その相対的な強み、弱点、トレードオフはまだよく理解されていない。
目的:本論文では,これらのパラダイムを直接比較し,実世界のシナリオにおけるそれらの能力と限界を識別する実験を行った。
Method: We evaluate MergeGen, a state-of-the-art LLM-based tools, against SBCR, a novel SBSE approach using Random Restart Hill Climbing (RRHC) algorithm。
この比較では、Java、C#、JavaScript、TypeScriptで書かれたオープンソースプロジェクトと何千もの現実世界の衝突が使用された。
結果: 根本的なトレードオフが明らかとなった。
LLMパラダイムは、学習パターンを活用することで、不均衡なコンテンツとの競合を解決することに長けている。
しかし、それは英語以外のコンテンツや大きな入力に苦しむため、切り詰められたり空の解決に繋がる可能性がある。
逆に、SBSEパラダイムはデータセット間の優れた一般化を示し、バランスの取れた競合に最善を尽くし、堅牢でデータに依存しない代替手段としての可能性を強調している。
結論:どちらのパラダイムも銀の弾丸ではない。
本研究は,LLMとSBSEの相補的な機能を組み合わせて,より堅牢で信頼性の高いコンフリクト解決ツールを開発するハイブリッドシステムの開発を動機付け,文脈依存の強みを強調した。
関連論文リスト
- Rover: Context-aware Conflict Resolution with LLM [10.069365211450997]
特に大規模プロジェクトでは、コードのマージは重要な課題です。
プログラム分析と機械学習を含む既存のソリューションは、将来性を示しているが、重要な制限に直面している。
本稿では,プログラム解析と大規模言語モデルを統合する新たな競合解決システムであるRoverを紹介する。
論文 参考訳(メタデータ) (2026-05-17T06:21:40Z) - Mitigating Context-Memory Conflicts in LLMs through Dynamic Cognitive Reconciliation Decoding [51.242997961841276]
大規模言語モデルは事前学習を通じてパラメトリック知識を蓄積する。
知識の衝突は、時代遅れまたは誤ったパラメトリック知識が文脈における外部知識と衝突する際に起こる。
既存の手法は、対照的な復号化を通じて知識の衝突に対処するが、競合のないシナリオでは静的アプローチが出力分布を妨害する。
本稿では,動的認知和解復号法(DCRD)を提案する。
論文 参考訳(メタデータ) (2026-05-12T14:29:45Z) - That's Deprecated! Understanding, Detecting, and Steering Knowledge Conflicts in Language Models for Code Generation [55.78914774437411]
大規模言語モデル(LLM)は、パラメトリック知識とプロンプトに含まれる矛盾する情報との相違に直面して振る舞う。
このような対立を構築・解釈するためのドメインに依存しないフレームワークを提案する。
本研究では, アクティベーションレベルのステアリングが, ランダムベースライン上でのステアリング成功率を最大12.6%向上させることができることを示す。
論文 参考訳(メタデータ) (2025-10-21T22:27:56Z) - FaithfulRAG: Fact-Level Conflict Modeling for Context-Faithful Retrieval-Augmented Generation [37.28571879699906]
検索システムで強化された大規模言語モデル(LLM)は、知識集約的なタスクを扱う上で大きな可能性を示している。
本稿では,モデルパラメトリック知識と検索コンテキストの相違を明示的にモデル化することにより,知識の対立を解決する新しいフレームワークであるFaithfulRAGを提案する。
論文 参考訳(メタデータ) (2025-06-10T16:02:54Z) - Thinking Longer, Not Larger: Enhancing Software Engineering Agents via Scaling Test-Time Compute [61.00662702026523]
より大規模なモデルではなく、推論時間の増加を活用する統合されたテスト時間計算スケーリングフレームワークを提案する。
当社のフレームワークには,内部TTCと外部TTCの2つの補完戦略が組み込まれている。
当社の textbf32B モデルは,DeepSeek R1 671B や OpenAI o1 など,はるかに大きなモデルを上回る 46% の課題解決率を実現している。
論文 参考訳(メタデータ) (2025-03-31T07:31:32Z) - ECon: On the Detection and Resolution of Evidence Conflicts [56.89209046429291]
大規模言語モデル(LLM)の台頭は意思決定システムにおける情報の質に大きな影響を与えている。
本研究では,実世界の誤情報シナリオをシミュレートするために,多様で検証された証拠衝突を生成する手法を提案する。
論文 参考訳(メタデータ) (2024-10-05T07:41:17Z) - Unraveling Cross-Modality Knowledge Conflicts in Large Vision-Language Models [33.76903352835436]
LVLM(Large Vision-Language Models)は、マルチモーダル入力をキャプチャし、推論する能力を示す。
これらのモデルは、そのビジョンと言語コンポーネント間の表現された知識の不整合から生じるパラメトリックな知識の衝突を招きやすい。
我々は、それらを検出し、解釈し、緩和するための体系的なアプローチを提案する。
論文 参考訳(メタデータ) (2024-10-04T17:59:28Z) - LLaMA-Berry: Pairwise Optimization for O1-like Olympiad-Level Mathematical Reasoning [56.273799410256075]
このフレームワークはMonte Carlo Tree Search (MCTS)と反復的なSelf-Refineを組み合わせて推論パスを最適化する。
このフレームワークは、一般的なベンチマークと高度なベンチマークでテストされており、探索効率と問題解決能力の点で優れた性能を示している。
論文 参考訳(メタデータ) (2024-10-03T18:12:29Z) - CONGRA: Benchmarking Automatic Conflict Resolution [3.9910625211670485]
ConGraは、ソフトウェアマージツールのパフォーマンスを評価するために設計されたベンチマークスキームである。
我々は34の現実世界プロジェクトから44,948のコンフリクトに基づいて大規模な評価データセットを構築した。
論文 参考訳(メタデータ) (2024-09-21T12:21:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。