論文の概要: LastMerge: A language-agnostic structured tool for code integration
- arxiv url: http://arxiv.org/abs/2507.19687v1
- Date: Fri, 25 Jul 2025 21:46:10 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-29 16:23:55.96487
- Title: LastMerge: A language-agnostic structured tool for code integration
- Title(参考訳): LastMerge: コード統合のための言語に依存しない構造化ツール
- Authors: Joao Pedro Duarte, Paulo Borba, Guilherme Cavalcanti,
- Abstract要約: 細いインタフェースで構成できる汎用的な構造化マージツールであるLastMergeを提案する。
2つのJava固有のツールであるjDimeとSpark、そしてそれらの一般的なツールであるLastMergeとMergirafです。
以上の結果から,ジェネリック構造化マージがマージ精度に有意な影響を及ぼす証拠は得られなかった。
- 参考スコア(独自算出の注目度): 1.201626478128059
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Unstructured line-based merge tools are widely used in practice. Structured AST-based merge tools show significantly improved merge accuracy, but are rarely used in practice because they are language specific and costly, consequently not being available for many programming languages. To improve merge accuracy for a wide range of languages, we propose LastMerge, a generic structured merge tool that can be configured through a thin interface that significantly reduces the effort of supporting structured merge. To understand the impact that generic structured merge might have on merge accuracy and performance, we run an experiment with four structured merge tools: two Java specific tools, jDime and Spork, and their generic counterparts, respectively LastMerge and Mergiraf. Using each tool, we replay merge scenarios from a significant dataset, and collect data on runtime, behavioral divergences, and merge accuracy. Our results show no evidence that generic structured merge significantly impacts merge accuracy. Although we observe a difference rate of approximately 10% between the Java specific tools and their generic counterparts, most of the differences stem from implementation details and could be avoided. We find that LastMerge reports 15% fewer false positives than jDime while Mergiraf misses 42% fewer false negatives than Spork. Both generic tools exhibit comparable runtime performance to the state of the art language specific implementations. These results suggest that generic structured merge tools can effectively replace language-specific ones, paving the way for broader adoption of structured merge in industry.
- Abstract(参考訳): 非構造化ラインベースのマージツールは、実際に広く使用されている。
構造化ASTベースのマージツールはマージ精度が大幅に改善されているが、言語に特有でコストがかかるため、多くのプログラミング言語では利用できないため、実際に使用されることは稀である。
幅広い言語におけるマージ精度を向上させるために,我々は,構造化マージをサポートする労力を大幅に削減する,細いインターフェースを通じて構成可能な汎用的な構造化マージツールであるLastMergeを提案する。
汎用的な構造化されたマージがマージの精度とパフォーマンスに与える影響を理解するために、我々は4つの構造化されたマージツール(Java固有のツールであるjDimeとSparkと、LastMergeとMergirafの2つのジェネリックツール)で実験を行った。
各ツールを使用して、重要なデータセットからマージシナリオを再生し、実行時、振る舞いのばらつき、マージ精度に関するデータを収集します。
以上の結果から,ジェネリック構造化マージがマージ精度に有意な影響を及ぼす証拠は得られなかった。
Java固有のツールとそれらのジェネリックツールの約10%の違いを観察するが、ほとんどの違いは実装の詳細に起因するものであり、避けることができる。
LastMergeはjDimeよりも偽陽性が15%少なく、MergirafはSporkよりも偽陰性が42%少ないと報告している。
どちらのジェネリックツールも、最先端の言語固有の実装に匹敵するランタイムパフォーマンスを示している。
これらの結果は、汎用的な構造化マージツールが言語固有のツールを効果的に置き換え、業界における構造化マージの普及の道を開くことを示唆している。
関連論文リスト
- Analyzing and Evaluating the Behavior of Git Diff and Merge [0.0]
Gitの主な機能として、差分がどのように計算されるか、マージの実行にどのように使用されるか、マージによってより複雑な操作が可能になるか、などが挙げられます。
デフォルトのマージ戦略(ort)は、履歴内のコミット数に指数的な時間を必要とするマージをもたらす可能性がある。
マージの2つの辺が同じ位置で異なる行を追加する場合、結果は競合ではなく、任意の順序で両方の変更を含むマージである。
論文 参考訳(メタデータ) (2025-07-16T13:01:03Z) - Evaluation of Version Control Merge Tools [3.1969855247377836]
Gitのようなバージョン管理システムでは、異なる開発者やブランチからの変更を統合する方法が必要になる。
マージツールは変更のクリーンな統合を出力するか、手作業による解決のためにコンフリクトを出力する。
新しいマージツールが提案されているが、まだ互いに評価されていない。
論文 参考訳(メタデータ) (2024-10-13T17:35:14Z) - LLM$\ imes$MapReduce: Simplified Long-Sequence Processing using Large Language Models [73.13933847198395]
本稿では,文書理解を包括的に行うための分割・対数戦略を利用して,長文処理のための学習自由フレームワークを提案する。
提案された LLM$times$MapReduce フレームワークは、ドキュメント全体を LLM が読み取るためにいくつかのチャンクに分割し、中間回答を集約して最終的な出力を生成する。
論文 参考訳(メタデータ) (2024-10-12T03:13:44Z) - Semistructured Merge with Language-Specific Syntactic Separators [1.0999592665107416]
言語固有の構文分離器を用いて解析せずに構造を推論するツールを提案する。
我々のツールは、実際に広く使われている非構造化ツールよりも大幅に改善されている。
論文 参考訳(メタデータ) (2024-07-26T17:40:29Z) - A Novel Refactoring and Semantic Aware Abstract Syntax Tree Differencing Tool and a Benchmark for Evaluating the Accuracy of Diff Tools [2.0625936401496237]
Syntax Tree (AST) diffツールは、ほとんどの開発者が使っている行ベースのdiffツールの制限を克服するために開発された。
上記の制限をすべて解決するRefactoringMinerに基づく新しいAST diffツールを提案する。
当社のツールは,特にコミットにおいて,非互換性ツールに匹敵する実行時間で,大幅な精度の向上とリコールを実現しています。
論文 参考訳(メタデータ) (2024-03-09T15:32:41Z) - Leveraging Code to Improve In-context Learning for Semantic Parsing [48.66031267718704]
In-context Learning (ICL) は、その少数ショットの性質と一般化の改善により、意味解析に魅力的なアプローチである。
我々は,(1)DSLの代わりにPythonなどの汎用プログラミング言語を用いた意味解析におけるICLの有効性を向上し,(2)ドメイン記述を構造化したプロンプトを増強する。
論文 参考訳(メタデータ) (2023-11-16T02:50:06Z) - ControlLLM: Augment Language Models with Tools by Searching on Graphs [97.62758830255002]
我々は,大規模言語モデル(LLM)が実世界のタスクを解くためのマルチモーダルツールを利用できる新しいフレームワークであるControlLLMを提案する。
フレームワークは,(1)複雑なタスクを明確なサブタスクに分割し,入力と出力を適切に定義したサブタスクに分解するtextittask Decomposer,(2)構築済みのツールグラフ上で最適なソリューションパスを探索する textitThoughts-on-Graph(ToG)パラダイム,(3)ソリューションパスを解釈して実行するリッチなツールボックスを備えた textitexecution Engine,の3つの主要なコンポーネントから構成される。
論文 参考訳(メタデータ) (2023-10-26T21:57:21Z) - Do code refactorings influence the merge effort? [80.1936417993664]
複数のコントリビュータがソースコードを並行して変更して,新機能の実装やバグの修正,既存のコードの変更などを行っている。
これらの同時変更は、ソースコードの同じバージョンにマージする必要がある。
研究によると、すべてのマージの試みの10~20%が衝突を起こしており、これはプロセスを完了するために手動開発者の介入を必要とする。
論文 参考訳(メタデータ) (2023-05-10T13:24:59Z) - MergeBERT: Program Merge Conflict Resolution via Neural Transformers [11.460182185916704]
マージコンフリクトは、プルリクエストと継続的インテグレーションパイプラインを数時間から数日にわたって停止させる可能性がある。
本稿ではトークンレベルの3方向差分とトランスフォーマーモデルに基づく新しいニューラルプログラムマージフレームワークであるMergeBERTを紹介する。
我々のモデルは,64~69%のマージ分解能合成を達成し,既存の構造化およびニューラルプログラムマージツールよりも約2倍の性能向上を実現した。
論文 参考訳(メタデータ) (2021-08-31T21:37:53Z) - Multilingual Autoregressive Entity Linking [49.35994386221958]
mGENREはMultilingual Entity Linking問題のためのシーケンス対シーケンスシステムである。
与えられた言語で言及すると、mGENREはターゲットエンティティの名前を左から右へ、トークンごとに予測します。
提案手法の有効性を3つのMELベンチマーク実験を含む広範囲な評価により示す。
論文 参考訳(メタデータ) (2021-03-23T13:25:55Z) - GATE: Graph Attention Transformer Encoder for Cross-lingual Relation and
Event Extraction [107.8262586956778]
言語に依存しない文表現を学習するために、普遍的な依存解析を伴うグラフ畳み込みネットワーク(GCN)を導入する。
GCNは、長い範囲の依存関係を持つ単語をモデル化するのに苦労する。
そこで本研究では,構文的距離の異なる単語間の依存関係を学習するための自己認識機構を提案する。
論文 参考訳(メタデータ) (2020-10-06T20:30:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。