論文の概要: A Universal Textual Merge Strategy Based on Tokens for Version Control Systems
- arxiv url: http://arxiv.org/abs/2604.13813v1
- Date: Wed, 15 Apr 2026 12:48:01 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-16 20:38:32.538721
- Title: A Universal Textual Merge Strategy Based on Tokens for Version Control Systems
- Title(参考訳): バージョン管理システムのためのトークンに基づくユニバーサルテキストマージ戦略
- Authors: Qiqi Jason Gu, Mikoláš Janota,
- Abstract要約: マージはGitのようなバージョン管理システムの中核的な操作であるが、従来のラインベースのアルゴリズムは、しばしば急激な衝突を引き起こす。
文書形式に依存しない新しいトークンベースのマージアルゴリズムであるSummerを提示する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Merging is a core operation in version control systems such as Git, but traditional line-based algorithms often yield spurious conflicts, particularly in the presence of refactorings or parallel edits. While syntax- and semantics-aware merging approaches can reduce conflicts, they introduce drawbacks such as loss of formatting, dependence on language-specific parsers, and limited flexibility across heterogeneous artifacts. To address this gap, we present Summer, a novel textual token-based merge algorithm independent of document formats. Dividing text into tokens, our approach formulates token-level changes in one branch into string-rewriting rules and move rules, and applies these rules to the text of the other branch to construct a merge. Despite being independent on programming languages, our move rules model extracting and inlining functions. We evaluated Summer on ConflictBench, a large benchmark of real-world merge scenarios, comparing it with five pioneering merge tools across Java and non-Java files. Experimental results show that Summer achieved the highest 36% accuracy in reproducing merges verbatim identical to developers', and ranked second in semantic accuracy.
- Abstract(参考訳): マージはGitのようなバージョン管理システムの中核的な操作であるが、伝統的な行ベースのアルゴリズムは、特にリファクタリングや並列編集の存在において、重大な衝突を引き起こすことが多い。
構文とセマンティックスを意識したマージアプローチは競合を減らすことができるが、フォーマットの喪失、言語固有のパーサへの依存、異種アーティファクト間の柔軟性の制限といった欠点を導入する。
このギャップに対処するため、文書形式に依存しない新しいテキストトークンベースのマージアルゴリズムであるSummerを提示する。
トークンにテキストを分割することで、ひとつのブランチのトークンレベルの変更を文字列書き換えルールに定式化し、他のブランチのテキストにこれらのルールを適用してマージを構築する。
プログラミング言語に依存しないにもかかわらず、我々の移動規則は関数の抽出とインライン化をモデル化する。
私たちはSummer on ConflictBenchを実世界のマージシナリオの大規模なベンチマークとして評価し、Javaと非Javaファイルの5つの先駆的なマージツールと比較しました。
実験結果から,サマーは開発者と同一のマージ音の再現において最高36%の精度を達成し,意味的精度では第2位であった。
関連論文リスト
- Utilizing Metadata for Better Retrieval-Augmented Generation [10.865886799087782]
本稿ではメタデータを意識した検索手法の体系的研究を行う。
平文のベースラインとメタデータを直接埋め込むアプローチを比較します。
プレフィックスと統合埋め込みは、平文ベースラインを一貫して上回ります。
論文 参考訳(メタデータ) (2026-01-17T01:11:03Z) - Analyzing and Evaluating the Behavior of Git Diff and Merge [0.0]
Gitの主な機能として、差分がどのように計算されるか、マージの実行にどのように使用されるか、マージによってより複雑な操作が可能になるか、などが挙げられます。
デフォルトのマージ戦略(ort)は、履歴内のコミット数に指数的な時間を必要とするマージをもたらす可能性がある。
マージの2つの辺が同じ位置で異なる行を追加する場合、結果は競合ではなく、任意の順序で両方の変更を含むマージである。
論文 参考訳(メタデータ) (2025-07-16T13:01:03Z) - The Medium Is Not the Message: Deconfounding Document Embeddings via Linear Concept Erasure [98.71456610527598]
埋め込みベースの類似度メトリクスは、テキストのソースや言語のような刺激的な属性に影響される可能性がある。
本稿では,エンコーダ表現から観測された共同創設者に関する情報を除去するデバイアスアルゴリズムにより,これらのバイアスを最小の計算コストで大幅に低減することを示す。
論文 参考訳(メタデータ) (2025-07-01T23:17:12Z) - Localizing Factual Inconsistencies in Attributable Text Generation [74.11403803488643]
本稿では,帰属可能なテキスト生成における事実の不整合をローカライズするための新しい形式であるQASemConsistencyを紹介する。
QASemConsistencyは、人間の判断とよく相関する事実整合性スコアを得られることを示す。
論文 参考訳(メタデータ) (2024-10-09T22:53:48Z) - Text Editing as Imitation Game [33.418628166176234]
動作クローンを用いた模倣ゲームとしてテキスト編集を再構成する。
我々は、アクショントークン間の依存関係を保持しながら、デコーディングを並列化するデュアルデコーダ構造を導入する。
私たちのモデルは、パフォーマンス、効率、堅牢性の点で、自己回帰ベースラインを一貫して上回ります。
論文 参考訳(メタデータ) (2022-10-21T22:07:04Z) - Hierarchical Context Tagging for Utterance Rewriting [51.251400047377324]
配列を線形に生成するのではなくタグ付けする方法は、ドメイン内および外部の書き直し設定においてより強力であることが証明されている。
本稿では,スロット付きルールを予測してこの問題を緩和する階層型コンテキストタグを提案する。
いくつかのベンチマーク実験により、HCTは2つのBLEUポイントで最先端の書き換えシステムより優れていることが示された。
論文 参考訳(メタデータ) (2022-06-22T17:09:34Z) - MergeBERT: Program Merge Conflict Resolution via Neural Transformers [11.460182185916704]
マージコンフリクトは、プルリクエストと継続的インテグレーションパイプラインを数時間から数日にわたって停止させる可能性がある。
本稿ではトークンレベルの3方向差分とトランスフォーマーモデルに基づく新しいニューラルプログラムマージフレームワークであるMergeBERTを紹介する。
我々のモデルは,64~69%のマージ分解能合成を達成し,既存の構造化およびニューラルプログラムマージツールよりも約2倍の性能向上を実現した。
論文 参考訳(メタデータ) (2021-08-31T21:37:53Z) - Logic Constrained Pointer Networks for Interpretable Textual Similarity [11.142649867439406]
本稿では, セシネルゲーティング機能を備えた新しいポインターネットワークモデルを導入し, 構成チャンクを整列させる。
両文の相違を等しく補償し、アライメントが双方向であることを保証するために、損失関数によるこのベースモデルを改善する。
このモデルは、チャンクアライメントタスクのためのベンチマークSemEvalデータセットにおいて、97.73と96.32のF1スコアを達成する。
論文 参考訳(メタデータ) (2020-07-15T13:01:44Z) - Extractive Summarization as Text Matching [123.09816729675838]
本稿では,ニューラル抽出要約システムの構築方法に関するパラダイムシフトを作成する。
抽出した要約タスクを意味テキストマッチング問題として定式化する。
我々はCNN/DailyMailの最先端抽出結果を新しいレベル(ROUGE-1の44.41)に推し進めた。
論文 参考訳(メタデータ) (2020-04-19T08:27:57Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。